FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4151, 1058 aa 1>>>pF1KB4151 1058 - 1058 aa - 1058 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8823+/-0.00104; mu= 18.8313+/- 0.063 mean_var=74.6021+/-14.841, 0's: 0 Z-trim(104.3): 30 B-trim: 0 in 0/50 Lambda= 0.148490 statistics sampled from 7815 (7833) to 7815 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.605), E-opt: 0.2 (0.241), width: 16 Scan time: 4.640 The best scores are: opt bits E(32554) CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058) 7085 1528.0 0 CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012) 2975 647.5 4.3e-185 CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052) 2606 568.4 2.8e-161 CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 ( 640) 445 105.4 4.1e-22 CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 ( 266) 363 87.7 3.7e-17 CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 ( 299) 363 87.7 4.1e-17 CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 ( 346) 363 87.7 4.6e-17 >>CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058 aa) initn: 7085 init1: 7085 opt: 7085 Z-score: 8194.7 bits: 1528.0 E(32554): 0 Smith-Waterman score: 7085; 100.0% identity (100.0% similar) in 1058 aa overlap (1-1058:1-1058) 10 20 30 40 50 60 pF1KB4 MSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 VLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLRE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 EDIGKNRAEVSQPRLAELNSYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EDIGKNRAEVSQPRLAELNSYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 NRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 GFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 ISFKSLVASLAEPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ISFKSLVASLAEPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 LAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 MQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 CELLKNFAMIGLGCGEGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CELLKNFAMIGLGCGEGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 PHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 LGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPA 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB4 ENVNQYLTDPKFVERTLRLAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ENVNQYLTDPKFVERTLRLAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB4 NIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB4 SQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB4 GFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB4 VVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEV 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB4 QGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 QGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVS 970 980 990 1000 1010 1020 1030 1040 1050 pF1KB4 RVSKRKLGRHVRALVLELCCNDESGEDVEVPYVRYTIR :::::::::::::::::::::::::::::::::::::: CCDS14 RVSKRKLGRHVRALVLELCCNDESGEDVEVPYVRYTIR 1030 1040 1050 >>CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012 aa) initn: 2595 init1: 670 opt: 2975 Z-score: 3436.6 bits: 647.5 E(32554): 4.3e-185 Smith-Waterman score: 2977; 46.7% identity (72.7% similar) in 1019 aa overlap (50-1057:10-1012) 20 30 40 50 60 70 pF1KB4 GSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSSVLVSG .:: :::::::::: ::.:.: . ::::: CCDS28 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSG 10 20 30 80 90 100 110 120 130 pF1KB4 LRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELN :.:::.:.:::..: :: ..:::: . :.::..:: : :.:. ..:::.:: ::.:: CCDS28 LQGLGAEVAKNLVLMGVGSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLN 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB4 SYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLF : :...:: ..::.: ::::::: . ::.::.:: .::..:. ...:::::: :::: CCDS28 RAVQVVVHTGDITEDLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLF 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB4 CDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEAR-HGFESGDFVSFSEVQGMVE :::::.. . : . .::.: .. ... .::..: : : :..::.:.:: ..:::: CCDS28 CDFGEDFTVQDPTEAEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVE 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB4 LNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVT :: .: :.: .. : ::..:: :.::: ...:: :: . ::: ..: .: :. CCDS28 LNDCDPRSIHVREDGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQ 220 230 240 250 260 270 320 330 340 350 360 370 pF1KB4 DFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNA--RALPAVQQN . . . :: .: :::.: :::::.: . :: .:.::. .. :. .. CCDS28 SSQEVHHAHCLHQAFCALHKFQHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEE 280 290 300 310 320 330 380 390 400 410 420 430 pF1KB4 NLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDALECLPEDK ::: :.: .: .:: :.:. :..:..:::::.:: : ::::. ::::::::.::::: CCDS28 PLDEALVRTVALSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDG 340 350 360 370 380 390 440 450 460 470 480 490 pF1KB4 EVL-TEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCG :.: . . : : .:::::.::::. .:::: .:.:.::::::::::::: ::..::: : CCDS28 ELLPSPEDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAG 400 410 420 430 440 450 500 510 520 530 540 550 pF1KB4 EGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPD ..: . :.::: ::.:::.:::::: :: . :...::::.: .:: ..: . : CCDS28 NSGGLTVVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPT 460 470 480 490 500 510 560 570 580 590 600 610 pF1KB4 TERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGNVQVVIPFLT ::.:: :.::. .:::: :::. .:: :. ::..: :::::.:: :: :.. : .: .: CCDS28 TEHIYGDNFFSRVDGVAAALDSFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVT 520 530 540 550 560 570 620 630 640 650 660 pF1KB4 ESY------SSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTD :.: ..:.: : :.::.. ::.. :::::::: ::: ::. ::..:.. CCDS28 EAYRAPASAAASEDAP---YPVCTVRYFPSTAEHTLQWARHEFEELFRLSAETINHH--- 580 590 600 610 620 630 670 680 690 700 710 720 pF1KB4 PKFVERTLR-LAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHN . .. .: . : : .:. : : . :::.: :::.:: ::. . .:.:::.. CCDS28 -QQAHTSLADMDEPQTLTLLKPVLGVLRV-RPQNWQDCVAWALGHWKLCFHYGIKQLLRH 640 650 660 670 680 690 730 740 750 760 770 780 pF1KB4 FPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTGSQDRAAVA :::... .:.:::::::.::.:: ::.:. :: ::.:::::.:: .:: :::: .:. CCDS28 FPPNKVLEDGTPFWSGPKQCPQPLEFDTNQDTHLLYVLAAANLYAQMHGLPGSQDWTALR 700 710 720 730 740 750 790 800 810 820 830 840 pF1KB4 TFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPID .:. .:. :.. . : .:. :: ::.: . .::. .: . : .: :. CCDS28 ELLK--LLPQPDPQQMAPIFASNLELASASAEFGPEQQKELNKALEVWSVGPPLK--PLM 760 770 780 790 800 850 860 870 880 890 900 pF1KB4 FEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLE ::::::::::.::.:::..:: .:: :: ..: .:: :.:.::::::::::::.::. :: CCDS28 FEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRAQSKRIVGQIIPAIATTTAAVAGLLGLE 810 820 830 840 850 860 910 920 930 940 950 960 pF1KB4 LYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEVQGLQPNGE :::::.: : .......:.:: .. :.: . ... .:: :::..: . :: CCDS28 LYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFAPAIQTFHHLKWTSWDRLKVPAGQP--- 870 880 890 900 910 920 970 980 990 1000 1010 1020 pF1KB4 EMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLG : ::...: ... .: :.. .: .: ..::. : ..: .::.:.... . . CCDS28 ERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSPEKQAQHLPLRVTELVQQLTGQAPA 930 940 950 960 970 980 1030 1040 1050 pF1KB4 RHVRALVLELCCNDESGEDVEVPYVRYTIR :.::::: :. .. ::. : ..: . CCDS28 PGQRVLVLELSCEGDD-EDTAFPPLHYEL 990 1000 1010 >>CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052 aa) initn: 2189 init1: 950 opt: 2606 Z-score: 3009.1 bits: 568.4 E(32554): 2.8e-161 Smith-Waterman score: 2606; 42.7% identity (71.1% similar) in 1030 aa overlap (49-1055:38-1045) 20 30 40 50 60 70 pF1KB4 PGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSSVLVS .::..::::: :::: ::... : :..: CCDS35 AAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHVFLS 10 20 30 40 50 60 80 90 100 110 120 130 pF1KB4 GLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDI--GKNRAEVSQPRLA :. :::.:::::..:.:.::::.:: : ::...:.: :.:. .::::. ..: CCDS35 GMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAEAVLKHIA 70 80 90 100 110 120 140 150 160 170 180 190 pF1KB4 ELNSYVPVTAYTGPLVE----DFLSGFQVVVLTNTPLEDQLRVGEFCHNR--GIKLVVAD ::: :: ::. . :. : .::. .: ::::. : : ....::... ::.. :: CCDS35 ELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIKFISAD 130 140 150 160 170 180 200 210 220 230 240 250 pF1KB4 TRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSF ..:....::::::.:. . :..::.: ..: .:. :::.::::.. : .:.:.:..: CCDS35 VHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLENHPHKLETGQFLTF 190 200 210 220 230 240 260 270 280 290 300 310 pF1KB4 SEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASL :..::. :::. ..: :..:..::: ::... :..:::. :::.:: . :.:: .: CCDS35 REINGMTGLNGSI-QQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFESLERQL 250 260 270 280 290 300 320 330 340 350 360 370 pF1KB4 AEPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARAL .: ...::.. : ..: .. :: :: ...: : ..:. ::. :: ... ..: CCDS35 KHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATSIS-ETL 310 320 330 340 350 360 380 390 400 410 420 430 pF1KB4 PAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDALE .. ... :... :...: : :.:. : .::.:.:::.:: .::: :. ::::..: . CCDS35 E--EKPDVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQWLYLEAAD 370 380 390 400 410 420 440 450 460 470 480 pF1KB4 CLPEDKEVLTEDKC---LQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNF . : : . .: : : .:::. : .:. : .:: . . :::: ::::::.:::: CCDS35 IV----ESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEMLKNF 430 440 450 460 470 490 500 510 520 530 540 pF1KB4 AMIGLGCG-EGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVT :..:.: . : : : ::: : :::::::::::::: . : :: ::: :. ..: .:.. CCDS35 ALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINSQIKID 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB4 SHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGN .: :.: : :: ::.:.:. . : . .:::::.:: :.: ::. .:::.:::.::::. CCDS35 AHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGTMGTKGH 540 550 560 570 580 590 610 620 630 640 650 660 pF1KB4 VQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQY ..:..: :::::.: .::::. ::.::::.:: :::::.:::::.::. :.. :.. CCDS35 TEVIVPHLTESYNSHRDPPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKPSLFNKF 600 610 620 630 640 650 670 680 690 700 710 720 pF1KB4 LTDPKFVERTL-RLAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQL . .:..: .. . . :: : . :. .::..:..:: : ... .... :: CCDS35 WQTYSSAEEVLQKIQSGHSLEGCFQVIK-LLSRRPRNWSQCVELARLKFEKYFNHKALQL 660 670 680 690 700 710 730 740 750 760 770 780 pF1KB4 LHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLT-GSQDR :: :: : ..:. ::..::: : :. ::.:.::::.... ::.:.: .: . . .: CCDS35 LHCFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYCIPFAEEDL 720 730 740 750 760 770 790 800 810 820 830 pF1KB4 AAVATF--LQSVQVPEFTPKSGVKIHVSDQELQSAN---ASVDDSR---LEELKATLPSP .: : . :. :.. :: :.. :. .:. .. . : .: : .. :: : . CCDS35 SADALLNILSEVKIQEFKPSN--KVVQTDETARKPDHVPISSEDERNAIFQLEKAILSNE 780 790 800 810 820 830 840 850 860 870 880 890 pF1KB4 DKLPGFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIAT ..: ..:::::: : :.:::.:::::::. :.: ::: :.: ::::::::::: CCDS35 ATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKIIPAIAT 840 850 860 870 880 890 900 910 920 930 940 950 pF1KB4 TTAAVVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQ-EWTLW :::.: ::: ::. ::. :. ...::: :::::.:. :.: . . . : .:.: CCDS35 TTATVSGLVALEMIKVTGGY-PFEAYKNCFLNLAIPIVVFTETTEVRKTKIRNGISFTIW 900 910 920 930 940 950 960 970 980 990 1000 1010 pF1KB4 DRFEVQGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPM ::. :.: :..:: .:.. : .. .: ::. :::.::: ::. .:: : CCDS35 DRWTVHG----KEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVMPGH--AKRLKLTM 960 970 980 990 1000 1020 1030 1040 1050 pF1KB4 TEIVSRVSKRKLGRHVRALVLELCCNDESGEDVEVPYVRYTIR ..:. ....: .: :.. . . .. ::. : ::: CCDS35 HKLVKPTTEKK---YVD-LTVSFAPDIDGDEDLPGPPVRYYFSHDTD 1010 1020 1030 1040 1050 >>CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 (640 aa) initn: 484 init1: 235 opt: 445 Z-score: 510.5 bits: 105.4 E(32554): 4.1e-22 Smith-Waterman score: 585; 31.6% identity (58.8% similar) in 478 aa overlap (461-928:10-419) 440 450 460 470 480 490 pF1KB4 CLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMI .: : .. . ..::::.::::::::... CCDS12 MALSRGLPRELAEAVAGGRVLVVGAGGIGCELLKNLVLT 10 20 30 500 510 520 530 540 550 pF1KB4 GLGCGEGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQN :.. .: . :.:::. :::::::::. : . :...: .: :. :. ...... CCDS12 GFS-----HIDLIDLDTIDVSNLNRQFLFQKKHVGRSKAQVAKESVLQFYPKANIVAYHD 40 50 60 70 80 90 560 570 580 590 600 pF1KB4 RV-GPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGNVQV . .:: :. .::... : ::::: :: ...: :. ::.:::: : :.: . CCDS12 SIMNPD----YNVEFFRQFILVMNALDNRAARNHVNRMCLAADVPLIESGTAGYLGQVTT 100 110 120 130 140 150 610 620 630 640 650 660 pF1KB4 VIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTD . .:: : : ....: ::..: :. : . ::. :. :: . :...: .. CCDS12 IKKGVTECYECHPKPTQRTFPGCTIRNTPSEPIHCIVWAKYLFNQLFGE--EDADQEVS- 160 170 180 190 200 670 680 690 700 710 720 pF1KB4 PKFVERTLRLAGTQPLEVLEAVQRSLV----LQRPQT--WADCVTWACHHWHTQ-YSNNI : .:. :. .: :. :: :. ..: .: :: . . . :. ....: CCDS12 P---DRADPEAAWEPTEA-EARARASNEDGDIKRISTKEWAKSTGYDPVKLFTKLFKDDI 210 220 230 240 250 260 730 740 750 760 770 780 pF1KB4 RQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTGSQ : :: :.: : :: : :. ::.. . :: CCDS12 RYLLTM---DKL-------WR--KRKP---------PVPLDWAEVQ------------SQ 270 280 290 790 800 810 820 830 840 pF1KB4 DRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSAN--ASVDDSRLEELKATLPSPDKLP . . :. :. :. :.: ::.. ... : . .. .: :.. : .: CCDS12 GEETNASDQQN------EPQLGLK----DQQVLDVKSYARLFSKSIETLRVHLA--EKGD 300 310 320 330 850 860 870 880 890 900 pF1KB4 GFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAA : .. ..::: : :::...:.::: . ... .: : .::.::::::::.:. CCDS12 GAELI---WDKDDPSA--MDFVTSAANLRMHIFSMNMKSRFDIKSMAGNIIPAIATTNAV 340 350 360 370 380 390 910 920 930 940 950 960 pF1KB4 VVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEV ..::. :: :...: ..:. .. ::: CCDS12 IAGLIVLEGLKILSG--KIDQCRTIFLNKQPNPRKKLLVPCALDPPNPNCYVCASKPEVT 400 410 420 430 440 450 >>CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 (266 aa) initn: 394 init1: 263 opt: 363 Z-score: 421.6 bits: 87.7 E(32554): 3.7e-17 Smith-Waterman score: 363; 36.7% identity (67.6% similar) in 188 aa overlap (45-229:9-192) 20 30 40 50 60 70 pF1KB4 PDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSS :. .. . . :.::. . : ::.:::..: CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASR 10 20 30 80 90 100 110 120 130 pF1KB4 VLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPR ::. ::.:::.:::::.::.:::..:. :. . : ..:: .: ..:.::::.: : CCDS54 VLLVGLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLER 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB4 LAELNSYVPVTAYTGPLV---EDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADT .:: .: : . : . :.:.. :..: :: . ..: ..::. .::. ..:. CCDS54 AQNLNPMVDVKVDTEDIEKKPESFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDV 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB4 RGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSFS : : : ..::. .. :. : ::. ..:.: CCDS54 FGYHGYTFANLGEHEFVE----EKTKVAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFC 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB4 EVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLA CCDS54 PVKEALEVDWSSEKAKAALKRTTSDYFLLQGTASPRWPQCVRWLEGFWHRKL 220 230 240 250 260 >>CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 (299 aa) initn: 358 init1: 263 opt: 363 Z-score: 420.8 bits: 87.7 E(32554): 4.1e-17 Smith-Waterman score: 363; 36.7% identity (67.6% similar) in 188 aa overlap (45-229:9-192) 20 30 40 50 60 70 pF1KB4 PDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSS :. .. . . :.::. . : ::.:::..: CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASR 10 20 30 80 90 100 110 120 130 pF1KB4 VLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPR ::. ::.:::.:::::.::.:::..:. :. . : ..:: .: ..:.::::.: : CCDS54 VLLVGLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLER 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB4 LAELNSYVPVTAYTGPLV---EDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADT .:: .: : . : . :.:.. :..: :: . ..: ..::. .::. ..:. CCDS54 AQNLNPMVDVKVDTEDIEKKPESFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDV 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB4 RGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSFS : : : ..::. .. :. : ::. ..:.: CCDS54 FGYHGYTFANLGEHEFVE----EKTKVAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFC 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB4 EVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLA CCDS54 PVKEALEVDWSSEKAKAALKRTTSDYFLLQGPVSAGPSSQQLLLLRWHEGEWDCGVPWPQ 220 230 240 250 260 270 >>CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 (346 aa) initn: 445 init1: 263 opt: 363 Z-score: 419.8 bits: 87.7 E(32554): 4.6e-17 Smith-Waterman score: 413; 28.7% identity (56.7% similar) in 397 aa overlap (45-432:9-343) 20 30 40 50 60 70 pF1KB4 PDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSS :. .. . . :.::. . : ::.:::..: CCDS12 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASR 10 20 30 80 90 100 110 120 130 pF1KB4 VLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPR ::. ::.:::.:::::.::.:::..:. :. . : ..:: .: ..:.::::.: : CCDS12 VLLVGLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLER 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB4 LAELNSYVPVTAYTGPLV---EDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADT .:: .: : . : . :.:.. :..: :: . ..: ..::. .::. ..:. CCDS12 AQNLNPMVDVKVDTEDIEKKPESFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDV 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB4 RGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSFS : : : ..::. .. :. : ::. ..:.: : : ..:.. . CCDS12 FGYHGYTFANLGEHEFVE----EKTKVAKVSQGVEDGP------DTKRAKLDSSETT--- 160 170 180 190 200 260 270 280 290 300 310 pF1KB4 EVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLA ::. ::. .: :: .....: :. CCDS12 ----MVKK--------KVV------FCP---------------VKEALEVDWSSEKAK-- 210 220 230 320 330 340 350 360 370 pF1KB4 EPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARALP : ..: .. .. .:.: .: ...:: : . :. .::. . .: CCDS12 ---------AALKRTTSDYFLLQVLLKFRTDKGRDPSSDTYEEDSELLLQIRNDVLDSL- 240 250 260 270 280 380 390 400 410 420 pF1KB4 AVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDAL-- ... . : ::..: ...::. : .::. :::..:: : . : ....::.. CCDS12 GISPDLLPEDFVR----YCFSEMAPVCAVVGGILAQEIVKALSQRDPPHNNFFFFDGMKG 290 300 310 320 330 430 440 450 460 470 480 pF1KB4 ----ECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLK ::: CCDS12 NGIVECLGPK 340 1058 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:32:27 2016 done: Thu Nov 3 14:32:28 2016 Total Scan time: 4.640 Total Display time: 0.190 Function used was FASTA [36.3.4 Apr, 2011]