FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8416, 1052 aa 1>>>pF1KB8416 1052 - 1052 aa - 1052 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8838+/-0.00108; mu= 17.9152+/- 0.065 mean_var=62.7839+/-12.414, 0's: 0 Z-trim(102.0): 32 B-trim: 0 in 0/51 Lambda= 0.161864 statistics sampled from 6734 (6750) to 6734 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.561), E-opt: 0.2 (0.207), width: 16 Scan time: 3.060 The best scores are: opt bits E(32554) CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052) 6979 1639.2 0 CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058) 2603 617.3 5.5e-176 CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012) 1691 404.3 6.7e-112 CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 ( 640) 334 87.4 1.1e-16 CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 ( 449) 315 82.9 1.7e-15 CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 ( 463) 315 82.9 1.7e-15 CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 ( 266) 303 80.1 7e-15 CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 ( 299) 303 80.1 7.9e-15 CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 ( 346) 303 80.1 9e-15 >>CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052 aa) initn: 6979 init1: 6979 opt: 6979 Z-score: 8795.8 bits: 1639.2 E(32554): 0 Smith-Waterman score: 6979; 99.7% identity (99.8% similar) in 1052 aa overlap (1-1052:1-1052) 10 20 30 40 50 60 pF1KB8 MEGSEPVAAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MEGSEPVAAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 KSHVFLSGMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KSHVFLSGMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 AVLKHIAELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AVLKHIAELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 IKFISADVHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLEDHPHKLE :::::::::::::::::::::::::::::::::::::::::::::::::::::.:::::: CCDS35 IKFISADVHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLENHPHKLE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 TGQFLTFREINGMTGLNGSIQQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TGQFLTFREINGMTGLNGSIQQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 SLERQLKHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SLERQLKHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 ISETLEEKPDVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQWLYLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ISETLEEKPDVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQWLYLE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 AADIVESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEMLKNFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AADIVESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEMLKNFA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 LLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINSQIKIDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINSQIKIDA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 HLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGTMGTKGHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGTMGTKGHT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 EVIVPHLTESYNSHRDPPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKPSLFNKFW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EVIVPHLTESYNSHRDPPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKPSLFNKFW 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 QTYSSAEEVLQKIQSGHSLEGCFQVIKLLSRRPRNWSQCVELARLKFEKYFNHKALQLLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 QTYSSAEEVLQKIQSGHSLEGCFQVIKLLSRRPRNWSQCVELARLKFEKYFNHKALQLLH 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 CFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYCIPFAEEDLSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 CFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYCIPFAEEDLSA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB8 DALLNILSEVKIQEFKPSNKVVQTDETARKPDHVPISSEDGRNAIFQLEKAILSNEATKS :::::::::::::::::::::::::::::::::::::::: ::::::::::::::::::: CCDS35 DALLNILSEVKIQEFKPSNKVVQTDETARKPDHVPISSEDERNAIFQLEKAILSNEATKS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB8 DLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKIIPAIATTTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKIIPAIATTTAT 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB8 VSGLVALEKIKVTGGYPFEAYKNCFLNLAIPIVVFTETTEVRKTKIRNGISFTIWDRWTV :::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VSGLVALEMIKVTGGYPFEAYKNCFLNLAIPIVVFTETTEVRKTKIRNGISFTIWDRWTV 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB8 HGKEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVMPGHAKRLKLTMHKLVKPTTEKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HGKEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVMPGHAKRLKLTMHKLVKPTTEKK 970 980 990 1000 1010 1020 1030 1040 1050 pF1KB8 YVDLTVSFAPDIDGDEDLPGPPVRYYFSHDTD :::::::::::::::::::::::::::::::: CCDS35 YVDLTVSFAPDIDGDEDLPGPPVRYYFSHDTD 1030 1040 1050 >>CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058 aa) initn: 2185 init1: 950 opt: 2603 Z-score: 3273.1 bits: 617.3 E(32554): 5.5e-176 Smith-Waterman score: 2603; 42.7% identity (71.2% similar) in 1030 aa overlap (38-1045:49-1055) 10 20 30 40 50 60 pF1KB8 AAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHVFLS .::..::::: :::: ::... : :..: CCDS14 PGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSSVLVS 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB8 GMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAEAVLKHIA :. :::.:::::..:.:.::::.:: : ::...:.: :.:. .::::. ..: CCDS14 GLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDI--GKNRAEVSQPRLA 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB8 ELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIKFISAD ::: :: ::. . :. : .::. .: ::::. : : ....::... ::.. :: CCDS14 ELNSYVPVTAYTGPLVE----DFLSGFQVVVLTNTPLEDQLRVGEFCHNR--GIKLVVAD 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB8 VHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLEDHPHKLETGQFLTF ..:....::::::.:. . :..::.: ..: .:. :::.::::.. : .:.:.:..: CCDS14 TRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSF 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB8 REINGMTGLNGSI-QQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFESLERQL :..::. :::. ..: :..:..::: ::... :..:::. :::.:: . :.:: .: CCDS14 SEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASL 260 270 280 290 300 310 310 320 330 340 350 360 pF1KB8 KHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATSIS-ETL .: ...::.. : ..: .. :: :: ...: : ..:. ::. :: ... ..: CCDS14 AEPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARAL 320 330 340 350 360 370 370 380 390 400 410 420 pF1KB8 E--EKPDVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQWLYLEAAD .. ... :... :...: : :.:. : .::.:.:::.:: .::: :. ::::..: . CCDS14 PAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDALE 380 390 400 410 420 430 430 440 450 460 470 pF1KB8 IV----ESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEMLKNF . : : . .: : : .:::. : .:. : .:: . . :::: ::::::.:::: CCDS14 CLPEDKEVLTEDKC---LQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNF 440 450 460 470 480 480 490 500 510 520 530 pF1KB8 ALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINSQIKID :..:.: . : : : ::: : :::::::::::::: . : :: ::: :. ..: .:.. CCDS14 AMIGLGCG-EGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVT 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB8 AHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGTMGTKGH .: :.: : :: ::.:.:. . : . .:::::.:: :.: ::. .:::.:::.::::. CCDS14 SHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGN 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB8 TEVIVPHLTESYNSHRDPPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKPSLFNKF ..:..: :::::.: .::::. ::.::::.:: :::::.:::::.::. :.. :.. CCDS14 VQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQY 610 620 630 640 650 660 660 670 680 690 700 710 pF1KB8 WQTYSSAEEVLQKIQSGHSLEGCFQVIK-LLSRRPRNWSQCVELARLKFEKYFNHKALQL . .:..: .. . . :: : . :. .::..:..:: : ... .... :: CCDS14 LTDPKFVERTL-RLAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQL 670 680 690 700 710 720 720 730 740 750 760 770 pF1KB8 LHCFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYCIPFAEEDL :: :: : ..:. ::..::: : :. ::.:.::::.... ::.:.: .: . . .: CCDS14 LHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLT-GSQDR 730 740 750 760 770 780 780 790 800 810 820 830 pF1KB8 SADALLNILSEVKIQEFKPSN--KVVQTDETARKPDHVPISSEDGRNAIFQLEKAILSNE .: : ..:. :.. :: :.. :. .:. .. . : .:.: .. :: : . CCDS14 AAVA--TFLQSVQVPEFTPKSGVKIHVSDQELQSAN---ASVDDSR---LEELKATLPSP 790 800 810 820 830 840 850 860 870 880 890 pF1KB8 ATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKIIPAIAT ..: ..:::::: : :.:::.:::::::. :.: ::: :.: ::::::::::: CCDS14 DKLPGFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIAT 840 850 860 870 880 890 900 910 920 930 940 950 pF1KB8 TTATVSGLVALEKIKVTGGY-PFEAYKNCFLNLAIPIVVFTETTEVRKTKIRNGISFTIW :::.: ::: :: ::. :. ...::: :::::.:. :.: . . . : .:.: CCDS14 TTAAVVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQ-EWTLW 900 910 920 930 940 950 960 970 980 990 1000 pF1KB8 DRWTVHG----KEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVMPGHA--KRLKLTM ::. :.: :..:: .:.. : .. .: ::. :::.::: ::. .:: : CCDS14 DRFEVQGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPM 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 pF1KB8 HKLVKPTTEKK---YVD-LTVSFAPDIDGDEDLPGPPVRYYFSHDTD ..:. ....: .: :.. . . .. ::. : ::: CCDS14 TEIVSRVSKRKLGRHVRALVLELCCNDESGEDVEVPYVRYTIR 1020 1030 1040 1050 >>CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012 aa) initn: 1531 init1: 366 opt: 1691 Z-score: 2122.4 bits: 404.3 E(32554): 6.7e-112 Smith-Waterman score: 2037; 37.5% identity (65.6% similar) in 1035 aa overlap (35-1045:6-1010) 10 20 30 40 50 60 pF1KB8 EPVAAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHV :: .:. ::::: ::::. :::.. ..: CCDS28 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARV 10 20 30 70 80 90 100 110 120 pF1KB8 FLSGMGGLGLEIAKNLVLAGIKAVTIHDTEK-CQAW-DLGTNFFLSEDDVVNKRNRAEAV ..::. ::: :.:::::: :. ..:.:: . : : ::...:.:::.:. .:.:::: CCDS28 LVSGLQGLGAEVAKNLVLMGVGSLTLHDPHPTC--WSDLAAQFLLSEQDL--ERSRAEAS 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB8 LKHIAELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIK . .:.:: :.:. . ..: :: .:: .: :::: :: : :.. .:... . CCDS28 QELLAQLNRAVQVVVHTGDITE--DL-LLD-FQVVVLTAAKLEEQLKVGTLCHKH--GVC 100 110 120 130 140 190 200 210 220 230 240 pF1KB8 FISADVHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLED-HPHKLET :..::..:. ..::::::..: : : : :: :..:.:..:::.: . . : .. CCDS28 FLAADTRGLVGQLFCDFGEDFTVQDPTEAEPLTAAIQHISQGSPGILTLRKGANTHYFRD 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB8 GQFLTFREINGMTGLNG-SIQQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFE :...:: :.::. :: . ..: : :. ::::: . ::.:: ..:: :::: . CCDS28 GDLVTFSGIEGMVELNDCDPRSIHVREDGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHK 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB8 SLERQLKHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATS ::. : .:. . . .. . .: :. :: .::. ..: :. :.: .. :: . CCDS28 SLDTALLQPHVVAQSSQEVHHAHCLHQAFCALHKFQHLHGRPPQPWDPVDAETVVGLARD 270 280 290 300 310 320 370 380 390 400 410 pF1KB8 IS--ETLEEKP---DVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQ . . ::.: .. .:. .. .. : :::..: .:.::.::::::.. :: :: : CCDS28 LEPLKRTEEEPLEEPLDEALVRTVALSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQ 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB8 WLYLEAADIVESLGK--PECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGC :::..: : . :. : :. ::.:::. : .: . .::. . .::: ::::: CCDS28 WLYFDALDCLPEDGELLPSPEDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGC 390 400 410 420 430 440 480 490 500 510 520 530 pF1KB8 EMLKNFALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKIN :.:: :::.:.:... :. ::.: : ::.:::.:::::: . . .::. .:: :. .: CCDS28 ELLKVFALVGLGAGNSGGL-TVVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLN 450 460 470 480 490 500 540 550 560 570 580 590 pF1KB8 SQIKIDAHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGT .... . :::: ::.:.:... : . .:::. .::::: .:: :.:::..:: CCDS28 PDLQVIPLTYPLDPTTEHIYGDNFFSRVDGVAAALDSFQARRYVAARCTHYLKPLLEAGT 510 520 530 540 550 560 600 610 620 630 640 650 pF1KB8 MGTKGHTEVIVPHLTESYNSHRDPPEEE---IPFCTLKSFPAAIEHTIQWARDKFESSFS :: : . :..::.::.: . . : : ::.. ::.. :::.:::: .:: : CCDS28 SGTWGSATVFMPHVTEAYRAPASAAASEDAPYPVCTVRYFPSTAEHTLQWARHEFEELFR 570 580 590 600 610 620 660 670 680 690 700 710 pF1KB8 HKPSLFNKFWQTYSSAEEVLQKIQSGHSLEGCFQVIKLLSRRPRNWSQCVELARLKFEKY . .:. :...: : .. ..: :. .: ::.::..:: : ... CCDS28 LSAETINHHQQAHTS----LADMDEPQTLTLLKPVLGVLRVRPQNWQDCVAWALGHWKLC 630 640 650 660 670 680 720 730 740 750 760 770 pF1KB8 FNHKALQLLHCFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYC :.. :::. :: . :.::. ::..::. :.:..:: :. :: .. ::.::: .. CCDS28 FHYGIKQLLRHFPPNKVLEDGTPFWSGPKQCPQPLEFDTNQDTHLLYVLAAANLYAQMHG 690 700 710 720 730 740 780 790 800 810 820 830 pF1KB8 IPFAEEDLSADALLNILSEVKIQEFKPSNKVVQTDETARKPDHVPISSEDGRNAIFQLEK .: ... . ::..: . :.. : : . . . :.: : . .:.: CCDS28 LPGSQDWTALRELLKLLPQPDPQQMAPI--------FASNLELASASAEFGPEQQKELNK 750 760 770 780 790 840 850 860 870 880 890 pF1KB8 AILSNEATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKI :. :. . . : :::::: : :.::..::..:: . :.: :..: ..:::.:.: CCDS28 AL---EVWSVGPPLKPLMFEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRAQSKRIVGQI 800 810 820 830 840 900 910 920 930 940 pF1KB8 IPAIATTTATVSGLVALEKIKVTGG-YPFEAYKNCFLNLAIPIVVFTETTEVRKTKIRNG :::::::::.:.::..:: ::..: : :... .:.:: .. . . . CCDS28 IPAIATTTAAVAGLLGLELYKVVSGPRPRSAFRHSYLHLAENYLI-RYMPFAPAIQTFHH 850 860 870 880 890 900 950 960 970 980 990 1000 pF1KB8 ISFTIWDRWTVH-GKEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVM-P-GHAKRLK ...: ::: : :. . :: ... ..:..:.. ....: .::. : .:..: CCDS28 LKWTSWDRLKVPAGQPERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSPEKQAQHLP 910 920 930 940 950 960 1010 1020 1030 1040 1050 pF1KB8 LTMHKLVK------PTTEKKYVDLTVSFAPDIDGDEDLPGPPVRYYFSHDTD : . .::. :. .. . : .: : ::: ::..: CCDS28 LRVTELVQQLTGQAPAPGQRVLVLELSCEGD---DEDTAFPPLHYEL 970 980 990 1000 1010 >>CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 (640 aa) initn: 582 init1: 235 opt: 334 Z-score: 413.2 bits: 87.4 E(32554): 1.1e-16 Smith-Waterman score: 530; 27.8% identity (54.0% similar) in 561 aa overlap (445-991:2-486) 420 430 440 450 460 470 pF1KB8 QWLYLEAADIVESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCE :: . : . . . ...:: :.:::: CCDS12 MALSRGLPRELAEAVAGGRVLVVGAGGIGCE 10 20 30 480 490 500 510 520 530 pF1KB8 MLKNFALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINS .:::..: : . : . : : :. :::::::::. .:. . :. .: ...:.. CCDS12 LLKNLVLTGFS------HIDLIDLDTIDVSNLNRQFLFQKKHVGRSKAQVAKESVLQFYP 40 50 60 70 80 540 550 560 570 580 590 pF1KB8 QIKIDAHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGTM . .: :. ... :: ::. . ....:::: :: .:. ::: ::..::: CCDS12 KANIVAYHDSIMNPD---YNVEFFRQFILVMNALDNRAARNHVNRMCLAADVPLIESGTA 90 100 110 120 130 140 600 610 620 630 640 650 pF1KB8 GTKGHTEVIVPHLTESYNSHRDPPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKPS : :.. .: .:: :. : : .. .: ::... :. : : ::. CCDS12 GYLGQVTTIKKGVTECYECHPKPTQRTFPGCTIRNTPSEPIHCIVWAK-----------Y 150 160 170 180 190 660 670 680 690 700 710 pF1KB8 LFNKFWQTYSSAEEVLQKIQSGHSL-EGCFQVIKLLSR-RPRNWSQCVELARLK-FEKYF :::... . :.. :... .. :. .. . .: : : . .. : . : CCDS12 LFNQLF----GEEDADQEVSPDRADPEAAWEPTEAEARARASNEDGDIKRISTKEWAKST 200 210 220 230 240 720 730 740 750 760 pF1KB8 NHKALQLL-HCFPLDIR-LKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVY .. ..:. . : ::: : . .:. :: : :. .: : . ::. CCDS12 GYDPVKLFTKLFKDDIRYLLTMDKLWR--KRKP-PVPLDWAEVQSQGEETNASDQQNE-- 250 260 270 280 290 300 770 780 790 800 810 820 pF1KB8 CIPFAEEDLSADALLNILSEVKIQEFKPSNKVVQTDETARKPDHVPISSEDGRNAIFQLE : . :. . .:.. : ... :. : ..... :. CCDS12 --P--QLGLKDQQVLDVKSYARL--FSKSIETLRV--------HL--------------- 310 320 330 830 840 850 860 870 880 pF1KB8 KAILSNEATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGK : :.: : : ..::: .::.:.:.::: ...:.. .:: : .::. CCDS12 -------AEKGD--GAELIWDKDDPSA--MDFVTSAANLRMHIFSMNMKSRFDIKSMAGN 340 350 360 370 380 890 900 910 920 930 940 pF1KB8 IIPAIATTTATVSGLVALEKIKVTGGYPFEAYKNCFLN--------LAIPIVVFTETTEV ::::::::.:...::..:: .:. .: .. .. ::: : .: .. . . CCDS12 IIPAIATTNAVIAGLIVLEGLKILSG-KIDQCRTIFLNKQPNPRKKLLVPCALDPPNPNC 390 400 410 420 430 440 950 960 970 980 990 1000 pF1KB8 RKTKIRNGISFTIWDRWTVHGKEDFTLLDFINAVKEKYG-IEPTMVVQGVKMLYVPVMPG . .. : .:: .:: : : ::::.. . : . .. : CCDS12 YVCASKPEVTV----RLNVHKVTVLTLQDKI--VKEKFAMVAPDVQIEDGKGTILISSEE 450 460 470 480 490 1010 1020 1030 1040 1050 pF1KB8 HAKRLKLTMHKLVKPTTEKKYVDLTVSFAPDIDGDEDLPGPPVRYYFSHDTD CCDS12 GETEANNHKKLSEFGIRNGSRLQADDFLQDYTLLINILHSEDLGKDVEFEVVGDAPEKVG 500 510 520 530 540 550 >>CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 (449 aa) initn: 465 init1: 148 opt: 315 Z-score: 391.9 bits: 82.9 E(32554): 1.7e-15 Smith-Waterman score: 381; 35.2% identity (62.3% similar) in 199 aa overlap (458-642:53-240) 430 440 450 460 470 480 pF1KB8 LGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEMLKNFALLGVGTS :.. .....: :..:::.:::.:: : CCDS29 RWNHVKKFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGF--- 30 40 50 60 70 490 500 510 520 530 540 pF1KB8 KEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINSQIKIDAHLNKVCP .: : : : :. :::::::::::. : .::. .::. . .. :.::. CCDS29 ---RQIHVIDMDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQD 80 90 100 110 120 130 550 560 570 580 590 pF1KB8 TTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLR------------PLLDSGTMG .:: :: . .:. .::.. :::.... .. : ::.:.:: : CCDS29 -----FNDTFYRQFHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEG 140 150 160 170 180 190 600 610 620 630 640 650 pF1KB8 TKGHTEVIVPHLTESYNSHRD--PPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKP ::...::.: .: . . ::. ..:.::. :.: :: :...: CCDS29 FKGNARVILPGMTACIECTLELYPPQVNFPMCTIASMPRLPEHCIEYVRMLQWPKEQPFG 200 210 220 230 240 250 660 670 680 690 700 710 pF1KB8 SLFNKFWQTYSSAEEVLQKIQSGHSLEGCFQVIKLLSRRPRNWSQCVELARLKFEKYFNH CCDS29 EGVPLDGDDPEHIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCA 260 270 280 290 300 310 >>CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 (463 aa) initn: 465 init1: 148 opt: 315 Z-score: 391.6 bits: 82.9 E(32554): 1.7e-15 Smith-Waterman score: 381; 35.2% identity (62.3% similar) in 199 aa overlap (458-642:67-254) 430 440 450 460 470 480 pF1KB8 LGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEMLKNFALLGVGTS :.. .....: :..:::.:::.:: : CCDS29 RWNHVKKFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGF--- 40 50 60 70 80 90 490 500 510 520 530 540 pF1KB8 KEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINSQIKIDAHLNKVCP .: : : : :. :::::::::::. : .::. .::. . .. :.::. CCDS29 ---RQIHVIDMDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQD 100 110 120 130 140 150 550 560 570 580 590 pF1KB8 TTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLR------------PLLDSGTMG .:: :: . .:. .::.. :::.... .. : ::.:.:: : CCDS29 -----FNDTFYRQFHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEG 160 170 180 190 200 600 610 620 630 640 650 pF1KB8 TKGHTEVIVPHLTESYNSHRD--PPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKP ::...::.: .: . . ::. ..:.::. :.: :: :...: CCDS29 FKGNARVILPGMTACIECTLELYPPQVNFPMCTIASMPRLPEHCIEYVRMLQWPKEQPFG 210 220 230 240 250 260 660 670 680 690 700 710 pF1KB8 SLFNKFWQTYSSAEEVLQKIQSGHSLEGCFQVIKLLSRRPRNWSQCVELARLKFEKYFNH CCDS29 EGVPLDGDDPEHIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCA 270 280 290 300 310 320 >>CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 (266 aa) initn: 231 init1: 148 opt: 303 Z-score: 380.6 bits: 80.1 E(32554): 7e-15 Smith-Waterman score: 303; 35.9% identity (66.5% similar) in 167 aa overlap (38-203:13-174) 10 20 30 40 50 60 pF1KB8 AAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHVFLS : . : :.:: . : :.... :.:.: CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLV 10 20 30 40 70 80 90 100 110 120 pF1KB8 GMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAEAVLKHIA :. ::: ::::::.:::.:..:. : :. : :..:.. .: :::::: :.. CCDS54 GLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSV--GRNRAEASLERAQ 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB8 ELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIKFISAD .:::.: : .. ... . ::. ... : :: . . :....:... :::...: CCDS54 NLNPMVDVKVDTEDIEKKPE-SFFTQFDAVCLTCCSRDVIVKVDQICHKN--SIKFFTGD 110 120 130 140 150 190 200 210 220 230 240 pF1KB8 VHGIWSRLFCDFGD-EFEVLDTTGEEPKEIFISNITQANPGIVTCLEDHPHKLETGQFLT : : . : ..:. :: CCDS54 VFGYHGYTFANLGEHEFVEEKTKVAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFCPVK 160 170 180 190 200 210 >>CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 (299 aa) initn: 231 init1: 148 opt: 303 Z-score: 379.7 bits: 80.1 E(32554): 7.9e-15 Smith-Waterman score: 303; 35.9% identity (66.5% similar) in 167 aa overlap (38-203:13-174) 10 20 30 40 50 60 pF1KB8 AAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHVFLS : . : :.:: . : :.... :.:.: CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLV 10 20 30 40 70 80 90 100 110 120 pF1KB8 GMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAEAVLKHIA :. ::: ::::::.:::.:..:. : :. : :..:.. .: :::::: :.. CCDS54 GLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSV--GRNRAEASLERAQ 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB8 ELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIKFISAD .:::.: : .. ... . ::. ... : :: . . :....:... :::...: CCDS54 NLNPMVDVKVDTEDIEKKPE-SFFTQFDAVCLTCCSRDVIVKVDQICHKN--SIKFFTGD 110 120 130 140 150 190 200 210 220 230 240 pF1KB8 VHGIWSRLFCDFGD-EFEVLDTTGEEPKEIFISNITQANPGIVTCLEDHPHKLETGQFLT : : . : ..:. :: CCDS54 VFGYHGYTFANLGEHEFVEEKTKVAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFCPVK 160 170 180 190 200 210 >>CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 (346 aa) initn: 312 init1: 148 opt: 303 Z-score: 378.6 bits: 80.1 E(32554): 9e-15 Smith-Waterman score: 337; 27.0% identity (55.6% similar) in 403 aa overlap (38-429:13-344) 10 20 30 40 50 60 pF1KB8 AAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHVFLS : . : :.:: . : :.... :.:.: CCDS12 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLV 10 20 30 40 70 80 90 100 110 120 pF1KB8 GMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAEAVLKHIA :. ::: ::::::.:::.:..:. : :. : :..:.. .: :::::: :.. CCDS12 GLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSV--GRNRAEASLERAQ 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB8 ELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIKFISAD .:::.: : .. ... . ::. ... : :: . . :....:... :::...: CCDS12 NLNPMVDVKVDTEDIEKKPE-SFFTQFDAVCLTCCSRDVIVKVDQICHKNS--IKFFTGD 110 120 130 140 150 190 200 210 220 230 240 pF1KB8 VHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLEDHPHKLETGQFLTF : : . : ..: : : .. :. : .....: :. :: : CCDS12 VFGYHGYTFANLG-EHEFVE---EKTK---VAKVSQ---GV----EDGP----------- 160 170 180 190 250 260 270 280 290 300 pF1KB8 REINGMTGLNGSIQQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFESLERQLK :: . . : .. ...:: : : : ... :. CCDS12 ---------------------------DTKRAK--LDSSETTMVK--KKVVFCPVKEALE 200 210 220 310 320 330 340 350 360 pF1KB8 HPKCLIVDFSNPEAPLEIHTA------MLALDQFQEKYSRKPNVGC-QQDSEELLKLATS ::.:. .: .. . . .: .:. .: :. ..::: ::.. .. CCDS12 ------VDWSSEKAKAALKRTTSDYFLLQVLLKFRTDKGRDPSSDTYEEDSELLLQIRND 230 240 250 260 270 370 380 390 400 410 pF1KB8 ISETLEEKPDV-NADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQWLY- . ..: .::. :.:.. . ..:. :.:::. .::..::.. . : .... CCDS12 VLDSLGISPDLLPEDFVRYCF----SEMAPVCAVVGGILAQEIVKALSQRDPPHNNFFFF 280 290 300 310 320 330 420 430 440 450 460 470 pF1KB8 --LEAADIVESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEML ... ::: :: CCDS12 DGMKGNGIVECLGPK 340 1052 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 12:44:48 2016 done: Fri Nov 4 12:44:48 2016 Total Scan time: 3.060 Total Display time: 0.200 Function used was FASTA [36.3.4 Apr, 2011]