FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0452, 462 aa 1>>>pF1KE0452 462 - 462 aa - 462 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9512+/- 0.001; mu= 13.9234+/- 0.060 mean_var=68.1104+/-13.670, 0's: 0 Z-trim(104.4): 18 B-trim: 307 in 1/50 Lambda= 0.155406 statistics sampled from 7873 (7877) to 7873 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.609), E-opt: 0.2 (0.242), width: 16 Scan time: 2.920 The best scores are: opt bits E(32554) CCDS5032.1 MANEA gene_id:79694|Hs108|chr6 ( 462) 3152 716.0 2.1e-206 CCDS44110.1 MANEAL gene_id:149175|Hs108|chr1 ( 457) 1874 429.4 3.7e-120 CCDS426.1 MANEAL gene_id:149175|Hs108|chr1 ( 235) 1079 251.1 9e-67 CCDS44111.1 MANEAL gene_id:149175|Hs108|chr1 ( 250) 804 189.5 3.5e-48 >>CCDS5032.1 MANEA gene_id:79694|Hs108|chr6 (462 aa) initn: 3152 init1: 3152 opt: 3152 Z-score: 3819.2 bits: 716.0 E(32554): 2.1e-206 Smith-Waterman score: 3152; 99.8% identity (99.8% similar) in 462 aa overlap (1-462:1-462) 10 20 30 40 50 60 pF1KE0 MAKFRRRTCIILALFILFIFSLMMGLKMLRPNTATFGAPFGLDLLPELHQRTIHLGKNFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 MAKFRRRTCIILALFILFIFSLMMGLKMLRPNTATFGAPFGLDLLPELHQRTIHLGKNFD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 FQKSDRINSETNTKNLKSVEITMKPSKASELNLDELPPLNNYLHVFYYSWYGNPQFDGKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 FQKSDRINSETNTKNLKSVEITMKPSKASELNLDELPPLNNYLHVFYYSWYGNPQFDGKY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 IHWNHPVLGHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQMRSAS :::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 IHWNHPVLEHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQMRSAS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 IGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYKNVKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 IGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYKNVKY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 IIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYDGLFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 IIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYDGLFI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 ALLVEEKHKYDILQSGFDGIYTYFATNGFTYGSSHQNWASLKLFCDKYNLIFIPSVGPGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 ALLVEEKHKYDILQSGFDGIYTYFATNGFTYGSSHQNWASLKLFCDKYNLIFIPSVGPGY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 IDTSIRPWNTQNTRNRINGKYYEIGLSAALQTRPSLISITSFNEWHEGTQIEKAVPKRTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 IDTSIRPWNTQNTRNRINGKYYEIGLSAALQTRPSLISITSFNEWHEGTQIEKAVPKRTS 370 380 390 400 410 420 430 440 450 460 pF1KE0 NTVYLDYRPHKPGLYLELTRKWSEKYSKERATYALDRQLPVS :::::::::::::::::::::::::::::::::::::::::: CCDS50 NTVYLDYRPHKPGLYLELTRKWSEKYSKERATYALDRQLPVS 430 440 450 460 >>CCDS44110.1 MANEAL gene_id:149175|Hs108|chr1 (457 aa) initn: 1927 init1: 1803 opt: 1874 Z-score: 2270.7 bits: 429.4 E(32554): 3.7e-120 Smith-Waterman score: 1874; 57.3% identity (80.0% similar) in 459 aa overlap (1-455:1-457) 10 20 30 40 50 pF1KE0 MAKFRRRTCIILALFILFIFSLMMGLKMLR-PNTATFGAPFGLDLLPELHQRTIHLGKNF ::. :::.:: : : .:: :. .:::. :. :. .: ::.: : ...: CCDS44 MARRRRRACIALFLVLLFAFGTLMGLRTLKAPDGLPALGP-GLELAP-FERRPEGAPAPA 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 DFQKSDRINSETNTKNLKSVEITMKPSKA-SELNLDELPPLNNY--LHVFYYSWYGNPQF . .... .:. : .: . . : : ::.:::::::.:. CCDS44 ARAPAAPAAPPPPPPPPRTADPGGSPGPAPAEAEPAPVQSLRVYSDLHAFYYSWYGSPRR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 DGKYIHWNHPVLGHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQM .:.::::.: .. ::::.:. .::.:::.::::.::::::::: :::::: :.. :: :. CCDS44 EGHYIHWDHVMVPHWDPKISASYPRGRHSPPDDLGSSFYPELGPYSSRDPEVLREHMTQL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 RSASIGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYK . :.::::.:::::: . :.::::.:.:::.::: ::.:...:.:::.::..::: ... CCDS44 KEAAIGVLVLSWYPPGMADDNGEPSDDLVPAILDTAHQYSIQVAFHIQPYKGRDDITVHD 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 NVKYIIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYD :.::::: ::.: ::::::.. :..::.::.::::.:.:: ::.::: .: .::::.::: CCDS44 NIKYIIDTYGSHGAFYRYKNSMGKSLPLFYIYDSYLTSPEAWAHLLTPNGPHSIRNTPYD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 GLFIALLVEEKHKYDILQSGFDGIYTYFATNGFTYGSSHQNWASLKLFCDKYNLIFIPSV :.:::::::: : .::: .::::.:::::.:::..::::::: ..: ::: ::.::::: CCDS44 GVFIALLVEEGHTHDILAAGFDGMYTYFASNGFSFGSSHQNWKAVKNFCDANNLMFIPSV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 GPGYIDTSIRPWNTQNTRNRINGKYYEIGLSAALQTRPSLISITSFNEWHEGTQIEKAVP :::::::::::::..:::::.:::::: .:.::: .:: ..:::::::::::::::::.: CCDS44 GPGYIDTSIRPWNNHNTRNRVNGKYYETALQAALTVRPEIVSITSFNEWHEGTQIEKAIP 360 370 380 390 400 410 420 430 440 450 460 pF1KE0 KRTSNTVYLDYRPHKPGLYLELTRKWSEKYSKERATYALDRQLPVS :.: . .:::: ::.:.:::::::.:.:.. ::. . . CCDS44 KKTPTRLYLDYLPHQPSLYLELTRRWAEHFIKEKEQWLM 420 430 440 450 >>CCDS426.1 MANEAL gene_id:149175|Hs108|chr1 (235 aa) initn: 1076 init1: 1076 opt: 1079 Z-score: 1312.2 bits: 251.1 E(32554): 9e-67 Smith-Waterman score: 1079; 68.4% identity (89.6% similar) in 212 aa overlap (244-455:24-235) 220 230 240 250 260 270 pF1KE0 KYNLKVTFHIEPYSNRDDQNMYKNVKYIIDKYGNHPAFYRYKTKTGNALPMFYVYDSYIT .::.: ::::::.. :..::.::.::::.: CCDS42 MITGSPQMTWCPPFWTPPISTASRYGSHGAFYRYKNSMGKSLPLFYIYDSYLT 10 20 30 40 50 280 290 300 310 320 330 pF1KE0 KPEKWANLLTTSGSRSIRNSPYDGLFIALLVEEKHKYDILQSGFDGIYTYFATNGFTYGS .:: ::.::: .: .::::.::::.:::::::: : .::: .::::.:::::.:::..:: CCDS42 SPEAWAHLLTPNGPHSIRNTPYDGVFIALLVEEGHTHDILAAGFDGMYTYFASNGFSFGS 60 70 80 90 100 110 340 350 360 370 380 390 pF1KE0 SHQNWASLKLFCDKYNLIFIPSVGPGYIDTSIRPWNTQNTRNRINGKYYEIGLSAALQTR ::::: ..: ::: ::.::::::::::::::::::..:::::.:::::: .:.::: .: CCDS42 SHQNWKAVKNFCDANNLMFIPSVGPGYIDTSIRPWNNHNTRNRVNGKYYETALQAALTVR 120 130 140 150 160 170 400 410 420 430 440 450 pF1KE0 PSLISITSFNEWHEGTQIEKAVPKRTSNTVYLDYRPHKPGLYLELTRKWSEKYSKERATY : ..:::::::::::::::::.::.: . .:::: ::.:.:::::::.:.:.. ::. . CCDS42 PEIVSITSFNEWHEGTQIEKAIPKKTPTRLYLDYLPHQPSLYLELTRRWAEHFIKEKEQW 180 190 200 210 220 230 460 pF1KE0 ALDRQLPVS . CCDS42 LM >>CCDS44111.1 MANEAL gene_id:149175|Hs108|chr1 (250 aa) initn: 857 init1: 733 opt: 804 Z-score: 978.6 bits: 189.5 E(32554): 3.5e-48 Smith-Waterman score: 804; 47.6% identity (71.6% similar) in 250 aa overlap (1-246:1-248) 10 20 30 40 50 pF1KE0 MAKFRRRTCIILALFILFIFSLMMGLKMLR-PNTATFGAPFGLDLLPELHQRTIHLGKNF ::. :::.:: : : .:: :. .:::. :. :. .: ::.: : ...: CCDS44 MARRRRRACIALFLVLLFAFGTLMGLRTLKAPDGLPALGP-GLELAP-FERRPEGAPAPA 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 DFQKSDRINSETNTKNLKSVEITMKPSKA-SELNLDELPPLNNY--LHVFYYSWYGNPQF . .... .:. : .: . . : : ::.:::::::.:. CCDS44 ARAPAAPAAPPPPPPPPRTADPGGSPGPAPAEAEPAPVQSLRVYSDLHAFYYSWYGSPRR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 DGKYIHWNHPVLGHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQM .:.::::.: .. ::::.:. .::.:::.::::.::::::::: :::::: :.. :: :. CCDS44 EGHYIHWDHVMVPHWDPKISASYPRGRHSPPDDLGSSFYPELGPYSSRDPEVLREHMTQL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 RSASIGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYK . :.::::.:::::: . :.::::.:.:::.::: ::.:...:.:::.::..::: ... CCDS44 KEAAIGVLVLSWYPPGMADDNGEPSDDLVPAILDTAHQYSIQVAFHIQPYKGRDDITVHD 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 NVKYIIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYD :.::::: : CCDS44 NIKYIIDTTGKL 240 250 462 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:51:19 2016 done: Thu Nov 3 07:51:20 2016 Total Scan time: 2.920 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]