FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0214, 461 aa 1>>>pF1KE0214 461 - 461 aa - 461 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3381+/-0.00118; mu= 17.6022+/- 0.069 mean_var=68.8745+/-14.642, 0's: 0 Z-trim(100.9): 42 B-trim: 435 in 1/48 Lambda= 0.154541 statistics sampled from 6303 (6316) to 6303 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.524), E-opt: 0.2 (0.194), width: 16 Scan time: 2.990 The best scores are: opt bits E(32554) CCDS9332.1 SLC46A3 gene_id:283537|Hs108|chr13 ( 461) 3027 684.6 5.8e-197 CCDS45021.1 SLC46A3 gene_id:283537|Hs108|chr13 ( 463) 3027 684.6 5.9e-197 CCDS74020.1 SLC46A1 gene_id:113235|Hs108|chr17 ( 459) 665 157.9 2e-38 CCDS74019.1 SLC46A1 gene_id:113235|Hs108|chr17 ( 431) 455 111.1 2.3e-24 CCDS6786.1 SLC46A2 gene_id:57864|Hs108|chr9 ( 475) 399 98.6 1.4e-20 >>CCDS9332.1 SLC46A3 gene_id:283537|Hs108|chr13 (461 aa) initn: 3027 init1: 3027 opt: 3027 Z-score: 3649.5 bits: 684.6 E(32554): 5.8e-197 Smith-Waterman score: 3027; 100.0% identity (100.0% similar) in 461 aa overlap (1-461:1-461) 10 20 30 40 50 60 pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS93 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS93 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS93 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS93 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS93 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS93 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS93 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL 370 380 390 400 410 420 430 440 450 460 pF1KE0 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR ::::::::::::::::::::::::::::::::::::::::: CCDS93 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR 430 440 450 460 >>CCDS45021.1 SLC46A3 gene_id:283537|Hs108|chr13 (463 aa) initn: 3027 init1: 3027 opt: 3027 Z-score: 3649.5 bits: 684.6 E(32554): 5.9e-197 Smith-Waterman score: 3027; 100.0% identity (100.0% similar) in 461 aa overlap (1-461:1-461) 10 20 30 40 50 60 pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 FQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRKFPMILSSVGALATSVWLCL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LCYFAFPFQLLIASTFIGAFCGNYTTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GLTGLSSGYFIRELGFEWSFLIIAVSLAVNLIYILFFLGDPVKECSSQNVTMSCSEGFKN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFL 370 380 390 400 410 420 430 440 450 460 pF1KE0 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR ::::::::::::::::::::::::::::::::::::::::: CCDS45 LSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDRAC 430 440 450 460 >>CCDS74020.1 SLC46A1 gene_id:113235|Hs108|chr17 (459 aa) initn: 661 init1: 434 opt: 665 Z-score: 803.4 bits: 157.9 E(32554): 2e-38 Smith-Waterman score: 768; 34.5% identity (66.2% similar) in 432 aa overlap (6-431:25-438) 10 20 30 40 pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTF ::: .::. ::..: :::::::...:. . : . CCDS74 MEGSASPPEKPRARPAAAVLCRGPVEPLVFLANFALVLQGPLTTQYLWHRFSADLG---Y 10 20 30 40 50 50 60 70 80 90 100 pF1KE0 SSDSNISECEKNKSSPIFAFQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRK .. . . : . ...: ..::. .:...: :...:.. :: :. .: . :: ::. CCDS74 NGTRQRGGCSNRSADPT---MQEVETLTSHWTLYMNVGGFLVGLFSSTLLGAWSDSVGRR 60 70 80 90 100 110 110 120 130 140 150 pF1KE0 FPMILSSVGALATSVWLCLLCYFAFPFQLLIASTFIG----AFCGNYTTFWGACFAYIVD ..:.:.: : . :. :. .:: .. .: :. :.. . .: :: ..: CCDS74 PLLVLASLGLLLQA----LVSVFVVQLQLHVGYFVLGRILCALLGDFGGLLAASFASVAD 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 QCKEHKQKTIRIAIIDFLLGLVTGLTGLSSGYFIRELGFEWSF-LIIAVSLAVNLIYILF . ...:.:.:... .:.. :..: .:...: :. : : .:. .:..: : : CCDS74 -VSSSRSRTFRMALLEASIGVAGMLASLLGGHWLRAQGYANPFWLALALLIAMTL-YAAF 180 190 200 210 220 220 230 240 250 260 270 pF1KE0 FLGDPVKECSSQNV-TMSCSEGFKNLFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVI .:. .:: .: . :. ... .:. . : :. : : .:.::: : CCDS74 CFGETLKEPKSTRLFTFRHHRSIVQLYVAPA---PEKSRKHLALYSLAIFVVITVHF--- 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE0 GIAPIFILYELDSPLCWNEVFIGYGSALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTT : :. ::::..::::. .:::::: .:::.:.. :..::. : .: ::. . CCDS74 GAQDILTLYELSTPLCWDSKLIGYGSAAQHLPYLTSLLALKLLQYCLADAWVAEIGLAFN 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE0 MTGMAMTAFASTTLMMFLARVPFLFTIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLG . ::.. :::. : .:: . .....: :.:. :::.:: ::::.::. .: ...:. CCDS74 ILGMVVFAFATITPLMFTGYGLLFLSLVITPVIRAKLSKLVRETEQGALFSAVACVNSLA 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE0 GVTAVSTFNGIYSATVAWYPGFTFLLSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESS .:: . ::..: ::. .. :: :::.:::::.::. CCDS74 MLTASGIFNSLYPATLNFMKGFPFLLGAGLLLIPAVLIGMLEKADPHLEFQQFPQSP 410 420 430 440 450 460 pF1KE0 EDASDR >>CCDS74019.1 SLC46A1 gene_id:113235|Hs108|chr17 (431 aa) initn: 602 init1: 240 opt: 455 Z-score: 550.8 bits: 111.1 E(32554): 2.3e-24 Smith-Waterman score: 650; 32.2% identity (62.0% similar) in 432 aa overlap (6-431:25-410) 10 20 30 40 pF1KE0 MKILFVEPAIFLSAFAMTLTGPLTTQYVYRRIWEETGNYTF ::: .::. ::..: :::::::...:. . : . CCDS74 MEGSASPPEKPRARPAAAVLCRGPVEPLVFLANFALVLQGPLTTQYLWHRFSADLG---Y 10 20 30 40 50 50 60 70 80 90 100 pF1KE0 SSDSNISECEKNKSSPIFAFQEEVQKKVSRFNLQMDISGLIPGLVSTFILLSISDHYGRK .. . . : . ...: ..::. .:...: :...:.. :: :. .: . :: ::. CCDS74 NGTRQRGGCSNRSADPT---MQEVETLTSHWTLYMNVGGFLVGLFSSTLLGAWSDSVGRR 60 70 80 90 100 110 110 120 130 140 150 pF1KE0 FPMILSSVGALATSVWLCLLCYFAFPFQLLIASTFIG----AFCGNYTTFWGACFAYIVD ..:.:.: : . :. :. .:: .. .: :. :.. . .: :: ..: CCDS74 PLLVLASLGLLLQA----LVSVFVVQLQLHVGYFVLGRILCALLGDFGGLLAASFASVAD 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 QCKEHKQKTIRIAIIDFLLGLVTGLTGLSSGYFIRELGFEWSF-LIIAVSLAVNLIYILF . ...:.:.:... .:.. :..: .:...: :. : : .:. .:..: : : CCDS74 -VSSSRSRTFRMALLEASIGVAGMLASLLGGHWLRAQGYANPFWLALALLIAMTL-YAAF 180 190 200 210 220 220 230 240 250 260 270 pF1KE0 FLGDPVKECSSQNV-TMSCSEGFKNLFYRTYMLFKNASGKRRFLLCLLLFTVITYFFVVI .:. .:: .: . :. ... .:. . : :. : : .:.::: : CCDS74 CFGETLKEPKSTRLFTFRHHRSIVQLYVAPA---PEKSRKHLALYSLAIFVVITVHF--- 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE0 GIAPIFILYELDSPLCWNEVFIGYGSALGSASFLTSFLGIWLFSYCMEDIHMAFIGIFTT : :. ::::..::::. .:::::: .:::.:.. :..::. : .: ::. . CCDS74 GAQDILTLYELSTPLCWDSKLIGYGSAAQHLPYLTSLLALKLLQYCLADAWVAEIGLAFN 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE0 MTGMAMTAFASTTLMMFLARVPFLFTIVPFSVLRSMLSKVVRSTEQGTLFACIAFLETLG . ::.. :::. : :..:: :.::. .: ...:. CCDS74 ILGMVVFAFATIT--------PLMFT--------------------GALFSAVACVNSLA 350 360 370 400 410 420 430 440 450 pF1KE0 GVTAVSTFNGIYSATVAWYPGFTFLLSAGLLLLPAISLCVVKCTSWNEGSYELLIQEESS .:: . ::..: ::. .. :: :::.:::::.::. CCDS74 MLTASGIFNSLYPATLNFMKGFPFLLGAGLLLIPAVLIGMLEKADPHLEFQQFPQSP 380 390 400 410 420 430 460 pF1KE0 EDASDR >>CCDS6786.1 SLC46A2 gene_id:57864|Hs108|chr9 (475 aa) initn: 433 init1: 358 opt: 399 Z-score: 482.7 bits: 98.6 E(32554): 1.4e-20 Smith-Waterman score: 577; 30.3% identity (64.2% similar) in 402 aa overlap (56-436:61-459) 30 40 50 60 70 80 pF1KE0 QYVYRRIWEETGNYTFSSDSNISECEKNKSSPIFAFQEEVQKKVSRFNLQMD-ISGLIPG :: :.... :. .: : . .. . :: : CCDS67 VAASLYDAGLLLVVKASYGTGGSSNHSASPSPRGALEDQQQRAISNFYIIYNLVVGLSP- 40 50 60 70 80 90 100 110 120 130 140 pF1KE0 LVSTFILLSISDHYGRKFPMILSSVGALATSVWLCLLCYFAFPFQLLIASTFIGAFCGNY :.:.. : .::.: ::. . .: .: : . . : : . .: ..: ... .... :.. CCDS67 LLSAYGLGWLSDRYHRKISICMSLLGFLLSRLGLLLKVLLDWPVEVLYGAAALNGLFGGF 90 100 110 120 130 140 150 160 170 180 190 200 pF1KE0 TTFWGACFAYIVDQCKEHKQKTIRIAIIDFLLGLVTGLTG-LSSGYFIREL-GFEWSFLI ..::.. .: .: . ...:. .::..:::. :. : ..::...... : . :: CCDS67 SAFWSGVMALGSLGSSEGR-RSVRLILIDLMLGLA-GFCGSMASGHLFKQMAGHSGQGLI 150 160 170 180 190 200 210 220 230 240 pF1KE0 I---AVSLA-VNLIYILFFLGDPVKECS-SQNV----TMSCSEG-FKNL----FYRTYML . .:: : :.: :. : : . . ::.. :.: . : ...: . . : . CCDS67 LTACSVSCASFALLYSLLVLKVPESVAKPSQELPAVDTVSGTVGTYRTLDPDQLDQQYAV 210 220 230 240 250 260 250 260 270 280 290 300 pF1KE0 FKNAS-GK---RRFLLCLLLFTVITYFFVVIGIAPIFILYELDSPLCWNEVFIGYGSALG . : :: .. . ::. .: : ..:.: . .. :. : :: ::.: .::: : : CCDS67 GHPPSPGKAKPHKTTIALLFVGAIIYDLAVVGTVDVIPLFVLREPLGWNQVQVGYGMAAG 270 280 290 300 310 320 310 320 330 340 350 360 pF1KE0 SASFLTSFLGIWLFSYCMEDIHMAFIGIFTTMTGMAMTAFASTTLMMFLARVPFLFTIVP . :.:::::. .:: :..: : .::. . .: . ::.. : :...::. .::...: CCDS67 YTIFITSFLGVLVFSRCFRDTTMIMIGMVSFGSGALLLAFVKETYMFYIARAVMLFALIP 330 340 350 360 370 380 370 380 390 400 410 420 pF1KE0 FSVLRSMLSKVVRSTEQGTLFACIAFLETLGGVTAVSTFNGIYSATVAWYPGFTFLLSAG ...:: .::..... : .:. . . .: ::.. . .: ::. :. . : : ::. CCDS67 VTTIRSAMSKLIKGSSYGKVFVILQLSLALTGVVTSTLYNKIYQLTMDMFVGSCFALSSF 390 400 410 420 430 440 430 440 450 460 pF1KE0 LLLLPAISLCVVKCTSWNEGSYELLIQEESSEDASDR : .: : . .: CCDS67 LSFLAIIPISIVAYKQVPLSPYGDIIEK 450 460 470 461 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 21:01:40 2016 done: Thu Nov 3 21:01:41 2016 Total Scan time: 2.990 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]