FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6355, 349 aa 1>>>pF1KE6355 349 - 349 aa - 349 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9765+/-0.000968; mu= 18.0790+/- 0.058 mean_var=70.6883+/-14.866, 0's: 0 Z-trim(105.3): 25 B-trim: 536 in 1/49 Lambda= 0.152546 statistics sampled from 8431 (8450) to 8431 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.612), E-opt: 0.2 (0.253), width: 16 Scan time: 1.190 The best scores are: opt bits E(33420) CCDS9797.1 SLC10A1 gene_id:6554|Hs109|chr14 ( 349) 2311 517.9 5e-147 CCDS3482.1 SLC10A4 gene_id:201780|Hs109|chr4 ( 437) 766 178.0 1.4e-44 CCDS3614.1 SLC10A6 gene_id:345274|Hs109|chr4 ( 377) 722 168.2 9.9e-42 CCDS9506.1 SLC10A2 gene_id:6555|Hs109|chr13 ( 348) 708 165.1 7.9e-41 CCDS48195.1 SLC10A3 gene_id:8273|Hs109|chrX ( 448) 438 105.8 7.4e-23 CCDS14755.1 SLC10A3 gene_id:8273|Hs109|chrX ( 477) 438 105.8 7.8e-23 CCDS34915.1 SLC10A5 gene_id:347051|Hs109|chr8 ( 438) 410 99.6 5.2e-21 >>CCDS9797.1 SLC10A1 gene_id:6554|Hs109|chr14 (349 aa) initn: 2311 init1: 2311 opt: 2311 Z-score: 2753.3 bits: 517.9 E(33420): 5e-147 Smith-Waterman score: 2311; 100.0% identity (100.0% similar) in 349 aa overlap (1-349:1-349) 10 20 30 40 50 60 pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPKG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 LAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLSI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 VMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 VMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSKR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 PQYMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLLGYVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 PQYMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLLGYVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 SALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGEGLLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 SALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGEGLLL 250 260 270 280 290 300 310 320 330 340 pF1KE6 IAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 IAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA 310 320 330 340 >>CCDS3482.1 SLC10A4 gene_id:201780|Hs109|chr4 (437 aa) initn: 786 init1: 734 opt: 766 Z-score: 914.3 bits: 178.0 E(33420): 1.4e-44 Smith-Waterman score: 766; 36.2% identity (65.5% similar) in 351 aa overlap (3-343:78-426) 10 20 pF1KE6 MEAHNASAPFNFTLPPN---FGKRPTDLALSV : .. .:: :. : : . .:.: CCDS34 LSLGPGPSFGFSPGPTPTPEPTTSGLAGGAASHGPSPFPRPWAPHALPFWDTPLNHGLNV 50 60 70 80 90 100 30 40 50 60 70 80 pF1KE6 ILVFMLFFIMLSLGCTMEFSKIKAHLWKPKGLAIALVAQYGIMPLTAFVLGKVFRLKNIE .. : . ::.::::.. ... ::. .: : .: . :.:..:: ::.:. .:.: .. CCDS34 FVGAALCITMLGLGCTVDVNHFGAHVRRPVGALLAALCQFGLLPLLAFLLALAFKLDEVA 110 120 130 140 150 160 90 100 110 120 130 140 pF1KE6 ALAILVCGCSPGGNLSNVFSLAMKGDMNLSIVMTTCSTFCALGMMPLLLYIYSRGIYDGD :.:.:.::: :::::::..:: . :::::::.:: ::. :: .::: :.::: . . CCDS34 AVAVLLCGCCPGGNLSNLMSLLVDGDMNLSIIMTISSTLLALVLMPLCLWIYSWAWINTP 170 180 190 200 210 220 150 160 170 180 190 200 pF1KE6 LKDKVPYKGIVISLVLVLIPCTIGIVLKSKRPQYMRYVIKGGMIIILLCSVAVTVLSAIN . . .: ....: .::: .:. .. : . :..: .. .:. :.. .... CCDS34 IVQLLPLGTVTLTLCSTLIPIGLGVFIRYKYSRVADYIVKVSLWSLLVTLVVLFIMTGTM 230 240 250 260 270 280 210 220 230 240 250 260 pF1KE6 VGKSIMFAMTPLLIATSSLMPFIGFLLGYVLSALFCLNGRCRRTVSMETGCQNVQLCSTI .: .. .. . . . .::. :. :: :..:: : :.::: .::: ::::::..: CCDS34 LGPELLASIPAAVYVIAIFMPLAGYASGYGLATLFHLPPNCKRTVCLETGSQNVQLCTAI 290 300 310 320 330 340 270 280 290 300 310 320 pF1KE6 LNVAFPPEVIGPLFFFPLLYMIFQLGEGLLLIAIFWCY--EKF--KTPKDK---TKMIYT :..::::. :: ...::::: .:: .:. ... :. : : . . : :. : . : CCDS34 LKLAFPPQFIGSMYMFPLLYALFQSAEAGIFVLIYKMYGSEMLHKRDPLDEDEDTDISYK 350 360 370 380 390 400 330 340 pF1KE6 AATTEETIPGALGNGTYKGEDCSPCTA :: . : : :.:. CCDS34 KLKEEEMADTSYG--TVKAENIIMMETAQTSL 410 420 430 >>CCDS3614.1 SLC10A6 gene_id:345274|Hs109|chr4 (377 aa) initn: 695 init1: 402 opt: 722 Z-score: 862.8 bits: 168.2 E(33420): 9.9e-42 Smith-Waterman score: 722; 38.7% identity (73.6% similar) in 292 aa overlap (24-309:31-313) 10 20 30 40 50 pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKA .:...:. . :. ..:.::::..:. :. . CCDS36 MRANCSSSSACPANSSEEELPVGLEVHGNLELVFTVVSTVMMGLLMFSLGCSVEIRKLWS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 HLWKPKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMK :. .: :.:..:. :.:.::.::..:. : :: ..:.:.:. :: :::..::.:.. . CCDS36 HIRRPWGIAVGLLCQFGLMPFTAYLLAISFSLKPVQAIAVLIMGCCPGGTISNIFTFWVD 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 GDMNLSIVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDK--VPYKGIVISLVLVLIPCT :::.::: :::::: ::::::: .:.:. .. .:... .::..: :.:: . :: . CCDS36 GDMDLSISMTTCSTVAALGMMPLCIYLYT---WSWSLQQNLTIPYQNIGITLVCLTIPVA 130 140 150 160 170 180 190 200 210 220 pF1KE6 IGIVLKSKRPQYMRYVIKGGMII--ILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLM .:. .. . :. . ..: : .. .:: ::: ... ..:. . :.. : .. CCDS36 FGVYVNYRWPKQSKIILKIGAVVGGVLLLVVAV---AGVVLAKG-SWNSDITLLTISFIF 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 PFIGFLLGYVLSALFCLNG--RCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPL :.:: . :..: ::: .. ::: :.:.::: ::.:.: :.:...: : . .. ::: CCDS36 PLIGHVTGFLL-ALFTHQSWQRCR-TISLETGAQNIQMCITMLQLSFTAEHLVQMLSFPL 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 LYMIFQLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPC : .::: .:.:..: . :.. CCDS36 AYGLFQLIDGFLIVAAYQTYKRRLKNKHGKKNSGCTEVCHTRKSTSSRETNAFLEVNEEG 300 310 320 330 340 350 >>CCDS9506.1 SLC10A2 gene_id:6555|Hs109|chr13 (348 aa) initn: 690 init1: 401 opt: 708 Z-score: 846.7 bits: 165.1 E(33420): 7.9e-41 Smith-Waterman score: 708; 38.4% identity (73.4% similar) in 297 aa overlap (25-319:32-322) 10 20 30 40 50 pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAH ..::..:...: ..:.:.::..:..:. .: CCDS95 NDPNSCVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFSMGCNVEIKKFLGH 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 LWKPKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKG . .: :. .... :.::::::.:.:. .: . ..:...:. :: :::. ::... . : CCDS95 IKRPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVDG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 DMNLSIVMTTCSTFCALGMMPLLLYIYSRGIYD-GDLKDKVPYKGIVISLVLVLIPCTIG ::.::. ::::::. ::::::: : ::.. : :.. .:: .: ::: ...: .:: CCDS95 DMDLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSI--VIPYDNIGTSLVSLVVPVSIG 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 IVLKSKRPQYMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIG . .. : :: . ..: : : . : ..:...: .. ..: : : ....: : CCDS95 MFVNHKWPQKAKIILKIGSIAGAILIVLIAVVGGILYQSAWIIA--PKLWIIGTIFPVAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 FLLGYVLSALFCLNG-RCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIF . ::..:. . : ::: ::..::: ::.::::::....: :: .. .: :::.: :: CCDS95 YSLGFLLARIAGLPWYRCR-TVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIF 240 250 260 270 280 290 300 310 320 330 340 pF1KE6 QLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA ::. . ...... :.: . :.:... CCDS95 QLAFAAIFLGFYVAYKKCHG-KNKAEIPESKENGTEPESSFYKANGGFQPDEK 300 310 320 330 340 >>CCDS48195.1 SLC10A3 gene_id:8273|Hs109|chrX (448 aa) initn: 409 init1: 271 opt: 438 Z-score: 524.0 bits: 105.8 E(33420): 7.4e-23 Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:166-408) 10 20 30 40 50 pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK .:. ..: :.:: .:. .:. . .:. CCDS48 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 140 150 160 170 180 190 60 70 80 90 100 110 pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS . ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:. CCDS48 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 200 210 220 230 240 250 120 130 140 150 160 170 pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK : :: :: : :..:: :::: . . .:: . :. .:... :: ..:...::: CCDS48 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK 260 270 280 290 300 310 180 190 200 210 220 230 pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL :.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:. CCDS48 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV 320 330 340 350 360 370 240 250 260 270 280 290 pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE :: :.. . : :::::.:.: :: : ..:.... CCDS48 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE 380 390 400 410 420 430 300 310 320 330 340 pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA CCDS48 MLALVIGHFIYSSLFPVP 440 >>CCDS14755.1 SLC10A3 gene_id:8273|Hs109|chrX (477 aa) initn: 409 init1: 271 opt: 438 Z-score: 523.7 bits: 105.8 E(33420): 7.8e-23 Smith-Waterman score: 438; 32.7% identity (66.1% similar) in 248 aa overlap (30-274:195-437) 10 20 30 40 50 pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLSLGCTMEFSKIKAHLWKPK .:. ..: :.:: .:. .:. . .:. CCDS14 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 170 180 190 200 210 220 60 70 80 90 100 110 pF1KE6 GLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAILVCGCSPGGNLSNVFSLAMKGDMNLS . ..:..:. .::: ::...::: : . ::.... ::::. : .::: . ::..:. CCDS14 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 230 240 250 260 270 280 120 130 140 150 160 170 pF1KE6 IVMTTCSTFCALGMMPLLLYIYSRGIYDGDLKDKVPYKGIVISLVLVLIPCTIGIVLKSK : :: :: : :..:: :::: . . .:: . :. .:... :: ..:...::: CCDS14 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETL-HVPISKILGTLLFIAIPIAVGVLIKSK 290 300 310 320 330 340 180 190 200 210 220 230 pF1KE6 RPQY---MRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMPFIGFLL :.. . :.: ...:: .. . : .: :. .. .. .. .:..:.:. CCDS14 LPKFSQLLLQVVKPFSFVLLLGGL----FLAYRMGVFILAGIRLPIVLVGITVPLVGLLV 350 360 370 380 390 240 250 260 270 280 290 pF1KE6 GYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYMIFQLGE :: :.. . : :::::.:.: :: : ..:.... CCDS14 GYCLATCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSE 400 410 420 430 440 450 300 310 320 330 340 pF1KE6 GLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA CCDS14 MLALVIGHFIYSSLFPVP 460 470 >>CCDS34915.1 SLC10A5 gene_id:347051|Hs109|chr8 (438 aa) initn: 382 init1: 227 opt: 410 Z-score: 490.9 bits: 99.6 E(33420): 5.2e-21 Smith-Waterman score: 410; 30.1% identity (65.0% similar) in 286 aa overlap (30-304:143-418) 10 20 30 40 50 pF1KE6 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLS---LGCTMEFSKIKAHLW ::...: .:.:. .:: .:.. ... .: CCDS34 RLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQT-VW 120 130 140 150 160 170 60 70 80 90 100 110 pF1KE6 K-PKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAI-LVCGCSPGGNLSNVFSLAMKG : : . .. :.:. .::. .:.:... : . .:... ..: : :::. . .:.: . : CCDS34 KRPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTC-PGGGGGYLFALLLDG 180 190 200 210 220 230 120 130 140 150 160 170 pF1KE6 DMNLSIVMTTCSTFCALGMMPLLLYIYSRGI-YDGDLKDKVPYKGIVISLVLVLIPCTIG :..:.:.:: ::. :: :::. ::::: . .: . ..: . :: .:...:.: .:: CCDS34 DFTLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTF--HIPVSKIVSTLLFILVPVSIG 240 250 260 270 280 180 190 200 210 220 pF1KE6 IVLKSKRPQ---YMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLL--IATSSL ::.: . :. ... .:. .:... .. .: ..:: ..: : : : . : CCDS34 IVIKHRIPEKASFLERIIRPLSFILMFVGIYLT----FTVG--LVFLKTDNLEVILLGLL 290 300 310 320 330 340 230 240 250 260 270 280 pF1KE6 MPFIGFLLGYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLL .: .:.:.:: .. . : .::..:.: : : ......:: . :. CCDS34 VPALGLLFGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFT 350 360 370 380 390 400 290 300 310 320 330 340 pF1KE6 YMIFQLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCT . . : ::.: .. CCDS34 VAMCSGCEMLLIILVYKAKKRCIFFLQDKRKRNFLI 410 420 430 349 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Jul 14 21:19:40 2018 done: Sat Jul 14 21:19:41 2018 Total Scan time: 1.190 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]