FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3831, 701 aa
1>>>pF1KB3831 701 - 701 aa - 701 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9761+/-0.000862; mu= 21.8202+/- 0.051
mean_var=67.3875+/-13.598, 0's: 0 Z-trim(107.0): 29 B-trim: 312 in 1/49
Lambda= 0.156237
statistics sampled from 9285 (9312) to 9285 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.286), width: 16
Scan time: 4.150
The best scores are: opt bits E(32554)
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 4598 1045.7 0
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 2140 491.7 1.7e-138
CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 1298 301.5 9e-82
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 1293 300.8 5.2e-81
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 1180 275.3 2.4e-73
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 993 233.1 1.1e-60
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 993 233.1 1.1e-60
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 990 232.4 1.8e-60
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 990 232.4 1.8e-60
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 990 232.5 1.8e-60
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 990 232.5 1.8e-60
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 849 200.5 5e-51
CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 802 190.1 1e-47
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 783 185.8 2.1e-46
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 783 185.8 2.3e-46
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 778 184.6 4e-46
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 766 181.9 2.8e-45
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 764 181.6 4.8e-45
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 741 176.3 1.3e-43
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 741 176.3 1.3e-43
CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 646 154.8 3.2e-37
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 464 113.9 1e-24
CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 439 108.0 2.5e-23
CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 390 96.9 5e-20
>>CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 (701 aa)
initn: 4598 init1: 4598 opt: 4598 Z-score: 5594.6 bits: 1045.7 E(32554): 0
Smith-Waterman score: 4598; 100.0% identity (100.0% similar) in 701 aa overlap (1-701:1-701)
10 20 30 40 50 60
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 GPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 VATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 EMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 TVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAAT
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 CMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVF
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 RFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKEGGSETGVGEGGPAQGEDLGPVSTRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKEGGSETGVGEGGPAQGEDLGPVSTRA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 ALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRG
610 620 630 640 650 660
670 680 690 700
pF1KB3 GFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL
:::::::::::::::::::::::::::::::::::::::::
CCDS33 GFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL
670 680 690 700
>>CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 (739 aa)
initn: 2183 init1: 1450 opt: 2140 Z-score: 2600.0 bits: 491.7 E(32554): 1.7e-138
Smith-Waterman score: 2160; 48.4% identity (78.5% similar) in 678 aa overlap (17-687:56-719)
10 20 30 40
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCV
..::. . ...:.. .: .:.:: .
CCDS43 GIHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKA
30 40 50 60 70 80
50 60 70 80 90 100
pF1KB3 RALVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSF
. .. .::. .:: .: .. . :::::::..::.::::.:::::::: .:.:.:::::
CCDS43 KNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSF
90 100 110 120 130 140
110 120 130 140 150 160
pF1KB3 FANLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPG--ANSSTLNG
::..::::.:::::.:::::..::::.:..:::::: ::.: .... . : .:.::: .
CCDS43 FASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLN
150 160 170 180 190 200
170 180 190 200 210 220
pF1KB3 SAAMLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTIL
.. : ..:::: :....:...:.::: :: ...::::.:::. ::.::. ::: :::
CCDS43 HTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTIL
210 220 230 240 250 260
230 240 250 260 270 280
pF1KB3 TSQLKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRY
::: :.:::. .:: .: : .. ::. ..:. ..:.::..:: .:: ::: .:::....
CCDS43 TSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHF
270 280 290 300 310 320
290 300 310 320 330 340
pF1KB3 RHRLRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALD
. .:..:.: ::.:.:.:::.::::.::. ..::.:: ::::::::.::: :. ::.:
CCDS43 KSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVD
330 340 350 360 370 380
350 360 370 380 390 400
pF1KB3 AVALALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLV
:.:..... :...::.::::..:::.:.::::. :.: ::..:.:.:::.:::::::.::
CCDS43 AIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLV
390 400 410 420 430 440
410 420 430 440 450 460
pF1KB3 KTATGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLW
: .:::.::::.::.: :.:::::..::::..::.:::. . .:.::::::: :::..:
CCDS43 KESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMW
450 460 470 480 490 500
470 480 490 500 510 520
pF1KB3 RMSPADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYED
.: :...: : . :.::: :::.:: .:.. . :::.:...::. . .. .:.
CCDS43 SISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFES
510 520 530 540 550 560
530 540 550 560 570
pF1KB3 ATEFEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-----AGCMAARRKEGGSE
.. ...: .::...::: .:::: ::. : ..::. : : ::.:: .:
CCDS43 VSAYKNLQIKPGIKIFRFVAPLYYINKECFKSALYKQTVNPILIKVAWKKAAKRK--IKE
570 580 590 600 610 620
580 590 600 610 620 630
pF1KB3 TGVGEGGPAQGEDLGPVSTRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGA
: :: : : .:.. . : .::.::::. . :::.::. ::...:::: :
CCDS43 KVVTLGG-IQDE----MSVQLSHDPLE--LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEA
630 640 650 660 670
640 650 660 670 680 690
pF1KB3 LGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDA
.::..::: :.: ::: :. : . . ::. :: ::..:. :
CCDS43 IGIQVLLAQCNPTVRDSLTNGEYCKK-----EEENLLFYSVYEAMAFAEVSKNQKGVCVP
680 690 700 710 720 730
700
pF1KB3 HL
CCDS43 NGLSLSSD
>>CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 (224 aa)
initn: 1320 init1: 1298 opt: 1298 Z-score: 1581.6 bits: 301.5 E(32554): 9e-82
Smith-Waterman score: 1298; 98.5% identity (99.0% similar) in 196 aa overlap (1-196:1-196)
10 20 30 40 50 60
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ
::::::::::::. :
CCDS33 ATALTLMTGLYQTSWGRNSFQQHPWQLTQRSDSQELLEEEERSC
190 200 210 220
>>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa)
initn: 1371 init1: 976 opt: 1293 Z-score: 1567.9 bits: 300.8 E(32554): 5.2e-81
Smith-Waterman score: 1355; 32.6% identity (68.9% similar) in 700 aa overlap (28-684:43-726)
10 20 30 40 50
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPAT
:. :. : :::: . .... :.:
CCDS57 LPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPIL
20 30 40 50 60 70
60 70 80 90 100 110
pF1KB3 RWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGT
.:: .:: .:.: .::.::. :.. . :..::.:::.. :.::..:: : ::..::
CCDS57 EWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGT
80 90 100 110 120 130
120 130 140 150 160 170
pF1KB3 SRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCG-RDCY
:::.::: : .. ::::.:: :..: :.. : ..:...:: . :.: . ::
CCDS57 SRHISVGPFPVVSLMVGSVV---LSMA---PDEHFLVSSSNGTVLNTT--MIDTAARDTA
140 150 160 170 180
180 190 200 210 220 230
pF1KB3 AIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRI
. .:.::::..:. :...: :..::. ::..::. ::. .:. .:.:::: .:.:
CCDS57 RVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVST
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB3 PRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTEL
..: .. : . .... :..:. : ... . ..: .:.:::.::.::.. ::.: :.
CCDS57 KNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEV
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB3 LVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFS
.: ..:: .:. ..:.: ...... .:: ::.::..: :.... . ..:.:: :..
CCDS57 IVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIA
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB3 ISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSS
.:.....: .. :.. .:::..: : :.. .:. ::....::... :. .:: .::...
CCDS57 VSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAG
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB3 VVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAG
..::..:....:::. :.. ::.:::: :....:.: . .. :.:::::.. ::..:.
CCDS57 IISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVF
430 440 450 460 470 480
480 490 500 510 520 530
pF1KB3 TAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPG
: . .... . :::::.:..::... :.: : :. : .: .:... ..... :
CCDS57 TCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQG
490 500 510 520 530 540
540 550 560 570 580
pF1KB3 VRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARR-----------KEG---GSETGV
:...::..:..:.: : : . . : .:.:: . .: : : ....:.
CCDS57 VKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRATKNGI
550 560 570 580 590 600
590 600 610
pF1KB3 GEGG--------PAQG-EDLG-------------------PVSTRAALVPAAAGFHTVVI
. : . ::: ::.. . :: .:..:.
CCDS57 ISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVP----IHSLVL
610 620 630 640 650 660
620 630 640 650 660 670
pF1KB3 DCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEE
::. . :::..:: .:. . ... . ... .: . : . : . ::. :. ...
CCDS57 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFD----DNIRKD
670 680 690 700 710
680 690 700
pF1KB3 QLFLSVHDAVQTARARHRELEATDAHL
.::.::::.
CCDS57 TFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMR
720 730 740 750 760 770
>>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa)
initn: 1209 init1: 817 opt: 1180 Z-score: 1430.4 bits: 275.3 E(32554): 2.4e-73
Smith-Waterman score: 1186; 32.0% identity (64.0% similar) in 691 aa overlap (37-684:42-717)
10 20 30 40 50 60
pF1KB3 PLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWLRQYRPR
: :::: .. .: .:.: . :: :: .
CCDS57 ARPVYSTNAFEENHKKTGRHHKTFLDHLKVC-CSCSPQKAKRIVLSLFPIASWLPAYRLK
20 30 40 50 60 70
70 80 90 100 110 120
pF1KB3 EYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRHVSVGIF
:.: .:..::. ::. : :..:..::. . :.:.::.::: .::...:::::.::: :
CCDS57 EWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFGTSRHISVGPF
80 90 100 110 120 130
130 140 150 160 170 180
pF1KB3 SLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRVATA--L
.: .::: .:. .. : :.... : ... :.: .:: : .:::.: .
CCDS57 PILSMMVGLAVSGAVSKAV--PDRNATTLGLPNNSNNSS--LLDDER----VRVAAAASV
140 150 160 170 180
190 200 210 220 230 240
pF1KB3 TLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQGPGM
:...:. :. .:.::.::: :::. :..::. .:.: .:.:::: .. . .: : :
CCDS57 TVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDPVS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 VVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIVVATL
. . :.. ..:. :.::. . : :. .::...:.. .: ::.: :... :.:.
CCDS57 IFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIAAG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 VSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLAEMFA
::. ....:: .:.::. ::.:: .:. . .: .. : ..:.:: : ..:.: ...
CCDS57 VSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASVYS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 RSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSATVVL
.. : . .::::.:.: :.. . .. :: :.::..: :. .:: .::......: .::
CCDS57 LKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAIIVL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 LVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAATCMLV
.:.::.. :. ::.:::: . . .:.: : . .. :::: . : :.: : ...
CCDS57 IVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTIVL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 STEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVFRFGG
. :: :.: ..::... ::: :. . :: :: : .:.. .. . ::..:: .
CCDS57 GLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRCPS
490 500 510 520 530 540
550 560 570 580
pF1KB3 PLYYANKDFFLQSLYSLTG------LDAGCMAARRKEGGSETGVGEGGPA----------
:.:.:: :: ..: . .: : : :. . .. :. . :
CCDS57 PIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDTIK
550 560 570 580 590 600
590 600 610 620
pF1KB3 -QGEDLG---------PVSTR--------------AALVPAAAGFHTVVIDCAPLLFLDA
. :.: :..: :: . .:....: . . :::.
CCDS57 DSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS-LHSLILDFSAVSFLDV
610 620 630 640 650 660
630 640 650 660 670 680
pF1KB3 AGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFL-GEGPGDTAEEEQLFLSVHDA
..: :... ... . ... .. . . :.: :. :: .. .::..:::
CCDS57 SSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGE-----VKSSIFFLTIHDA
670 680 690 700 710
690 700
pF1KB3 VQTARARHRELEATDAHL
:
CCDS57 VLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
720 730 740 750 760
>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa)
initn: 1374 init1: 969 opt: 993 Z-score: 1203.2 bits: 233.1 E(32554): 1.1e-60
Smith-Waterman score: 1366; 33.4% identity (69.3% similar) in 668 aa overlap (16-650:26-680)
10 20 30 40
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRG-LREMLKARLWCSCSCSVLCVRAL
:: ..: . . . . .: . .:. .: .
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB3 VQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFAN
. .:: :.:: :. .::. ::..::. :.. .::..:...::.. ::..::.::.
CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB3 LIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAML
..: ..:::::.:.: :... ::.: :. : . :. : . ::. ..: ::. :
CCDS43 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLV------PD-DIVIPGGVNAT-NGTEA--
130 140 150 160 170
170 180 190 200 210 220
pF1KB3 DCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLK
:: ..:: ..::..:. : .:: :.:::. ::..::. ::. .:.: ..::.::
CCDS43 ---RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK
180 190 200 210 220
230 240 250 260 270 280
pF1KB3 HLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLR
.:.::. :..: :: . ...:... . :::.. .. . ...::..::...:....:
CCDS43 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP
230 240 250 260 270 280
290 300 310 320 330 340
pF1KB3 VPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALA
.:.: :....:..: .: .:.. .. .:.: .: :..:: :. :.. : .::.:.:
CCDS43 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA
290 300 310 320 330 340
350 360 370 380 390 400
pF1KB3 LVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATG
.:. . .::.:. .: .:::.: .::::.:.: :: . .... :. : .:..:::. .::
CCDS43 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG
350 360 370 380 390 400
410 420 430 440 450 460
pF1KB3 CRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPA
.:::.. ... ..:::.:: . ::..: ..::. ...:.:.: . . ::: .:: :
CCDS43 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI
410 420 430 440 450 460
470 480 490 500 510 520
pF1KB3 DALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFE
. .: : .. .... . ::...::..::.. ::: : .:... .: : : .:
CCDS43 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE
470 480 490 500 510 520
530 540 550 560 570 580
pF1KB3 GLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-AGCMAARRK---EGGSETG----
. ::...:....:.::::.:.. ..: ::.. : :.:::: . ..:.:
CCDS43 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM
530 540 550 560 570 580
590 600 610
pF1KB3 -----VGEGGPAQGED------------LGPVSTRAAL-------VPAAAGFHTVVIDCA
: . ..::: :. .... .: . . :::..: .
CCDS43 ANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFMPPGDNVHTVILDFT
590 600 610 620 630 640
620 630 640 650 660 670
pF1KB3 PLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLF
. :.:..::.:: . ..:: .:: . :: ::
CCDS43 QVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR
650 660 670 680
680 690 700
pF1KB3 LSVHDAVQTARARHRELEATDAHL
>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa)
initn: 1405 init1: 969 opt: 993 Z-score: 1202.7 bits: 233.1 E(32554): 1.1e-60
Smith-Waterman score: 1426; 33.8% identity (68.6% similar) in 717 aa overlap (16-697:26-725)
10 20 30 40
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRG-LREMLKARLWCSCSCSVLCVRAL
:: ..: . . . . .: . .:. .: .
CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB3 VQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFAN
. .:: :.:: :. .::. ::..::. :.. .::..:...::.. ::..::.::.
CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB3 LIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAML
..: ..:::::.:.: :... ::.: :. : . :. : . ::. ..: ::. :
CCDS57 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLV------PD-DIVIPGGVNAT-NGTEA--
130 140 150 160 170
170 180 190 200 210 220
pF1KB3 DCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLK
:: ..:: ..::..:. : .:: :.:::. ::..::. ::. .:.: ..::.::
CCDS57 ---RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK
180 190 200 210 220
230 240 250 260 270 280
pF1KB3 HLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLR
.:.::. :..: :: . ...:... . :::.. .. . ...::..::...:....:
CCDS57 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP
230 240 250 260 270 280
290 300 310 320 330 340
pF1KB3 VPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALA
.:.: :....:..: .: .:.. .. .:.: .: :..:: :. :.. : .::.:.:
CCDS57 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA
290 300 310 320 330 340
350 360 370 380 390 400
pF1KB3 LVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATG
.:. . .::.:. .: .:::.: .::::.:.: :: . .... :. : .:..:::. .::
CCDS57 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG
350 360 370 380 390 400
410 420 430 440 450 460
pF1KB3 CRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPA
.:::.. ... ..:::.:: . ::..: ..::. ...:.:.: . . ::: .:: :
CCDS57 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI
410 420 430 440 450 460
470 480 490 500 510 520
pF1KB3 DALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFE
. .: : .. .... . ::...::..::.. ::: : .:... .: : : .:
CCDS57 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE
470 480 490 500 510 520
530 540 550 560 570 580
pF1KB3 GLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-AGCMAARRK---EGGSETG----
. ::...:....:.::::.:.. ..: ::.. : :.:::: . ..:.:
CCDS57 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM
530 540 550 560 570 580
590 600 610
pF1KB3 -----VGEGGPAQGED------------LGPVSTRAAL-------VPAAAGFHTVVIDCA
: . ..::: :. .... .: . . :::..: .
CCDS57 ANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFMPPGDNVHTVILDFT
590 600 610 620 630 640
620 630 640 650 660 670
pF1KB3 PLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLF
. :.:..::.:: . ..:: .:: . :: :: : . :.:. :. :.: : : ::
CCDS57 QVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFF-ENP---ALWELLF
650 660 670 680 690 700
680 690 700
pF1KB3 LSVHDAVQTARARHR--ELEATDAHL
:.:::: .. :. : ::.
CCDS57 HSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA
710 720 730 740
>>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa)
initn: 1377 init1: 959 opt: 990 Z-score: 1199.1 bits: 232.4 E(32554): 1.8e-60
Smith-Waterman score: 1316; 33.3% identity (65.7% similar) in 720 aa overlap (19-681:25-715)
10 20 30 40 50
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLL
: ::: . : : .:: . . ::. . :
CCDS46 MDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYALLLQHL
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 PATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFL
:. :: .: :..: ::..::: ..:. .::..::.::::: :...::.::. .::::
CCDS46 PVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 MGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAAMLDCGR
.:::::.::: :... .:::.:.. .: : : :.: .: .: :
CCDS46 FGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA------R
120 130 140 150
180 190 200 210 220 230
pF1KB3 DCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLG
: ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...::::...:
CCDS46 DAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFG
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB3 VRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLP
... :.:: .. : : . :..: :::..: .::...: :.:. ...: .:.:
CCDS46 LHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIP
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB3 TELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAA
:::... :: .:. :..:: .:.:.::.:..:: .:. .:..... .: ..:.:.
CCDS46 GELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGF
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB3 AFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQ
:..:::...:: ::: : .::::.:.: :.. ....:: .: ....:::. .:: .:
CCDS46 AIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQ
340 350 360 370 380 390
420 430 440 450 460 470
pF1KB3 LSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALV
.....:. .::... :. ::::: ..::: .:.:.:.: ::.. :. ::. . :: :.
CCDS46 VAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLI
400 410 420 430 440 450
480 490 500 510 520 530
pF1KB3 WAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVP
: : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..:.
CCDS46 WLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKE
460 470 480 490 500 510
540 550 560 570
pF1KB3 EPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAAR---------------------
::.::: .. .:.:: .:. ..: . :.:. . ..
CCDS46 VRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEK
520 530 540 550 560 570
580 590
pF1KB3 -RKEGGSETGVG-------------------------------EGGPAQGEDLGPV---S
::...: :.. : . :.:.. . . :
CCDS46 LRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGS
580 590 600 610 620 630
600 610 620 630 640 650
pF1KB3 TRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDIL
: :: ::....: . : :.:.. ...:... .:. . . . .: : :: . :
CCDS46 TLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQL
640 650 660 670 680 690
660 670 680 690 700
pF1KB3 SRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL
: :. . ...:: :::
CCDS46 EAGHFFDA----SITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
700 710 720 730
>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa)
initn: 1400 init1: 982 opt: 990 Z-score: 1199.1 bits: 232.4 E(32554): 1.8e-60
Smith-Waterman score: 1371; 34.3% identity (67.0% similar) in 712 aa overlap (19-692:46-728)
10 20 30 40
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRA
: ::: . : : .:: . . :
CCDS46 LSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYA
20 30 40 50 60
50 60 70 80 90 100
pF1KB3 LVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFA
:. . ::. :: .: :..: ::..::: ..:. .::..::.::::: :...::.::.
CCDS46 LLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYP
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB3 NLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAA
.::::.:::::.::: :... .:::.:.. .: : : :.: .: .:
CCDS46 VFIYFLFGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA-
130 140 150 160 170
170 180 190 200 210 220
pF1KB3 MLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQ
:: ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...::
CCDS46 -----RDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQ
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB3 LKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHR
::...:... :.:: .. : : . :..: :::..: .::...: :.:. ...
CCDS46 LKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQ
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB3 LRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVA
: .:.: :::... :: .:. :..:: .:.:.::.:..:: .:. .:..... .: .
CCDS46 LPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFT
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB3 LALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTA
.:.:. :..:::...:: ::: : .::::.:.: :.. ....:: .: ....:::. .
CCDS46 IAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQES
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB3 TGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMS
:: .:.....:. .::... :. ::::: ..::: .:.:.:.: ::.. :. ::. .
CCDS46 TGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKAN
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB3 PADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATE
:: :.: : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..:
CCDS46 RADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAE
480 490 500 510 520 530
530 540 550 560 570
pF1KB3 FEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKE------------
. ::.::: .. .:.:: .:. ..: . :.:. . ...:.
CCDS46 YSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQ
540 550 560 570 580 590
580 590 600 610
pF1KB3 -GGSETGVGEGGPAQGEDLGP--VSTRAALVPAAAG----------------------FH
: ..:: . :.: ::. . :.:. ::
CCDS46 LQKEEKLRKQAGPLLSACLAPQQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFH
600 610 620 630 640 650
620 630 640 650 660 670
pF1KB3 TVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDT
....: . : :.:.. ...:... .:. . . . .: : :: . : : :. .
CCDS46 SLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDA----S
660 670 680 690 700
680 690 700
pF1KB3 AEEEQLFLSVHDAVQTARARHRELEATDAHL
...:: :::::: : . :
CCDS46 ITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
710 720 730 740
>>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa)
initn: 1377 init1: 959 opt: 990 Z-score: 1199.0 bits: 232.5 E(32554): 1.8e-60
Smith-Waterman score: 1326; 33.5% identity (65.8% similar) in 720 aa overlap (19-682:46-736)
10 20 30 40
pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRA
: ::: . : : .:: . . :
CCDS46 LSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYA
20 30 40 50 60
50 60 70 80 90 100
pF1KB3 LVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFA
:. . ::. :: .: :..: ::..::: ..:. .::..::.::::: :...::.::.
CCDS46 LLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYP
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB3 NLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAA
.::::.:::::.::: :... .:::.:.. .: : : :.: .: .:
CCDS46 VFIYFLFGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA-
130 140 150 160 170
170 180 190 200 210 220
pF1KB3 MLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQ
:: ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...::
CCDS46 -----RDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQ
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB3 LKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHR
::...:... :.:: .. : : . :..: :::..: .::...: :.:. ...
CCDS46 LKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQ
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB3 LRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVA
: .:.: :::... :: .:. :..:: .:.:.::.:..:: .:. .:..... .: .
CCDS46 LPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFT
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB3 LALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTA
.:.:. :..:::...:: ::: : .::::.:.: :.. ....:: .: ....:::. .
CCDS46 IAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQES
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB3 TGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMS
:: .:.....:. .::... :. ::::: ..::: .:.:.:.: ::.. :. ::. .
CCDS46 TGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKAN
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB3 PADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATE
:: :.: : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..:
CCDS46 RADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAE
480 490 500 510 520 530
530 540 550 560 570
pF1KB3 FEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAAR---------------
. ::.::: .. .:.:: .:. ..: . :.:. . ..
CCDS46 YSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQ
540 550 560 570 580 590
580 590
pF1KB3 -------RKEGGSETGVG------------------------------EGGPAQGEDLGP
::...: :.. : . :.:.. .
CCDS46 LQKEEKLRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSK
600 610 620 630 640 650
600 610 620 630 640 650
pF1KB3 V---STRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPP
. :: :: ::....: . : :.:.. ...:... .:. . . . .: : :
CCDS46 APDGSTLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSP
660 670 680 690 700 710
660 670 680 690 700
pF1KB3 VRDILSRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL
: . : : :. . ...:: ::::
CCDS46 VVSQLEAGHFFDA----SITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
720 730 740 750
701 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:02:30 2016 done: Thu Nov 3 14:02:31 2016
Total Scan time: 4.150 Total Display time: 0.220
Function used was FASTA [36.3.4 Apr, 2011]