FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2586, 791 aa
1>>>pF1KE2586 791 - 791 aa - 791 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.5745+/-0.00104; mu= 10.0623+/- 0.062
mean_var=116.2935+/-23.259, 0's: 0 Z-trim(107.4): 32 B-trim: 23 in 1/49
Lambda= 0.118931
statistics sampled from 9553 (9579) to 9553 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.294), width: 16
Scan time: 2.520
The best scores are: opt bits E(32554)
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 5179 900.1 0
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 5179 900.1 0
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 1724 307.3 6.1e-83
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 1724 307.3 6.3e-83
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 1722 306.9 8e-83
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 1535 274.8 3.6e-73
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1484 266.1 1.4e-70
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1484 266.1 1.5e-70
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 1430 256.8 9.9e-68
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 1393 250.5 7.9e-66
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 1320 237.9 3.3e-62
CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 1123 204.1 6.5e-52
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 1090 198.4 3.1e-50
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 1082 197.1 8.7e-50
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 983 180.1 1.5e-44
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 946 173.7 8.4e-43
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 946 173.7 8.5e-43
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 881 162.6 2.1e-39
CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 828 153.4 5.7e-37
CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 786 146.3 1.3e-34
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 783 145.8 2.3e-34
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 520 100.7 1.1e-20
CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 365 74.0 5e-13
CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 340 69.8 1.6e-11
>>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 (791 aa)
initn: 5179 init1: 5179 opt: 5179 Z-score: 4805.8 bits: 900.1 E(32554): 0
Smith-Waterman score: 5179; 99.9% identity (100.0% similar) in 791 aa overlap (1-791:1-791)
10 20 30 40 50 60
pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 WLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV
:::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 WLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG
730 740 750 760 770 780
790
pF1KE2 SMFHAETLTAL
:::::::::::
CCDS30 SMFHAETLTAL
790
>>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 (887 aa)
initn: 5179 init1: 5179 opt: 5179 Z-score: 4805.0 bits: 900.1 E(32554): 0
Smith-Waterman score: 5179; 99.9% identity (100.0% similar) in 791 aa overlap (1-791:1-791)
10 20 30 40 50 60
pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 WLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV
:::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 WLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG
730 740 750 760 770 780
790
pF1KE2 SMFHAETLTAL
:::::::::::
CCDS30 SMFHAETLTALESLSAAGGCYPYRSESLVSPLFTRQALAAMDKPPAHSTPPTSALSLAAE
790 800 810 820 830 840
>>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa)
initn: 1316 init1: 1178 opt: 1724 Z-score: 1602.5 bits: 307.3 E(32554): 6.1e-83
Smith-Waterman score: 1724; 37.2% identity (73.1% similar) in 713 aa overlap (32-744:30-728)
10 20 30 40 50 60
pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW
: .. :. ..:: :. :... :::: :
CCDS46 MDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH
:: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: .
CCDS46 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA
.. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :..
CCDS46 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF
..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...:
CCDS46 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC
...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: :
CCDS46 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY
. .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .:::
CCDS46 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV
::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... ..
CCDS46 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG
:: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: :
CCDS46 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA
..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .:::
CCDS46 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD
:.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. .
CCDS46 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT
... .:: . .:: : :. : .. ...:: . : . : :
CCDS46 VNTSLEDMRSNNVEDCKMMQVS----SGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD
600 610 620 630 640
670 680 690 700 710 720
pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL
::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:.
CCDS46 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI
650 660 670 680 690 700
730 740 750 760 770 780
pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS
::.: :.:::: :: . : :
CCDS46 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
710 720 730
>>CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 (759 aa)
initn: 1316 init1: 1178 opt: 1724 Z-score: 1602.3 bits: 307.3 E(32554): 6.3e-83
Smith-Waterman score: 1724; 37.2% identity (73.1% similar) in 713 aa overlap (32-744:51-749)
10 20 30 40 50 60
pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW
: .. :. ..:: :. :... :::: :
CCDS43 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW
30 40 50 60 70 80
70 80 90 100 110 120
pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH
:: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: .
CCDS43 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR
90 100 110 120 130 140
130 140 150 160 170 180
pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA
.. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :..
CCDS43 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG
150 160 170 180 190
190 200 210 220 230 240
pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF
..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...:
CCDS43 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV
200 210 220 230 240 250
250 260 270 280 290 300
pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC
...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: :
CCDS43 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM
260 270 280 290 300 310
310 320 330 340 350 360
pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY
. .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .:::
CCDS43 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY
320 330 340 350 360 370
370 380 390 400 410 420
pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV
::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... ..
CCDS43 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK
380 390 400 410 420 430
430 440 450 460 470 480
pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG
:: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: :
CCDS43 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG
440 450 460 470 480 490
490 500 510 520 530 540
pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA
..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .:::
CCDS43 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA
500 510 520 530 540 550
550 560 570 580 590 600
pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD
:.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. .
CCDS43 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN
560 570 580 590 600 610
610 620 630 640 650 660
pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT
... .:: . .:: : :. : .. ...:: . : . : :
CCDS43 VNTSLEDMRSNNVEDCKMMQVS----SGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD
620 630 640 650 660
670 680 690 700 710 720
pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL
::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:.
CCDS43 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS
::.: :.:::: :: . : :
CCDS43 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
730 740 750
>>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa)
initn: 1316 init1: 1178 opt: 1722 Z-score: 1600.5 bits: 306.9 E(32554): 8e-83
Smith-Waterman score: 1722; 37.2% identity (73.2% similar) in 713 aa overlap (32-744:51-748)
10 20 30 40 50 60
pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW
: .. :. ..:: :. :... :::: :
CCDS46 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW
30 40 50 60 70 80
70 80 90 100 110 120
pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH
:: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: .
CCDS46 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR
90 100 110 120 130 140
130 140 150 160 170 180
pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA
.. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :..
CCDS46 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG
150 160 170 180 190
190 200 210 220 230 240
pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF
..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...:
CCDS46 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV
200 210 220 230 240 250
250 260 270 280 290 300
pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC
...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: :
CCDS46 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM
260 270 280 290 300 310
310 320 330 340 350 360
pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY
. .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .:::
CCDS46 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY
320 330 340 350 360 370
370 380 390 400 410 420
pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV
::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... ..
CCDS46 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK
380 390 400 410 420 430
430 440 450 460 470 480
pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG
:: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: :
CCDS46 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG
440 450 460 470 480 490
490 500 510 520 530 540
pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA
..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .:::
CCDS46 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA
500 510 520 530 540 550
550 560 570 580 590 600
pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD
:.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. .
CCDS46 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN
560 570 580 590 600 610
610 620 630 640 650 660
pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT
:. : .: : . .... : :. : .. ...:: . : . : :
CCDS46 V-NTSLEDMRSN----NVEDCKMMVSSGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD
620 630 640 650 660
670 680 690 700 710 720
pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL
::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:.
CCDS46 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS
::.: :.:::: :: . : :
CCDS46 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
730 740 750
>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa)
initn: 1706 init1: 1178 opt: 1535 Z-score: 1427.2 bits: 274.8 E(32554): 3.6e-73
Smith-Waterman score: 1697; 37.4% identity (72.4% similar) in 713 aa overlap (32-744:51-730)
10 20 30 40 50 60
pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW
: .. :. ..:: :. :... :::: :
CCDS46 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW
30 40 50 60 70 80
70 80 90 100 110 120
pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH
:: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: .
CCDS46 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR
90 100 110 120 130 140
130 140 150 160 170 180
pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA
.. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :..
CCDS46 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG
150 160 170 180 190
190 200 210 220 230 240
pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF
..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...:
CCDS46 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV
200 210 220 230 240 250
250 260 270 280 290 300
pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC
...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: :
CCDS46 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM
260 270 280 290 300 310
310 320 330 340 350 360
pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY
. .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .:::
CCDS46 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY
320 330 340 350 360 370
370 380 390 400 410 420
pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV
::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... ..
CCDS46 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK
380 390 400 410 420 430
430 440 450 460 470 480
pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG
:: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: :
CCDS46 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG
440 450 460 470 480 490
490 500 510 520 530 540
pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA
..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .:::
CCDS46 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA
500 510 520 530 540 550
550 560 570 580 590 600
pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD
:.:.. . . . :.: . .. :.: :::::. ... :....: .. . :
CCDS46 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAGPLLSACLAP-
560 570 580 590 600 610
610 620 630 640 650 660
pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT
... : .. : ::: . ::..: : . .: : :. :
CCDS46 -QQVSSGDKMEDAT-ANG--------QEDSKAPDGS----TLKALGLPQ------P---D
620 630 640
670 680 690 700 710 720
pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL
::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:.
CCDS46 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI
650 660 670 680 690 700
730 740 750 760 770 780
pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS
::.: :.:::: :: . : :
CCDS46 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
710 720 730 740
>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa)
initn: 1548 init1: 1027 opt: 1484 Z-score: 1380.5 bits: 266.1 E(32554): 1.4e-70
Smith-Waterman score: 1584; 36.3% identity (71.9% similar) in 700 aa overlap (7-704:15-681)
10 20 30 40 50
pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYP--VGEKLRNAFRCSSAKIKA
:: :.: .: ....... ::.. : ...::..:: :. ::.
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKV-PDSIADKLKQAFTCTPKKIRN
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 VVFGLLPVLSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFP
... .::. .::: ::.:.:.. ::..:.: : .:.:::.:::.:: .: . ::::::.:
CCDS43 IIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 LLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERL
.. : ::: ... : :::::...:.. ..:.:.. :. ...: . : : .: :.
CCDS43 VIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDI--VIPGGVNATN-GTEARDALRV
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 HVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPS
.:. ... :..:::. :: .::::::::.: ..::: :::..... :.:::.::.
CCDS43 KVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKR
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 YTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIV
:.: :.:.. . . .:. . :. :: .:. ..:. ::.: :. .:. ::: :...
CCDS43 YSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFA
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 VVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLA
::..:.::.: .. ..:....:: . :. :..: .: .. . :...:::.. ....
CCDS43 VVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTIS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 MGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLC
:..::::::::.::.:::.:::: : .::.:. : :.:: .:. .:.:::.:.:.
CCDS43 MAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCL
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 VSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSF
.::......:. :. . ::..::.:.. ::::. . :..: ..:: ::.. ::...:
CCDS43 ASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTF
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 LSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIK
.::.::.: ::. ..: ...:.:...:: . .:... .::.:.. .:.....: :::
CCDS43 VSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVKEIPGIK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 IITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKT
:. .:.:.:::... . . :::..: .. :..: ..: :. . : .
CCDS43 IFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNAN-------MAN
540 550 560 570 580
600 610 620 630 640 650
pF1KE2 KTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPS
:: . . : :.: : :... .: :.: :: .. :
CCDS43 ATVVKADAEVDGEDA--TKPEEE----DGE-VKY--------------PPIVIKST-FPE
590 600 610 620
660 670 680 690 700 710
pF1KE2 DMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDI
.: .:: . ::.:::.. :.:.: .:.:.:: . . :: .:. :.:.. :
CCDS43 EMQRFMPPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR
630 640 650 660 670 680
720 730 740 750 760 770
pF1KE2 SHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRS
>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa)
initn: 1627 init1: 1027 opt: 1484 Z-score: 1379.9 bits: 266.1 E(32554): 1.5e-70
Smith-Waterman score: 1668; 36.2% identity (71.5% similar) in 755 aa overlap (7-759:15-733)
10 20 30 40 50
pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYP--VGEKLRNAFRCSSAKIKA
:: :.: .: ....... ::.. : ...::..:: :. ::.
CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKV-PDSIADKLKQAFTCTPKKIRN
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 VVFGLLPVLSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFP
... .::. .::: ::.:.:.. ::..:.: : .:.:::.:::.:: .: . ::::::.:
CCDS57 IIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 LLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERL
.. : ::: ... : :::::...:.. ..:.:.. :. ...: . : : .: :.
CCDS57 VIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDI--VIPGGVNATN-GTEARDALRV
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 HVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPS
.:. ... :..:::. :: .::::::::.: ..::: :::..... :.:::.::.
CCDS57 KVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKR
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 YTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIV
:.: :.:.. . . .:. . :. :: .:. ..:. ::.: :. .:. ::: :...
CCDS57 YSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFA
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 VVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLA
::..:.::.: .. ..:....:: . :. :..: .: .. . :...:::.. ....
CCDS57 VVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTIS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 MGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLC
:..::::::::.::.:::.:::: : .::.:. : :.:: .:. .:.:::.:.:.
CCDS57 MAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCL
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 VSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSF
.::......:. :. . ::..::.:.. ::::. . :..: ..:: ::.. ::...:
CCDS57 ASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTF
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 LSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIK
.::.::.: ::. ..: ...:.:...:: . .:... .::.:.. .:.....: :::
CCDS57 VSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVKEIPGIK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 IITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKT
:. .:.:.:::... . . :::..: .. :..: ..: :. . : .
CCDS57 IFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNAN-------MAN
540 550 560 570 580
600 610 620 630 640 650
pF1KE2 KTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPS
:: . . : :.: : :... .: :.: :: .. :
CCDS57 ATVVKADAEVDGEDA--TKPEEE----DGE-VKY--------------PPIVIKST-FPE
590 600 610 620
660 670 680 690 700 710
pF1KE2 DMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDI
.: .:: . ::.:::.. :.:.: .:.:.:: . . :: .:. :.:.. ::: ::.
CCDS57 EMQRFMPPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDL
630 640 650 660 670 680
720 730 740 750 760 770
pF1KE2 SHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRS
... ::. .: . .: ::::::: .: :.. .. .. :.. .:
CCDS57 TRNRFFENPALW-ELLFHSIHDAVLGSQL--REALAEQEASAPPSQEDLEPNATPATPEA
690 700 710 720 730 740
780 790
pF1KE2 YWDLEQEMFGSMFHAETLTAL
>>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa)
initn: 1397 init1: 1064 opt: 1430 Z-score: 1329.5 bits: 256.8 E(32554): 9.9e-68
Smith-Waterman score: 1550; 35.2% identity (70.2% similar) in 739 aa overlap (8-742:20-734)
10 20 30 40
pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK
:.:.: .:: :... :.. .. . :.: . :: .
CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 IKAVVFGLLPVLSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS
.:. :.:.: :::.:..:.... :...:.: : . . ::::.:::: .:. ::::.
CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE2 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA
:::.::::..: ... : : :.:..::.. :..::. .: : . :.: : ...::::
CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE2 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF
.. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: ..
CCDS57 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE2 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI
... .:.: ::..:...: .:. ::.:.. .:.. . . ::::: :. ::: ::
CCDS57 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE2 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS
: :.::...::::: : .. :.:. :: : ::: : : :: ...:....::.:.:.
CCDS57 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE2 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS
:.: ...:.. :.:. : .:.:::.::.: ::.:..::. : ::: : . ...:::.
CCDS57 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE2 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC
:::.. . .:::..:.:: : :: ::::.:.. .:::. . :: : :::..:.:
CCDS57 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE2 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ
::: . . :..:.: :. .:. :..:.::...:: . .:... .:::: . :.:. .
CCDS57 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE2 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR
. ::.::. . ::....: . :.. . . .:.: .: . : :.: .: .. : :
CCDS57 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA
550 560 570 580 590
590 600 610 620 630 640
pF1KE2 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE
. :. .: . .. . :: : . .. .. : .. : .: : :....
CCDS57 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN
600 610 620 630 640
650 660 670 680 690 700
pF1KE2 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA
.: : .:.:.:: ...::.:..:...: . . . .: :.:......
CCDS57 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD
650 660 670 680 690
710 720 730 740 750 760
pF1KE2 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS
: . . . : :.: ... : ..:::.:. : ...
CCDS57 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL
700 710 720 730 740 750
770 780 790
pF1KE2 EEDIRSYWDLEQEMFGSMFHAETLTAL
CCDS57 ELIETELTEEELDVQDEAMRTLAS
760 770 780
>>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa)
initn: 1450 init1: 1020 opt: 1393 Z-score: 1295.3 bits: 250.5 E(32554): 7.9e-66
Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (7-735:8-718)
10 20 30 40 50
pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV
.:.: : .:: . :... .: : . . ..:. :: : : .:..:.:.
CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 LSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG
:::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.:
CCDS57 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH
... : : ..:..:: . . .:. . . . ::..: : .: : :.
CCDS57 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY
..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::.
CCDS57 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV
: : :: .. .. ... .::::.:. ::: . .:::.: :. :. ::: :.:..
CCDS57 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM
:.:...: :: . ..... .::... :: :..: : ... .: :..:.:.... ...
CCDS57 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV
. . . :. : .:.:::.:::: .:. . :. . ::: . . ...:::.:.:.:
CCDS57 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL
...:.:..:..:. : :: ::::.:: :::. : :... ::::.: :: ::...:.
CCDS57 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI
.. :.: :.:..:::..:..::.::: . .::.. :.:: : : : . .:.::
CCDS57 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK
. ::.:::: .::.:.: .:..: ..: ..: :.: .: :...:.. :
CCDS57 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD
. .. .. : :. .. . ... . : : .. . : . :.:
CCDS57 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK----
600 610 620 630 640
660 670 680 690 700 710
pF1KE2 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS
...:.::::.:.:::.:. ....: .. . . .: : :..:. . . ..
CCDS57 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN
650 660 670 680 690
720 730 740 750 760 770
pF1KE2 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY
. : :: .. . : .::::::
CCDS57 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR
700 710 720 730 740 750
791 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 16:34:39 2016 done: Tue Nov 8 16:34:40 2016
Total Scan time: 2.520 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]