FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB6259, 764 aa
1>>>pF1KB6259 764 - 764 aa - 764 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2011+/-0.00115; mu= 20.5807+/- 0.068
mean_var=65.2369+/-13.157, 0's: 0 Z-trim(101.4): 32 B-trim: 2 in 1/49
Lambda= 0.158792
statistics sampled from 6498 (6524) to 6498 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.543), E-opt: 0.2 (0.2), width: 16
Scan time: 3.830
The best scores are: opt bits E(32554)
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 4939 1141.1 0
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 2288 533.8 3.9e-151
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1763 413.6 5.9e-115
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1690 396.8 6e-110
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 1459 343.8 4e-94
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 1393 328.8 2.1e-89
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 1393 328.8 2.3e-89
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 1344 317.6 4.6e-86
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 1293 305.9 1.5e-82
CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 1251 296.3 1.2e-79
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 1212 287.3 6e-77
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 1209 286.6 9.5e-77
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 1209 286.6 9.7e-77
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 1180 280.0 9.1e-75
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 1111 264.3 6.8e-70
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 1073 255.5 2.1e-67
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 1073 255.5 2.1e-67
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 961 229.8 1.2e-59
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 953 228.0 3.9e-59
CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 921 220.5 3.6e-57
CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 679 165.2 2.7e-40
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 554 136.6 1.6e-31
CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 438 109.8 7.7e-24
CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 385 97.8 5.4e-20
CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 361 92.1 1.1e-18
>>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa)
initn: 4939 init1: 4939 opt: 4939 Z-score: 6109.2 bits: 1141.1 E(32554): 0
Smith-Waterman score: 4939; 100.0% identity (100.0% similar) in 764 aa overlap (1-764:1-764)
10 20 30 40 50 60
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDERVRVAAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDERVRVAAAA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB6 SVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 SVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB6 VSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB6 AGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 AGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB6 YSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 YSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAII
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB6 VLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB6 VLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRC
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB6 PSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 PSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB6 IKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSLILDFSAVSFLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 IKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSLILDFSAVSFLD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB6 VSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIFFLTIHDAVLHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 VSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIFFLTIHDAVLHI
670 680 690 700 710 720
730 740 750 760
pF1KB6 LMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
::::::::::::::::::::::::::::::::::::::::::::
CCDS57 LMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
730 740 750 760
>>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa)
initn: 2292 init1: 1395 opt: 2288 Z-score: 2826.9 bits: 533.8 E(32554): 3.9e-151
Smith-Waterman score: 2288; 48.2% identity (80.1% similar) in 720 aa overlap (5-720:16-729)
10 20 30 40
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQK
.. .:.:.::::: ::...:.. ...::. . : ::::: ..
CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB6 AKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYAS
: .. .: :: ::: ::.:::::::..::.:::.::.:::.:.:::. .: ::::..
CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB6 FFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLL
::: . :..:::::::::::::..:.::: ..: . .::.. . . .. :....
CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVG----SVVLSMAPDEHFLVSSSNGTVLNTTMI
130 140 150 160 170
170 180 190 200 210 220
pF1KB6 DD---ERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQL
: . .:: :...:.: ::::: :: :.:::.: ::.. :..::::::: .::::::
CCDS57 DTAARDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQL
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB6 KFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKL
:....... ... .::. .: .:..: ::.::....:....: :::.:.::. :.
CCDS57 KIVLNVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKI
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB6 PVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGI
::::::: :.:.::...::: .... .....: .. :: :: : : :.. .. :.:
CCDS57 PVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSI
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB6 AMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQEST
:.::.:.: ::..::. :::: .:::::.::.:..:: : : :...:::::.::::::
CCDS57 AVVAYAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQEST
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB6 GGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDK
:::::.::.:.: ::.:..::.: :: :::::::::....:::::.::. .: ::::..:
CCDS57 GGKTQVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNK
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB6 YDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDY
: .::..: : .:.::: ::: :.. : :::.:.:.:::. . :..: :.:::. :.:
CCDS57 IDAVIWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNY
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB6 YDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGL
.. ::.::::.: :::...:. :.. . ..:::. .:. :: ::::::.:: :.:
CCDS57 KNIEEPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQ
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB6 LQVTPKGFIC-TVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS
:..: .:.: .:.: . . . : ...: :: : : .. ...:::..::....:::.
CCDS57 LRATKNGIISDAVSTNNAFEPDEDIEDLEELDIP--TKEIEIQVDWNSELPVKVNVPKVP
600 610 620 630 640 650
650 660 670 680 690 700
pF1KB6 LHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVK
.:::.:: .:.::::: .::.:. :..:: :: :.::... .: ::::.. ::: ...
CCDS57 IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIR
660 670 680 690 700 710
710 720 730 740 750 760
pF1KB6 SSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
.. ::::.:::.:..
CCDS57 KDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEA
720 730 740 750 760 770
>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa)
initn: 1746 init1: 1117 opt: 1763 Z-score: 2177.2 bits: 413.6 E(32554): 5.9e-115
Smith-Waterman score: 1763; 39.2% identity (71.6% similar) in 735 aa overlap (8-736:15-731)
10 20 30 40 50
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
.: : ::..: ...: . . .. :.:: .:.:.: . :
CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
. ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
:.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : :
CCDS57 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
130 140 150 160 170
180 190 200 210 220 230
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
:.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: .
CCDS57 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
. .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.::
CCDS57 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
:.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:.
CCDS57 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
:.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS57 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
:.:: ......:.:.:: :::. : ..::.:... :::::.:::... .:: .: .
CCDS57 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
::. ::. .. ::: :: ..: . :::...::: :. ..:... .:..: . : ..
CCDS57 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
480 490 500 510 520 530
540 550 560 570 580
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV
: :.:::. .:::.:: .. : .: .: :. : ::.:: : . . .. ..
CCDS57 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL
: :: . : ...... :..: : . . .: : ..:..
CCDS57 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV
600 610 620 630 640
650 660 670 680 690 700
pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF
::::. :.:.: .:. : .:..:. . . ::..: . . .. :.: .::.. . ..
CCDS57 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELL
650 660 670 680 690 700
710 720 730 740 750 760
pF1KB6 FLTIHDAVLHILMKKDYSTSKFN--PSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
: .:::::: ... . .. . ::::
CCDS57 FHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA
710 720 730 740
>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa)
initn: 1584 init1: 1117 opt: 1690 Z-score: 2087.4 bits: 396.8 E(32554): 6e-110
Smith-Waterman score: 1690; 39.9% identity (72.0% similar) in 690 aa overlap (8-693:15-685)
10 20 30 40 50
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
.: : ::..: ...: . . .. :.:: .:.:.: . :
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
. ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
:.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : :
CCDS43 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
130 140 150 160 170
180 190 200 210 220 230
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
:.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: .
CCDS43 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
. .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.::
CCDS43 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
:.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
:.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
:.:: ......:.:.:: :::. : ..::.:... :::::.:::... .:: .: .
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
::. ::. .. ::: :: ..: . :::...::: :. ..:... .:..: . : ..
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
480 490 500 510 520 530
540 550 560 570 580
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV
: :.:::. .:::.:: .. : .: .: :. : ::.:: : . . .. ..
CCDS43 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL
: :: . : ...... :..: : . . .: : ..:..
CCDS43 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV
600 610 620 630 640
650 660 670 680 690 700
pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF
::::. :.:.: .:. : .:..:. . . ::..: . ::..
CCDS43 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSA-FIQR
650 660 670 680
710 720 730 740 750 760
pF1KB6 FLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
>>CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 (516 aa)
initn: 1437 init1: 970 opt: 1459 Z-score: 1803.2 bits: 343.8 E(32554): 4e-94
Smith-Waterman score: 1459; 44.8% identity (77.2% similar) in 500 aa overlap (8-504:15-504)
10 20 30 40 50
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
.: : ::..: ...: . . .. :.:: .:.:.: . :
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
. ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
:.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : :
CCDS43 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
130 140 150 160 170
180 190 200 210 220 230
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
:.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: .
CCDS43 VKVA--MSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
. .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.::
CCDS43 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
:.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
:.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
:.:: ......:.:.:: :::. : ..::.:... :::::.:::... .:: .: .
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
::. ::. .. ::: :: ..: . :::...:::
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSFHTEMTRRWRP
480 490 500 510
540 550 560 570 580 590
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVT
>>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 (791 aa)
initn: 1450 init1: 1020 opt: 1393 Z-score: 1718.7 bits: 328.8 E(32554): 2.1e-89
Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (8-718:7-735)
10 20 30 40 50 60
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
.:.: : .:: . :... .: : . . ..:. :: : : .:..:.:.
CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV
10 20 30 40 50
70 80 90 100 110 120
pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
:::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.:
CCDS30 LSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG
60 70 80 90 100 110
130 140 150 160 170
pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA
... : : ..:..:: . . .:. . . . ::..: : .: : :.
CCDS30 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB6 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH
..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::.
CCDS30 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB6 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT
: : :: .. .. ... .::::.:. ::: . .:::.: :. :. ::: :.:..
CCDS30 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB6 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV
:.:...: :: . ..... .::... :: :..: : ... .: :..:.:.... ...
CCDS30 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB6 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG
. . . :. : .:.:::.:::: .:. . :. . ::: . . ...:::.:.:.:
CCDS30 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB6 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI
...:.:..:..:. : :: ::::.:: :::. : :... ::::.: :: ::...:.
CCDS30 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB6 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI
.. :.: :.:..:::..:..::.::: . .::.. :.:: : : : . .:.::
CCDS30 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB6 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP
. ::.:::: .::.:.: .:..: ..: ..: :.: .: :...:.. :
CCDS30 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK
540 550 560 570 580 590
600 610 620 630 640
pF1KB6 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK----
. .. .. : :. .. . ... . : : .. . : . :.:
CCDS30 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD
600 610 620 630 640 650
650 660 670 680 690
pF1KB6 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN
...:.::::.:.:::.:. ....: .. . . .: : :..:. . . ..
CCDS30 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS
660 670 680 690 700 710
700 710 720 730 740 750
pF1KB6 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR
. : :: .. . : .::::::
CCDS30 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY
720 730 740 750 760 770
>>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 (887 aa)
initn: 1450 init1: 1020 opt: 1393 Z-score: 1718.0 bits: 328.8 E(32554): 2.3e-89
Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (8-718:7-735)
10 20 30 40 50 60
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI
.:.: : .:: . :... .: : . . ..:. :: : : .:..:.:.
CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV
10 20 30 40 50
70 80 90 100 110 120
pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG
:::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.:
CCDS30 LSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG
60 70 80 90 100 110
130 140 150 160 170
pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA
... : : ..:..:: . . .:. . . . ::..: : .: : :.
CCDS30 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB6 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH
..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::.
CCDS30 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB6 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT
: : :: .. .. ... .::::.:. ::: . .:::.: :. :. ::: :.:..
CCDS30 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB6 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV
:.:...: :: . ..... .::... :: :..: : ... .: :..:.:.... ...
CCDS30 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB6 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG
. . . :. : .:.:::.:::: .:. . :. . ::: . . ...:::.:.:.:
CCDS30 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB6 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI
...:.:..:..:. : :: ::::.:: :::. : :... ::::.: :: ::...:.
CCDS30 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB6 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI
.. :.: :.:..:::..:..::.::: . .::.. :.:: : : : . .:.::
CCDS30 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB6 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP
. ::.:::: .::.:.: .:..: ..: ..: :.: .: :...:.. :
CCDS30 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK
540 550 560 570 580 590
600 610 620 630 640
pF1KB6 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK----
. .. .. : :. .. . ... . : : .. . : . :.:
CCDS30 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD
600 610 620 630 640 650
650 660 670 680 690
pF1KB6 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN
...:.::::.:.:::.:. ....: .. . . .: : :..:. . . ..
CCDS30 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS
660 670 680 690 700 710
700 710 720 730 740 750
pF1KB6 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR
. : :: .. . : .::::::
CCDS30 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY
720 730 740 750 760 770
>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa)
initn: 1667 init1: 1134 opt: 1344 Z-score: 1658.5 bits: 317.6 E(32554): 4.6e-86
Smith-Waterman score: 1678; 37.9% identity (71.4% similar) in 721 aa overlap (9-721:29-724)
10 20 30
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHL-
: . ::. . . .:: :: .. :
CCDS46 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE----LGRWGSAPRTHQW
10 20 30 40 50
40 50 60 70 80 90
pF1KB6 KVCCSCSPQKAKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVD
.. .:: .: ..:. .:. ::: : ...:::.:..::.:..:. . ::::.:::.
CCDS46 RTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAG
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB6 IPPVYGLYASFFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGL
.:::.:::.::.:..::..:::::::::: : ..:.::: .. . . .:. :
CCDS46 LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALND--------
120 130 140 150 160
160 170 180 190 200 210
pF1KB6 PNNSNNSSLLDDERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAV
. : . : ::.::. ...:: :..:...:....:::: :::: :. :.::::::
CCDS46 --SMINETARDAARVQVAS--TLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAV
170 180 190 200 210 220
220 230 240 250 260 270
pF1KB6 HVLVSQLKFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEIN
.:.:::::..: : . ::. :.:.. .. : .. ..... .::: .. .:. .:: .:
CCDS46 QVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLN
230 240 250 260 270 280
280 290 300 310 320 330
pF1KB6 QRFKDKLPVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNT
......::.::: :.. . :.:.::: .:.::.: :::.. :. ::..:... :..
CCDS46 DKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKL
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB6 VGDCFGIAMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSR
::. : ::.:.::.:.:......:.. : .:.::::.::::.:.. :.:. : : ..::
CCDS46 VGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSR
350 360 370 380 390 400
400 410 420 430 440 450
pF1KB6 SAVQESTGGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIG
: :::::::..:.:: :.....:.... .: :. : :.::::. . :::::: :....
CCDS46 SLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMR
410 420 430 440 450 460
460 470 480 490 500 510
pF1KB6 RLWRKDKYDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNI
::. .. : :::..:: ::.:.: :::...: :.:: .: :::.:. :.:... :.:
CCDS46 SLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDI
470 480 490 500 510 520
520 530 540 550 560 570
pF1KB6 YKNKKDYYDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRK--
:.. .: . : .:::.:: . .:::: :. : . : . .. ...: :.:
CCDS46 YRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQE
530 540 550 560 570 580
580 590 600 610 620 630
pF1KB6 ---IRKLQKQGLL--QVTPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWN
...:::. : :. : : . .: .... : : . : .
CCDS46 QLKLKQLQKEEKLRKQAGPLLSACLAPQQVSSGDKME-------DATANGQEDSKAPDGS
590 600 610 620 630
640 650 660 670 680 690
pF1KB6 DDLPLNIEVPKISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIE
:.. :. ..::::::..:.::.:. ...::.:...: .:.:.::... . .
CCDS46 TLKALGL--PQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVS
640 650 660 670 680 690
700 710 720 730 740 750
pF1KB6 KLNRYEFFDGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLR
.:. .:::. . .. .: ..:::: :
CCDS46 QLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL
700 710 720 730 740
>>CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 (739 aa)
initn: 968 init1: 895 opt: 1293 Z-score: 1595.4 bits: 305.9 E(32554): 1.5e-82
Smith-Waterman score: 1335; 32.2% identity (68.8% similar) in 712 aa overlap (23-725:57-724)
10 20 30 40 50
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTF-LDHLKVCCSCSPQKAK
: ..:. . : : . .:. :.::: :::
CCDS43 IHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAK
30 40 50 60 70 80
60 70 80 90 100 110
pF1KB6 RIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFF
..:...:. .::: : ::. .:.:..::. .::. : :..:..::. ::::::.:::
CCDS43 NMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFF
90 100 110 120 130 140
120 130 140 150 160 170
pF1KB6 PAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLD-
.:::...::::::::: : .: .:.: .:. ..:: : .. .: ::.:.::.
CCDS43 ASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLNH
150 160 170 180 190 200
180 190 200 210 220
pF1KB6 -DERV------RVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLV
..:. . ....:: ..:. :.:.:....::: .:::..:.:::.:.:. .:.
CCDS43 TSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTILT
210 220 230 240 250 260
230 240 250 260 270 280
pF1KB6 SQLKFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFK
:: :... :..: . :.. . :: .:.:::. ::.:.:. :::. .::.:..::
CCDS43 SQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHFK
270 280 290 300 310 320
290 300 310 320 330 340
pF1KB6 DKLPVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDC
.:: .:::::....: :. .:. ... .. ...: . ::.:: .:. . . ... :
CCDS43 SKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVDA
330 340 350 360 370 380
350 360 370 380 390 400
pF1KB6 FGIAMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQ
..:....::.. :.. ... :. : . .:::. :.:. ::. . :. :. :.::... :.
CCDS43 IAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLVK
390 400 410 420 430 440
410 420 430 440 450 460
pF1KB6 ESTGGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWR
:::: .::..:.. :...:.:.:.:. :. ::::::..... ::.: : .: .. ..:
CCDS43 ESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMWS
450 460 470 480 490 500
470 480 490 500 510 520
pF1KB6 KDKYDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNK
...: .::..:.. . .:. .:: ..: :... ...::: :: : :. . .......
CCDS43 ISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFESV
510 520 530 540 550 560
530 540 550 560 570 580
pF1KB6 KDYYDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQK
. : .. :.:::: .:.:. : :. : . .:. : .:: . ::...
CCDS43 SAYKNLQIKPGIKIFRFVAPLYYINKECFKSALYKQT-VNPILIKVAWKKAAK--RKIKE
570 580 590 600 610 620
590 600 610 620 630 640
pF1KB6 QGLLQVTPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPK
. . :. :.: :.. .. . : ::.
CCDS43 K----------VVTLGGIQD---EMS-------------------VQLSHD-PLE-----
630 640
650 660 670 680 690 700
pF1KB6 ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGE
::....: ::..:::..... :: . ... : ..: .. . ..:. :. :
CCDS43 --LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKE
650 660 670 680 690 700
710 720 730 740 750 760
pF1KB6 VKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETK
. ...: ....:. ..:.
CCDS43 -EENLLFYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD
710 720 730
>>CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 (712 aa)
initn: 1639 init1: 760 opt: 1251 Z-score: 1543.6 bits: 296.3 E(32554): 1.2e-79
Smith-Waterman score: 1592; 37.3% identity (68.2% similar) in 735 aa overlap (8-736:15-699)
10 20 30 40 50
pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI
.: : ::..: ...: . . .. :.:: .:.:.: . :
CCDS55 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA
. ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:.
CCDS55 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER
:.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : :
CCDS55 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR
130 140 150 160 170
180 190 200 210 220 230
pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT
:.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: .
CCDS55 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI
. .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.::
CCDS55 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA
:.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:.
CCDS55 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT
:.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.:::::
CCDS55 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL
:.:: ......:.:.:: :::. : ..
CCDS55 QLAGCLASLMILLVILATGFLFESLPQT--------------------------------
420 430
480 490 500 510 520 530
pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY
::. ::. .. ::: :: ..: . :::...::: :. ..:... .:..: . : ..
CCDS55 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
440 450 460 470 480 490
540 550 560 570 580
pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV
: :.:::. .:::.:: .. : .: .: :. : ::.:: : . . .. ..
CCDS55 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA
500 510 520 530 540 550
590 600 610 620 630 640
pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL
: :: . : ...... :..: : . . .: : ..:..
CCDS55 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV
560 570 580 590 600 610
650 660 670 680 690 700
pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF
::::. :.:.: .:. : .:..:. . . ::..: . . .. :.: .::.. . ..
CCDS55 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELL
620 630 640 650 660 670
710 720 730 740 750 760
pF1KB6 FLTIHDAVLHILMKKDYSTSKFN--PSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
: .:::::: ... . .. . ::::
CCDS55 FHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA
680 690 700 710
764 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 08:20:17 2016 done: Sat Nov 5 08:20:18 2016
Total Scan time: 3.830 Total Display time: 0.270
Function used was FASTA [36.3.4 Apr, 2011]