FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0374, 780 aa
1>>>pF1KE0374 780 - 780 aa - 780 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.8809+/-0.000938; mu= 22.6133+/- 0.057
mean_var=62.3300+/-12.616, 0's: 0 Z-trim(103.8): 28 B-trim: 7 in 1/51
Lambda= 0.162452
statistics sampled from 7565 (7592) to 7565 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.591), E-opt: 0.2 (0.233), width: 16
Scan time: 3.970
The best scores are: opt bits E(32554)
CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 4972 1174.5 0
CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 2288 545.5 1.2e-154
CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1830 438.1 2.5e-122
CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1773 424.7 2.4e-118
CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 1463 352.0 1.4e-96
CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 1462 351.9 2.3e-96
CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 1436 345.8 1.6e-94
CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 1436 345.8 1.8e-94
CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 1293 312.2 1.8e-84
CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 1261 304.8 3.4e-82
CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 1261 304.8 3.5e-82
CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 1261 304.8 3.5e-82
CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 1224 296.1 1.4e-79
CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 1088 264.2 5.5e-70
CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 1062 258.1 3.4e-68
CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 1062 258.1 3.4e-68
CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 1007 245.3 3.5e-64
CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 968 236.1 1.6e-61
CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 965 235.3 2.4e-61
CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 900 219.9 5.4e-57
CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 723 178.6 2.5e-44
CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 559 140.3 1.3e-32
CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 474 120.1 6.4e-27
CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 435 111.1 5.5e-24
CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 383 98.6 1.2e-20
>>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa)
initn: 4972 init1: 4972 opt: 4972 Z-score: 6289.2 bits: 1174.5 E(32554): 0
Smith-Waterman score: 4972; 100.0% identity (100.0% similar) in 780 aa overlap (1-780:1-780)
10 20 30 40 50 60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 KNGIISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 KNGIISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE0 TVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS57 TVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
730 740 750 760 770 780
>>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa)
initn: 2292 init1: 1395 opt: 2288 Z-score: 2889.7 bits: 545.5 E(32554): 1.2e-154
Smith-Waterman score: 2288; 48.5% identity (80.1% similar) in 720 aa overlap (16-729:5-720)
10 20 30 40 50 60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
.. .:.:.::::: ::...:.. ...::. . : ::::: ..
CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQK
10 20 30 40
70 80 90 100 110 120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
: .. .: :: ::: ::.:::::::..::.:::.::.:::.:.:::. .: ::::..
CCDS57 AKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYAS
50 60 70 80 90 100
130 140 150 160 170
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVV---LSMA-PDEHFLVSSSNGTVLNTTMI
::: . :..:::::::::::::..:.::: .: .: : ::.. . . .. :....
CCDS57 FFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLL
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE0 DTAARDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQL
: . .:: :...:.: ::::: :: :.:::.: ::.. :..::::::: .::::::
CCDS57 DD---ERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE0 KIVLNVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKI
:....... ... .::. .: .:..: ::.::....:....: :::.:.::. :.
CCDS57 KFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKL
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE0 PVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSI
::::::: :.:.::...::: .... .....: .. :: :: : : :.. .. :.:
CCDS57 PVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGI
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE0 AVVAYAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQEST
:.::.:.: ::..::. :::: .:::::.::.:..:: : : :...:::::.::::::
CCDS57 AMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQEST
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE0 GGKTQVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNK
:::::.::.:.: ::.:..::.: :: :::::::::....:::::.::. .: ::::..:
CCDS57 GGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDK
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE0 IDAVIWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNY
: .::..: : .:.::: ::: :.. : :::.:.:.:::. . :..: :.:::. :.:
CCDS57 YDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDY
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE0 KNIEEPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQ
.. ::.::::.: :::...:. :.. . ..:::. .:. :: ::::::.:: :.:
CCDS57 YDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGL
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE0 LRATKNGIISDAVSTNNAFEPDEDIEDLEELDIP--TKEIEIQVDWNSELPVKVNVPKVP
:..: .:.: .:.: . . . : ...: :: : : .. ...:::..::....:::.
CCDS57 LQVTPKGFIC-TVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE0 IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIR
.:::.:: .:.::::: .::.:. :..:: :: :.::... .: ::::.. ::: ...
CCDS57 LHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVK
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE0 KDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEA
.. ::::.:::.:..
CCDS57 SSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF
710 720 730 740 750 760
>>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa)
initn: 1775 init1: 1231 opt: 1830 Z-score: 2309.8 bits: 438.1 E(32554): 2.5e-122
Smith-Waterman score: 1830; 38.4% identity (74.5% similar) in 721 aa overlap (20-737:16-723)
10 20 30 40 50 60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
:.: ::..:. ..:.. . . . .. ..: . .:. :.
CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
... ..:: .::: :. ::..:.:..::.:::.. ::.:.:.::::: .::::.
CCDS57 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
:.:.. : ..:::::::.::: :.:::.:.:.. ..::. . .. :.: : :
CCDS57 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNAT------NGTEA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
::. :: .: ..::: ::::. .: ..::.. ::..::: ::::::: .:..:.:: ..
CCDS57 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
.:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.::
CCDS57 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
:.: ......:.:: : ::...::. .: ..: :.::: : .::: . . ...::.:.
CCDS57 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
.....:..:. :.:. : .:::::.::.:. : ....:. : . .:::. :::.:::::
CCDS57 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
:.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. .
CCDS57 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
::. : . :..:::: ::....:..::::. :.: ::.. ::..: ::.: . :....
CCDS57 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
: :.::.....::.:.: : ... .: .: . ... : ::.:: : . .... :.
CCDS57 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM-AN
540 550 560 570 580
610 620 630 640 650
pF1KE0 KNGIISDA-VSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLV
. . .:: :. ..: .:.: :. .. : :. . :. . : .:...
CCDS57 ATVVKADAEVDGEDATKPEE-----EDGEVKYPPIVIKSTFPEEMQ-RFMPPGDNVHTVI
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE0 LDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFF
:: ..:.: :::..: ::::. . . ::.:. . :.. : . ::.. . .:
CCDS57 LDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELLF
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE0 LTVHDAIL--YLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRT
..:::.: :.. . ::
CCDS57 HSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA
710 720 730 740
>>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa)
initn: 1736 init1: 1216 opt: 1773 Z-score: 2238.1 bits: 424.7 E(32554): 2.4e-118
Smith-Waterman score: 1773; 39.1% identity (75.6% similar) in 681 aa overlap (20-699:16-683)
10 20 30 40 50 60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
:.: ::..:. ..:.. . . . .. ..: . .:. :.
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
... ..:: .::: :. ::..:.:..::.:::.. ::.:.:.::::: .::::.
CCDS43 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
:.:.. : ..:::::::.::: :.:::.:.:.. ..::. . .. :.: : : :
CCDS43 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNAT--N----GTEA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
::. :: .: ..::: ::::. .: ..::.. ::..::: ::::::: .:..:.:: ..
CCDS43 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
.:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.::
CCDS43 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
:.: ......:.:: : ::...::. .: ..: :.::: : .::: . . ...::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
.....:..:. :.:. : .:::::.::.:. : ....:. : . .:::. :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
:.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. .
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
::. : . :..:::: ::....:..::::. :.: ::.. ::..: ::.: . :....
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
: :.::.....::.:.: : ... .: .: . ... : ::.:: : . .... :.
CCDS43 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM-AN
540 550 560 570 580
610 620 630 640 650
pF1KE0 KNGIISDA-VSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLV
. . .:: :. ..: .:.: :. .. : :. . :. . : .:...
CCDS43 ATVVKADAEVDGEDATKPEE-----EDGEVKYPPIVIKSTFPEEMQ-RFMPPGDNVHTVI
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE0 LDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFF
:: ..:.: :::..: ::::. . . ::.:. . ..
CCDS43 LDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR
650 660 670 680
720 730 740 750 760 770
pF1KE0 LTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLA
>>CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 (516 aa)
initn: 1459 init1: 1030 opt: 1463 Z-score: 1847.2 bits: 352.0 E(32554): 1.4e-96
Smith-Waterman score: 1463; 42.6% identity (79.6% similar) in 495 aa overlap (20-514:16-504)
10 20 30 40 50 60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
:.: ::..:. ..:.. . . . .. ..: . .:. :.
CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
... ..:: .::: :. ::..:.:..::.:::.. ::.:.:.::::: .::::.
CCDS43 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
:.:.. : ..:::::::.::: :.:::.:.:.. ..::. . .. :.: : :
CCDS43 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATN------GTEA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
::. :: .: ..::: ::::. .: ..::.. ::..::: ::::::: .:..:.:: ..
CCDS43 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
.:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.::
CCDS43 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
:.: ......:.:: : ::...::. .: ..: :.::: : .::: . . ...::.:.
CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
.....:..:. :.:. : .:::::.::.:. : ....:. : . .:::. :::.:::::
CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
:.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. .
CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
::. : . :..:::: ::....:..::::. :.:
CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSFHTEMTRRWRP
480 490 500 510
550 560 570 580 590 600
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT
>>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa)
initn: 1858 init1: 1247 opt: 1462 Z-score: 1843.7 bits: 351.9 E(32554): 2.3e-96
Smith-Waterman score: 1841; 41.8% identity (77.4% similar) in 682 aa overlap (56-731:62-726)
30 40 50 60 70 80
pF1KE0 VYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPILEWLPKYRVKEWLL
::: ::...: .:.: :::.: :..:::
CCDS46 ERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLL
40 50 60 70 80 90
90 100 110 120 130 140
pF1KE0 SDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGTSRHISVGPFPVVS
.:..::.:.... ::.::::::..: .::::.:.:.. ::.:::::::::: : :.:
CCDS46 GDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMS
100 110 120 130 140 150
150 160 170 180 190 200
pF1KE0 LMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAARDTARVLIASALTLLVGIIQLIFGG
.:::::. :.::. .:: .::. .:::.::: .::.:..:::..:. .:
CCDS46 VMVGSVTESLAPQ-----------ALNDSMINETARDAARVQVASTLSVLVGLFQVGLGL
160 170 180 190 200
210 220 230 240 250 260
pF1KE0 LQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVSTKNYNGVLSIIYTLVEIFQNIG
...::.: ::..::: :.::::: ::.::::: :... ....: ::.:::..:. ..
CCDS46 IHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLP
210 220 230 240 250 260
270 280 290 300 310 320
pF1KE0 DTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEVIVTIIATAISYGANLEKNYNA
..... ... .. :: ..:: :::......:.::: :... : ::.:::: .:.. ...
CCDS46 QSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEV
270 280 290 300 310 320
330 340 350 360 370 380
pF1KE0 GIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIAVSVGKVYATKYDYTIDGNQEF
.: .:: :..:: : ..:::......:.::::..:::.:.::..: .. : .:.:::.
CCDS46 DVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQEL
330 340 350 360 370 380
390 400 410 420 430 440
pF1KE0 IAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAGIISAAIVMIAILALGKLLEPL
.:.:.::...:.:.:: .. ..::. :::::::..:::: ::. .... :. ::.:.. :
CCDS46 VALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDL
390 400 410 420 430 440
450 460 470 480 490 500
pF1KE0 QKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVFTCIVSIILGLDLGLLAGLIFG
:.::::..:.:::::. :: :. ::. :. : .::. : ..:.:.:::::....::.
CCDS46 PKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFS
450 460 470 480 490 500
510 520 530 540 550 560
pF1KE0 LLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQGVKILRFSSPIFYGNVDGFKKC
:: ::.:.:.: .. ::..:.::::... .:.. .: .:::..: :. ....:.. ..
CCDS46 LLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDA
510 520 530 540 550 560
570 580 590 600 610 620
pF1KE0 IKSTVGFDAIRVYNKRLKALRK-----IQKLIKSGQLRATKNGIISDAVSTNNAFEPDED
.:. : :. . ... : :.: ...: : .:: . ..: .. ... :.
CCDS46 LKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAGPLLSACLAPQQVSSGDK-
570 580 590 600 610
630 640 650 660 670 680
pF1KE0 IEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVLDCGAISFLDVVGVRSLRVIV
.:. .: : .: : . ...:. .:::.:: ::.::.:.: ..::. :
CCDS46 ---MEDATANGQEDSKAPD-GSTLKA-LGLPQPDFHSLILDLGALSFVDTVCLKSLKNIF
620 630 640 650 660 670
690 700 710 720 730
pF1KE0 KEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFLTVHDAILY-LQNQVKSQEGQ
..:..:.:.::.:. .. :. .:: ::: .: : .: .::::. . ::.
CCDS46 HDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSP
680 690 700 710 720 730
740 750 760 770 780
pF1KE0 GSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
CCDS46 VSVTRL
740
>>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 (791 aa)
initn: 1403 init1: 1064 opt: 1436 Z-score: 1810.3 bits: 345.8 E(32554): 1.6e-94
Smith-Waterman score: 1556; 35.3% identity (70.2% similar) in 739 aa overlap (20-734:8-742)
10 20 30 40 50 60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
:.:.: .:: :... :.. .. . :.: . :: .
CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK
10 20 30 40
70 80 90 100 110 120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
.:. :.:.: :::::..:.... :...:.: : . . ::::.:::: .:. ::::.
CCDS30 IKAVVFGLLPVLSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
:::.::::..: ... : : :.:..::.. :..::. .: : . :.: : ...::::
CCDS30 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
.. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: ..
CCDS30 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
... .:.: ::..:...: .:. ::.:.. .:.. . . ::::: :. ::: ::
CCDS30 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
: :.::...::::: : .. :.:. :: : ::: : : :: ...:....::.:.:.
CCDS30 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
:.: ...:.. :.:. : .:.:::.::.: ::.:..::. : ::: : . ...:::.
CCDS30 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
:::.. . .:::..:.:: : :: ::::.:.. .:::. . :: : :::..:.:
CCDS30 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC
410 420 430 440 450 460
490 500 510 520 530 540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
::: . . :..:.: :. .:. :..:.::...:: . .:... .:::: . :.:. .
CCDS30 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ
470 480 490 500 510 520
550 560 570 580 590
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA
. ::.::. . ::....: . :.. . . .:.: .: . : :.: .: .. : :
CCDS30 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR
530 540 550 560 570 580
600 610 620 630 640
pF1KE0 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN
. :. .: . .. . :: : . .. .. : .. : .: : :....
CCDS30 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE
590 600 610 620 630 640
650 660 670 680 690
pF1KE0 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD
.: : .:.:.:: ...::.:..:...: . . . .: :.:......
CCDS30 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA
650 660 670 680 690 700
700 710 720 730 740 750
pF1KE0 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL
: . . . : :.: ... : ..:::.:. : ...
CCDS30 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS
710 720 730 740 750 760
760 770 780
pF1KE0 ELIETELTEEELDVQDEAMRTLAS
CCDS30 EEDIRSYWDLEQEMFGSMFHAETLTAL
770 780 790
>>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 (887 aa)
initn: 1403 init1: 1064 opt: 1436 Z-score: 1809.6 bits: 345.8 E(32554): 1.8e-94
Smith-Waterman score: 1556; 35.3% identity (70.2% similar) in 739 aa overlap (20-734:8-742)
10 20 30 40 50 60
pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR
:.:.: .:: :... :.. .. . :.: . :: .
CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK
10 20 30 40
70 80 90 100 110 120
pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA
.:. :.:.: :::::..:.... :...:.: : . . ::::.:::: .:. ::::.
CCDS30 IKAVVFGLLPVLSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA
:::.::::..: ... : : :.:..::.. :..::. .: : . :.: : ...::::
CCDS30 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL
.. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: ..
CCDS30 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI
... .:.: ::..:...: .:. ::.:.. .:.. . . ::::: :. ::: ::
CCDS30 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA
: :.::...::::: : .. :.:. :: : ::: : : :: ...:....::.:.:.
CCDS30 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT
:.: ...:.. :.:. : .:.:::.::.: ::.:..::. : ::: : . ...:::.
CCDS30 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV
:::.. . .:::..:.:: : :: ::::.:.. .:::. . :: : :::..:.:
CCDS30 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC
410 420 430 440 450 460
490 500 510 520 530 540
pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE
::: . . :..:.: :. .:. :..:.::...:: . .:... .:::: . :.:. .
CCDS30 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ
470 480 490 500 510 520
550 560 570 580 590
pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA
. ::.::. . ::....: . :.. . . .:.: .: . : :.: .: .. : :
CCDS30 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR
530 540 550 560 570 580
600 610 620 630 640
pF1KE0 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN
. :. .: . .. . :: : . .. .. : .. : .: : :....
CCDS30 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE
590 600 610 620 630 640
650 660 670 680 690
pF1KE0 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD
.: : .:.:.:: ...::.:..:...: . . . .: :.:......
CCDS30 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA
650 660 670 680 690 700
700 710 720 730 740 750
pF1KE0 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL
: . . . : :.: ... : ..:::.:. : ...
CCDS30 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS
710 720 730 740 750 760
760 770 780
pF1KE0 ELIETELTEEELDVQDEAMRTLAS
CCDS30 EEDIRSYWDLEQEMFGSMFHAETLTALESLSAAGGCYPYRSESLVSPLFTRQALAAMDKP
770 780 790 800 810 820
>>CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 (701 aa)
initn: 1371 init1: 976 opt: 1293 Z-score: 1630.0 bits: 312.2 E(32554): 1.8e-84
Smith-Waterman score: 1355; 32.6% identity (68.9% similar) in 700 aa overlap (43-726:28-684)
20 30 40 50 60 70
pF1KE0 LPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPIL
:. :. : :::: . .... :.:
CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPAT
10 20 30 40 50
80 90 100 110 120 130
pF1KE0 EWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGT
.:: .:: .:.: .::.::. :.. . :..::.:::.. :.::..:: : ::..::
CCDS33 RWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGT
60 70 80 90 100 110
140 150 160 170 180
pF1KE0 SRHISVGPFPVVSLMVGSVV---LSMA---PDEHFLVSSSNGTVLNTT--MIDTAARDTA
:::.::: : .. ::::.:: :..: :.. : ..:...:: . :.: . ::
CCDS33 SRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCG-RDCY
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 RVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVST
. .:.::::..:. :...: :..::. ::..::. ::. .:. .:.:::: .:.:
CCDS33 AIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRI
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE0 KNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEV
..: .. : . .... :..:. : ... . ..: .:.:::.::.::.. ::.: :.
CCDS33 PRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTEL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE0 IVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIA
.: ..:: .:. ..:.: ...... .:: ::.::..: :.... . ..:.:: :..
CCDS33 LVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE0 VSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAG
.:.....: .. :.. .:::..: : :.. .:. ::....::... :. .:: .::...
CCDS33 ISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSS
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE0 IISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVF
..::..:....:::. :.. ::.:::: :....:.: . .. :.:::::.. ::..:.
CCDS33 VVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAG
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE0 TCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQG
: . .... . :::::.:..::... :.: : :. : .: .:... ..... :
CCDS33 TAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPG
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE0 VKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRATKNGI
:...::..:..:.: : : . . : .:.:: . .: : : ....:.
CCDS33 VRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARR-----------KEG---GSETGV
540 550 560 570 580
610 620 630 640 650 660
pF1KE0 ISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVP----IHSLVL
. : . ::: ::.. . :: .:..:.
CCDS33 GEGG--------PAQG-EDLG-------------------PVSTRAALVPAAAGFHTVVI
590 600 610
670 680 690 700 710
pF1KE0 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFD----DNIRKD
::. . :::..:: .:. . ... . ... .: . : . : . ::. :. ...
CCDS33 DCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEE
620 630 640 650 660 670
720 730 740 750 760 770
pF1KE0 TFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMR
.::.::::.
CCDS33 QLFLSVHDAVQTARARHRELEATDAHL
680 690 700
>>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa)
initn: 1858 init1: 1247 opt: 1261 Z-score: 1589.1 bits: 304.8 E(32554): 3.4e-82
Smith-Waterman score: 1848; 41.2% identity (77.4% similar) in 696 aa overlap (56-731:41-724)
30 40 50 60 70 80
pF1KE0 VYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPILEWLPKYRVKEWLL
::: ::...: .:.: :::.: :..:::
CCDS46 ERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLL
20 30 40 50 60 70
90 100 110 120 130 140
pF1KE0 SDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGTSRHISVGPFPVVS
.:..::.:.... ::.::::::..: .::::.:.:.. ::.:::::::::: : :.:
CCDS46 GDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMS
80 90 100 110 120 130
150 160 170 180 190 200
pF1KE0 LMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAARDTARVLIASALTLLVGIIQLIFGG
.:::::. :.::. .:: .::. .:::.::: .::.:..:::..:. .:
CCDS46 VMVGSVTESLAPQ-----------ALNDSMINETARDAARVQVASTLSVLVGLFQVGLGL
140 150 160 170
210 220 230 240 250 260
pF1KE0 LQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVSTKNYNGVLSIIYTLVEIFQNIG
...::.: ::..::: :.::::: ::.::::: :... ....: ::.:::..:. ..
CCDS46 IHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLP
180 190 200 210 220 230
270 280 290 300 310 320
pF1KE0 DTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEVIVTIIATAISYGANLEKNYNA
..... ... .. :: ..:: :::......:.::: :... : ::.:::: .:.. ...
CCDS46 QSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEV
240 250 260 270 280 290
330 340 350 360 370 380
pF1KE0 GIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIAVSVGKVYATKYDYTIDGNQEF
.: .:: :..:: : ..:::......:.::::..:::.:.::..: .. : .:.:::.
CCDS46 DVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQEL
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE0 IAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAGIISAAIVMIAILALGKLLEPL
.:.:.::...:.:.:: .. ..::. :::::::..:::: ::. .... :. ::.:.. :
CCDS46 VALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDL
360 370 380 390 400 410
450 460 470 480 490 500
pF1KE0 QKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVFTCIVSIILGLDLGLLAGLIFG
:.::::..:.:::::. :: :. ::. :. : .::. : ..:.:.:::::....::.
CCDS46 PKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFS
420 430 440 450 460 470
510 520 530 540 550 560
pF1KE0 LLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQGVKILRFSSPIFYGNVDGFKKC
:: ::.:.:.: .. ::..:.::::... .:.. .: .:::..: :. ....:.. ..
CCDS46 LLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDA
480 490 500 510 520 530
570 580 590 600 610
pF1KE0 IKSTVGFDAIRVYNKRLKALRK-----IQKLIKSGQLR---ATKNGIISDAVSTNNAFEP
.:. : :. . ... : :.: ...: : .:: :. .: : ....:...:
CCDS46 LKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGA-SVSINVNTSLED
540 550 560 570 580 590
620 630 640 650 660
pF1KE0 --DEDIEDLEELDIPTKEIEIQVDWNSELPVK---------VNVPKVPIHSLVLDCGAIS
....:: . ... . . .. :.. : ...:. .:::.:: ::.:
CCDS46 MRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFHSLILDLGALS
600 610 620 630 640 650
670 680 690 700 710 720
pF1KE0 FLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFLTVHDAI
:.:.: ..::. : ..:..:.:.::.:. .. :. .:: ::: .: : .: .::::.
CCDS46 FVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHLFASVHDAV
660 670 680 690 700 710
730 740 750 760 770 780
pF1KE0 LY-LQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS
. ::.
CCDS46 TFALQHPRPVPDSPVSVTRL
720 730
780 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 13:33:47 2016 done: Thu Nov 3 13:33:48 2016
Total Scan time: 3.970 Total Display time: 0.260
Function used was FASTA [36.3.4 Apr, 2011]