FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0374, 780 aa 1>>>pF1KE0374 780 - 780 aa - 780 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.8809+/-0.000938; mu= 22.6133+/- 0.057 mean_var=62.3300+/-12.616, 0's: 0 Z-trim(103.8): 28 B-trim: 7 in 1/51 Lambda= 0.162452 statistics sampled from 7565 (7592) to 7565 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.591), E-opt: 0.2 (0.233), width: 16 Scan time: 3.970 The best scores are: opt bits E(32554) CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 4972 1174.5 0 CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 2288 545.5 1.2e-154 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1830 438.1 2.5e-122 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1773 424.7 2.4e-118 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 1463 352.0 1.4e-96 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 1462 351.9 2.3e-96 CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 1436 345.8 1.6e-94 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 1436 345.8 1.8e-94 CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 1293 312.2 1.8e-84 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 1261 304.8 3.4e-82 CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 1261 304.8 3.5e-82 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 1261 304.8 3.5e-82 CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 1224 296.1 1.4e-79 CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 1088 264.2 5.5e-70 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 1062 258.1 3.4e-68 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 1062 258.1 3.4e-68 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 1007 245.3 3.5e-64 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 968 236.1 1.6e-61 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 965 235.3 2.4e-61 CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 900 219.9 5.4e-57 CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 723 178.6 2.5e-44 CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 559 140.3 1.3e-32 CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 474 120.1 6.4e-27 CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 435 111.1 5.5e-24 CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 383 98.6 1.2e-20 >>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa) initn: 4972 init1: 4972 opt: 4972 Z-score: 6289.2 bits: 1174.5 E(32554): 0 Smith-Waterman score: 4972; 100.0% identity (100.0% similar) in 780 aa overlap (1-780:1-780) 10 20 30 40 50 60 pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE0 KNGIISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 KNGIISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE0 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE0 TVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 TVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS 730 740 750 760 770 780 >>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa) initn: 2292 init1: 1395 opt: 2288 Z-score: 2889.7 bits: 545.5 E(32554): 1.2e-154 Smith-Waterman score: 2288; 48.5% identity (80.1% similar) in 720 aa overlap (16-729:5-720) 10 20 30 40 50 60 pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR .. .:.:.::::: ::...:.. ...::. . : ::::: .. CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQK 10 20 30 40 70 80 90 100 110 120 pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA : .. .: :: ::: ::.:::::::..::.:::.::.:::.:.:::. .: ::::.. CCDS57 AKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYAS 50 60 70 80 90 100 130 140 150 160 170 pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVV---LSMA-PDEHFLVSSSNGTVLNTTMI ::: . :..:::::::::::::..:.::: .: .: : ::.. . . .. :.... CCDS57 FFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLL 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE0 DTAARDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQL : . .:: :...:.: ::::: :: :.:::.: ::.. :..::::::: .:::::: CCDS57 DD---ERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE0 KIVLNVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKI :....... ... .::. .: .:..: ::.::....:....: :::.:.::. :. CCDS57 KFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKL 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE0 PVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSI ::::::: :.:.::...::: .... .....: .. :: :: : : :.. .. :.: CCDS57 PVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGI 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE0 AVVAYAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQEST :.::.:.: ::..::. :::: .:::::.::.:..:: : : :...:::::.:::::: CCDS57 AMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQEST 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE0 GGKTQVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNK :::::.::.:.: ::.:..::.: :: :::::::::....:::::.::. .: ::::..: CCDS57 GGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDK 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE0 IDAVIWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNY : .::..: : .:.::: ::: :.. : :::.:.:.:::. . :..: :.:::. :.: CCDS57 YDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDY 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE0 KNIEEPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQ .. ::.::::.: :::...:. :.. . ..:::. .:. :: ::::::.:: :.: CCDS57 YDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGL 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE0 LRATKNGIISDAVSTNNAFEPDEDIEDLEELDIP--TKEIEIQVDWNSELPVKVNVPKVP :..: .:.: .:.: . . . : ...: :: : : .. ...:::..::....:::. CCDS57 LQVTPKGFIC-TVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE0 IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIR .:::.:: .:.::::: .::.:. :..:: :: :.::... .: ::::.. ::: ... CCDS57 LHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVK 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE0 KDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEA .. ::::.:::.:.. CCDS57 SSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF 710 720 730 740 750 760 >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 1775 init1: 1231 opt: 1830 Z-score: 2309.8 bits: 438.1 E(32554): 2.5e-122 Smith-Waterman score: 1830; 38.4% identity (74.5% similar) in 721 aa overlap (20-737:16-723) 10 20 30 40 50 60 pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR :.: ::..:. ..:.. . . . .. ..: . .:. :. CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA ... ..:: .::: :. ::..:.:..::.:::.. ::.:.:.::::: .::::. CCDS57 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA :.:.. : ..:::::::.::: :.:::.:.:.. ..::. . .. :.: : : CCDS57 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNAT------NGTEA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL ::. :: .: ..::: ::::. .: ..::.. ::..::: ::::::: .:..:.:: .. CCDS57 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI .:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.:: CCDS57 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA :.: ......:.:: : ::...::. .: ..: :.::: : .::: . . ...::.:. CCDS57 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT .....:..:. :.:. : .:::::.::.:. : ....:. : . .:::. :::.::::: CCDS57 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV :.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. . CCDS57 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE ::. : . :..:::: ::....:..::::. :.: ::.. ::..: ::.: . :.... CCDS57 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT : :.::.....::.:.: : ... .: .: . ... : ::.:: : . .... :. CCDS57 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM-AN 540 550 560 570 580 610 620 630 640 650 pF1KE0 KNGIISDA-VSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLV . . .:: :. ..: .:.: :. .. : :. . :. . : .:... CCDS57 ATVVKADAEVDGEDATKPEE-----EDGEVKYPPIVIKSTFPEEMQ-RFMPPGDNVHTVI 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE0 LDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFF :: ..:.: :::..: ::::. . . ::.:. . :.. : . ::.. . .: CCDS57 LDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELLF 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE0 LTVHDAIL--YLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRT ..:::.: :.. . :: CCDS57 HSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA 710 720 730 740 >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 1736 init1: 1216 opt: 1773 Z-score: 2238.1 bits: 424.7 E(32554): 2.4e-118 Smith-Waterman score: 1773; 39.1% identity (75.6% similar) in 681 aa overlap (20-699:16-683) 10 20 30 40 50 60 pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR :.: ::..:. ..:.. . . . .. ..: . .:. :. CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA ... ..:: .::: :. ::..:.:..::.:::.. ::.:.:.::::: .::::. CCDS43 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA :.:.. : ..:::::::.::: :.:::.:.:.. ..::. . .. :.: : : : CCDS43 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNAT--N----GTEA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL ::. :: .: ..::: ::::. .: ..::.. ::..::: ::::::: .:..:.:: .. CCDS43 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI .:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.:: CCDS43 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA :.: ......:.:: : ::...::. .: ..: :.::: : .::: . . ...::.:. CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT .....:..:. :.:. : .:::::.::.:. : ....:. : . .:::. :::.::::: CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV :.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. . CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE ::. : . :..:::: ::....:..::::. :.: ::.. ::..: ::.: . :.... CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT : :.::.....::.:.: : ... .: .: . ... : ::.:: : . .... :. CCDS43 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM-AN 540 550 560 570 580 610 620 630 640 650 pF1KE0 KNGIISDA-VSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLV . . .:: :. ..: .:.: :. .. : :. . :. . : .:... CCDS43 ATVVKADAEVDGEDATKPEE-----EDGEVKYPPIVIKSTFPEEMQ-RFMPPGDNVHTVI 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE0 LDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFF :: ..:.: :::..: ::::. . . ::.:. . .. CCDS43 LDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR 650 660 670 680 720 730 740 750 760 770 pF1KE0 LTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLA >>CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 (516 aa) initn: 1459 init1: 1030 opt: 1463 Z-score: 1847.2 bits: 352.0 E(32554): 1.4e-96 Smith-Waterman score: 1463; 42.6% identity (79.6% similar) in 495 aa overlap (20-514:16-504) 10 20 30 40 50 60 pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR :.: ::..:. ..:.. . . . .. ..: . .:. :. CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKK 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA ... ..:: .::: :. ::..:.:..::.:::.. ::.:.:.::::: .::::. CCDS43 IRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA :.:.. : ..:::::::.::: :.:::.:.:.. ..::. . .. :.: : : CCDS43 FYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATN------GTEA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL ::. :: .: ..::: ::::. .: ..::.. ::..::: ::::::: .:..:.:: .. CCDS43 RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLF 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI .:.:: :.:..:..:. : ..::. . :. .. .::... . .. ::.:.::..:.:.:: CCDS43 GVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA :.: ......:.:: : ::...::. .: ..: :.::: : .::: . . ...::.:. CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT .....:..:. :.:. : .:::::.::.:. : ....:. : . .:::. :::.::::: CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV :.:: ... .....::: : :.: : ..::.:.::.::::::::. :.: .:: .::. . CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE ::. : . :..:::: ::....:..::::. :.: CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSFHTEMTRRWRP 480 490 500 510 550 560 570 580 590 600 pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRAT >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 1858 init1: 1247 opt: 1462 Z-score: 1843.7 bits: 351.9 E(32554): 2.3e-96 Smith-Waterman score: 1841; 41.8% identity (77.4% similar) in 682 aa overlap (56-731:62-726) 30 40 50 60 70 80 pF1KE0 VYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPILEWLPKYRVKEWLL ::: ::...: .:.: :::.: :..::: CCDS46 ERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLL 40 50 60 70 80 90 90 100 110 120 130 140 pF1KE0 SDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGTSRHISVGPFPVVS .:..::.:.... ::.::::::..: .::::.:.:.. ::.:::::::::: : :.: CCDS46 GDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMS 100 110 120 130 140 150 150 160 170 180 190 200 pF1KE0 LMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAARDTARVLIASALTLLVGIIQLIFGG .:::::. :.::. .:: .::. .:::.::: .::.:..:::..:. .: CCDS46 VMVGSVTESLAPQ-----------ALNDSMINETARDAARVQVASTLSVLVGLFQVGLGL 160 170 180 190 200 210 220 230 240 250 260 pF1KE0 LQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVSTKNYNGVLSIIYTLVEIFQNIG ...::.: ::..::: :.::::: ::.::::: :... ....: ::.:::..:. .. CCDS46 IHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLP 210 220 230 240 250 260 270 280 290 300 310 320 pF1KE0 DTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEVIVTIIATAISYGANLEKNYNA ..... ... .. :: ..:: :::......:.::: :... : ::.:::: .:.. ... CCDS46 QSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEV 270 280 290 300 310 320 330 340 350 360 370 380 pF1KE0 GIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIAVSVGKVYATKYDYTIDGNQEF .: .:: :..:: : ..:::......:.::::..:::.:.::..: .. : .:.:::. CCDS46 DVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQEL 330 340 350 360 370 380 390 400 410 420 430 440 pF1KE0 IAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAGIISAAIVMIAILALGKLLEPL .:.:.::...:.:.:: .. ..::. :::::::..:::: ::. .... :. ::.:.. : CCDS46 VALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDL 390 400 410 420 430 440 450 460 470 480 490 500 pF1KE0 QKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVFTCIVSIILGLDLGLLAGLIFG :.::::..:.:::::. :: :. ::. :. : .::. : ..:.:.:::::....::. CCDS46 PKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFS 450 460 470 480 490 500 510 520 530 540 550 560 pF1KE0 LLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQGVKILRFSSPIFYGNVDGFKKC :: ::.:.:.: .. ::..:.::::... .:.. .: .:::..: :. ....:.. .. CCDS46 LLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDA 510 520 530 540 550 560 570 580 590 600 610 620 pF1KE0 IKSTVGFDAIRVYNKRLKALRK-----IQKLIKSGQLRATKNGIISDAVSTNNAFEPDED .:. : :. . ... : :.: ...: : .:: . ..: .. ... :. CCDS46 LKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAGPLLSACLAPQQVSSGDK- 570 580 590 600 610 630 640 650 660 670 680 pF1KE0 IEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVLDCGAISFLDVVGVRSLRVIV .:. .: : .: : . ...:. .:::.:: ::.::.:.: ..::. : CCDS46 ---MEDATANGQEDSKAPD-GSTLKA-LGLPQPDFHSLILDLGALSFVDTVCLKSLKNIF 620 630 640 650 660 670 690 700 710 720 730 pF1KE0 KEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFLTVHDAILY-LQNQVKSQEGQ ..:..:.:.::.:. .. :. .:: ::: .: : .: .::::. . ::. CCDS46 HDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSP 680 690 700 710 720 730 740 750 760 770 780 pF1KE0 GSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS CCDS46 VSVTRL 740 >>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 (791 aa) initn: 1403 init1: 1064 opt: 1436 Z-score: 1810.3 bits: 345.8 E(32554): 1.6e-94 Smith-Waterman score: 1556; 35.3% identity (70.2% similar) in 739 aa overlap (20-734:8-742) 10 20 30 40 50 60 pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR :.:.: .:: :... :.. .. . :.: . :: . CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK 10 20 30 40 70 80 90 100 110 120 pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA .:. :.:.: :::::..:.... :...:.: : . . ::::.:::: .:. ::::. CCDS30 IKAVVFGLLPVLSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA :::.::::..: ... : : :.:..::.. :..::. .: : . :.: : ...:::: CCDS30 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL .. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: .. CCDS30 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI ... .:.: ::..:...: .:. ::.:.. .:.. . . ::::: :. ::: :: CCDS30 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA : :.::...::::: : .. :.:. :: : ::: : : :: ...:....::.:.:. CCDS30 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT :.: ...:.. :.:. : .:.:::.::.: ::.:..::. : ::: : . ...:::. CCDS30 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV :::.. . .:::..:.:: : :: ::::.:.. .:::. . :: : :::..:.: CCDS30 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC 410 420 430 440 450 460 490 500 510 520 530 540 pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE ::: . . :..:.: :. .:. :..:.::...:: . .:... .:::: . :.:. . CCDS30 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ 470 480 490 500 510 520 550 560 570 580 590 pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA . ::.::. . ::....: . :.. . . .:.: .: . : :.: .: .. : : CCDS30 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR 530 540 550 560 570 580 600 610 620 630 640 pF1KE0 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN . :. .: . .. . :: : . .. .. : .. : .: : :.... CCDS30 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE 590 600 610 620 630 640 650 660 670 680 690 pF1KE0 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD .: : .:.:.:: ...::.:..:...: . . . .: :.:...... CCDS30 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA 650 660 670 680 690 700 700 710 720 730 740 750 pF1KE0 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL : . . . : :.: ... : ..:::.:. : ... CCDS30 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS 710 720 730 740 750 760 760 770 780 pF1KE0 ELIETELTEEELDVQDEAMRTLAS CCDS30 EEDIRSYWDLEQEMFGSMFHAETLTAL 770 780 790 >>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 (887 aa) initn: 1403 init1: 1064 opt: 1436 Z-score: 1809.6 bits: 345.8 E(32554): 1.8e-94 Smith-Waterman score: 1556; 35.3% identity (70.2% similar) in 739 aa overlap (20-734:8-742) 10 20 30 40 50 60 pF1KE0 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR :.:.: .:: :... :.. .. . :.: . :: . CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK 10 20 30 40 70 80 90 100 110 120 pF1KE0 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA .:. :.:.: :::::..:.... :...:.: : . . ::::.:::: .:. ::::. CCDS30 IKAVVFGLLPVLSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE0 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA :::.::::..: ... : : :.:..::.. :..::. .: : . :.: : ...:::: CCDS30 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE0 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL .. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: .. CCDS30 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE0 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI ... .:.: ::..:...: .:. ::.:.. .:.. . . ::::: :. ::: :: CCDS30 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE0 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA : :.::...::::: : .. :.:. :: : ::: : : :: ...:....::.:.:. CCDS30 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE0 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT :.: ...:.. :.:. : .:.:::.::.: ::.:..::. : ::: : . ...:::. CCDS30 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE0 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV :::.. . .:::..:.:: : :: ::::.:.. .:::. . :: : :::..:.: CCDS30 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC 410 420 430 440 450 460 490 500 510 520 530 540 pF1KE0 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE ::: . . :..:.: :. .:. :..:.::...:: . .:... .:::: . :.:. . CCDS30 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ 470 480 490 500 510 520 550 560 570 580 590 pF1KE0 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA . ::.::. . ::....: . :.. . . .:.: .: . : :.: .: .. : : CCDS30 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR 530 540 550 560 570 580 600 610 620 630 640 pF1KE0 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN . :. .: . .. . :: : . .. .. : .. : .: : :.... CCDS30 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE 590 600 610 620 630 640 650 660 670 680 690 pF1KE0 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD .: : .:.:.:: ...::.:..:...: . . . .: :.:...... CCDS30 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA 650 660 670 680 690 700 700 710 720 730 740 750 pF1KE0 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL : . . . : :.: ... : ..:::.:. : ... CCDS30 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS 710 720 730 740 750 760 760 770 780 pF1KE0 ELIETELTEEELDVQDEAMRTLAS CCDS30 EEDIRSYWDLEQEMFGSMFHAETLTALESLSAAGGCYPYRSESLVSPLFTRQALAAMDKP 770 780 790 800 810 820 >>CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 (701 aa) initn: 1371 init1: 976 opt: 1293 Z-score: 1630.0 bits: 312.2 E(32554): 1.8e-84 Smith-Waterman score: 1355; 32.6% identity (68.9% similar) in 700 aa overlap (43-726:28-684) 20 30 40 50 60 70 pF1KE0 LPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPIL :. :. : :::: . .... :.: CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPAT 10 20 30 40 50 80 90 100 110 120 130 pF1KE0 EWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGT .:: .:: .:.: .::.::. :.. . :..::.:::.. :.::..:: : ::..:: CCDS33 RWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGT 60 70 80 90 100 110 140 150 160 170 180 pF1KE0 SRHISVGPFPVVSLMVGSVV---LSMA---PDEHFLVSSSNGTVLNTT--MIDTAARDTA :::.::: : .. ::::.:: :..: :.. : ..:...:: . :.: . :: CCDS33 SRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCG-RDCY 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 RVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVST . .:.::::..:. :...: :..::. ::..::. ::. .:. .:.:::: .:.: CCDS33 AIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 KNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEV ..: .. : . .... :..:. : ... . ..: .:.:::.::.::.. ::.: :. CCDS33 PRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTEL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE0 IVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIA .: ..:: .:. ..:.: ...... .:: ::.::..: :.... . ..:.:: :.. CCDS33 LVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFS 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE0 VSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAG .:.....: .. :.. .:::..: : :.. .:. ::....::... :. .:: .::... CCDS33 ISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSS 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE0 IISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVF ..::..:....:::. :.. ::.:::: :....:.: . .. :.:::::.. ::..:. CCDS33 VVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAG 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE0 TCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQG : . .... . :::::.:..::... :.: : :. : .: .:... ..... : CCDS33 TAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPG 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE0 VKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRATKNGI :...::..:..:.: : : . . : .:.:: . .: : : ....:. CCDS33 VRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARR-----------KEG---GSETGV 540 550 560 570 580 610 620 630 640 650 660 pF1KE0 ISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVP----IHSLVL . : . ::: ::.. . :: .:..:. CCDS33 GEGG--------PAQG-EDLG-------------------PVSTRAALVPAAAGFHTVVI 590 600 610 670 680 690 700 710 pF1KE0 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFD----DNIRKD ::. . :::..:: .:. . ... . ... .: . : . : . ::. :. ... CCDS33 DCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEE 620 630 640 650 660 670 720 730 740 750 760 770 pF1KE0 TFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMR .::.::::. CCDS33 QLFLSVHDAVQTARARHRELEATDAHL 680 690 700 >>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa) initn: 1858 init1: 1247 opt: 1261 Z-score: 1589.1 bits: 304.8 E(32554): 3.4e-82 Smith-Waterman score: 1848; 41.2% identity (77.4% similar) in 696 aa overlap (56-731:41-724) 30 40 50 60 70 80 pF1KE0 VYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPILEWLPKYRVKEWLL ::: ::...: .:.: :::.: :..::: CCDS46 ERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLL 20 30 40 50 60 70 90 100 110 120 130 140 pF1KE0 SDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGTSRHISVGPFPVVS .:..::.:.... ::.::::::..: .::::.:.:.. ::.:::::::::: : :.: CCDS46 GDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMS 80 90 100 110 120 130 150 160 170 180 190 200 pF1KE0 LMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAARDTARVLIASALTLLVGIIQLIFGG .:::::. :.::. .:: .::. .:::.::: .::.:..:::..:. .: CCDS46 VMVGSVTESLAPQ-----------ALNDSMINETARDAARVQVASTLSVLVGLFQVGLGL 140 150 160 170 210 220 230 240 250 260 pF1KE0 LQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVSTKNYNGVLSIIYTLVEIFQNIG ...::.: ::..::: :.::::: ::.::::: :... ....: ::.:::..:. .. CCDS46 IHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLP 180 190 200 210 220 230 270 280 290 300 310 320 pF1KE0 DTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEVIVTIIATAISYGANLEKNYNA ..... ... .. :: ..:: :::......:.::: :... : ::.:::: .:.. ... CCDS46 QSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEV 240 250 260 270 280 290 330 340 350 360 370 380 pF1KE0 GIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIAVSVGKVYATKYDYTIDGNQEF .: .:: :..:: : ..:::......:.::::..:::.:.::..: .. : .:.:::. CCDS46 DVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQEL 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE0 IAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAGIISAAIVMIAILALGKLLEPL .:.:.::...:.:.:: .. ..::. :::::::..:::: ::. .... :. ::.:.. : CCDS46 VALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDL 360 370 380 390 400 410 450 460 470 480 490 500 pF1KE0 QKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVFTCIVSIILGLDLGLLAGLIFG :.::::..:.:::::. :: :. ::. :. : .::. : ..:.:.:::::....::. CCDS46 PKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFS 420 430 440 450 460 470 510 520 530 540 550 560 pF1KE0 LLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQGVKILRFSSPIFYGNVDGFKKC :: ::.:.:.: .. ::..:.::::... .:.. .: .:::..: :. ....:.. .. CCDS46 LLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDA 480 490 500 510 520 530 570 580 590 600 610 pF1KE0 IKSTVGFDAIRVYNKRLKALRK-----IQKLIKSGQLR---ATKNGIISDAVSTNNAFEP .:. : :. . ... : :.: ...: : .:: :. .: : ....:...: CCDS46 LKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGA-SVSINVNTSLED 540 550 560 570 580 590 620 630 640 650 660 pF1KE0 --DEDIEDLEELDIPTKEIEIQVDWNSELPVK---------VNVPKVPIHSLVLDCGAIS ....:: . ... . . .. :.. : ...:. .:::.:: ::.: CCDS46 MRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFHSLILDLGALS 600 610 620 630 640 650 670 680 690 700 710 720 pF1KE0 FLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIRKDTFFLTVHDAI :.:.: ..::. : ..:..:.:.::.:. .. :. .:: ::: .: : .: .::::. CCDS46 FVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHLFASVHDAV 660 670 680 690 700 710 730 740 750 760 770 780 pF1KE0 LY-LQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMRTLAS . ::. CCDS46 TFALQHPRPVPDSPVSVTRL 720 730 780 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 13:33:47 2016 done: Thu Nov 3 13:33:48 2016 Total Scan time: 3.970 Total Display time: 0.260 Function used was FASTA [36.3.4 Apr, 2011]