FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6259, 764 aa 1>>>pF1KB6259 764 - 764 aa - 764 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2011+/-0.00115; mu= 20.5807+/- 0.068 mean_var=65.2369+/-13.157, 0's: 0 Z-trim(101.4): 32 B-trim: 2 in 1/49 Lambda= 0.158792 statistics sampled from 6498 (6524) to 6498 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.543), E-opt: 0.2 (0.2), width: 16 Scan time: 3.830 The best scores are: opt bits E(32554) CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 4939 1141.1 0 CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 2288 533.8 3.9e-151 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1763 413.6 5.9e-115 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1690 396.8 6e-110 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 1459 343.8 4e-94 CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 1393 328.8 2.1e-89 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 1393 328.8 2.3e-89 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 1344 317.6 4.6e-86 CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 1293 305.9 1.5e-82 CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 1251 296.3 1.2e-79 CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 1212 287.3 6e-77 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 1209 286.6 9.5e-77 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 1209 286.6 9.7e-77 CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 1180 280.0 9.1e-75 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 1111 264.3 6.8e-70 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 1073 255.5 2.1e-67 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 1073 255.5 2.1e-67 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 961 229.8 1.2e-59 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 953 228.0 3.9e-59 CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 921 220.5 3.6e-57 CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 679 165.2 2.7e-40 CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 554 136.6 1.6e-31 CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 438 109.8 7.7e-24 CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 385 97.8 5.4e-20 CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 361 92.1 1.1e-18 >>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa) initn: 4939 init1: 4939 opt: 4939 Z-score: 6109.2 bits: 1141.1 E(32554): 0 Smith-Waterman score: 4939; 100.0% identity (100.0% similar) in 764 aa overlap (1-764:1-764) 10 20 30 40 50 60 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDERVRVAAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDERVRVAAAA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 SVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 SVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 VSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 VSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 AGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 AGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 YSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 YSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAII 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 VLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 VLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 VLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 VLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 PSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 PSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 IKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSLILDFSAVSFLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 IKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSLILDFSAVSFLD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB6 VSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIFFLTIHDAVLHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 VSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIFFLTIHDAVLHI 670 680 690 700 710 720 730 740 750 760 pF1KB6 LMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF :::::::::::::::::::::::::::::::::::::::::::: CCDS57 LMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF 730 740 750 760 >>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa) initn: 2292 init1: 1395 opt: 2288 Z-score: 2826.9 bits: 533.8 E(32554): 3.9e-151 Smith-Waterman score: 2288; 48.2% identity (80.1% similar) in 720 aa overlap (5-720:16-729) 10 20 30 40 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQK .. .:.:.::::: ::...:.. ...::. . : ::::: .. CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB6 AKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYAS : .. .: :: ::: ::.:::::::..::.:::.::.:::.:.:::. .: ::::.. CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB6 FFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLL ::: . :..:::::::::::::..:.::: ..: . .::.. . . .. :.... CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVG----SVVLSMAPDEHFLVSSSNGTVLNTTMI 130 140 150 160 170 170 180 190 200 210 220 pF1KB6 DD---ERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQL : . .:: :...:.: ::::: :: :.:::.: ::.. :..::::::: .:::::: CCDS57 DTAARDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB6 KFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKL :....... ... .::. .: .:..: ::.::....:....: :::.:.::. :. CCDS57 KIVLNVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKI 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB6 PVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGI ::::::: :.:.::...::: .... .....: .. :: :: : : :.. .. :.: CCDS57 PVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSI 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB6 AMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQEST :.::.:.: ::..::. :::: .:::::.::.:..:: : : :...:::::.:::::: CCDS57 AVVAYAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQEST 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB6 GGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDK :::::.::.:.: ::.:..::.: :: :::::::::....:::::.::. .: ::::..: CCDS57 GGKTQVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNK 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB6 YDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDY : .::..: : .:.::: ::: :.. : :::.:.:.:::. . :..: :.:::. :.: CCDS57 IDAVIWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNY 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB6 YDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGL .. ::.::::.: :::...:. :.. . ..:::. .:. :: ::::::.:: :.: CCDS57 KNIEEPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQ 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB6 LQVTPKGFIC-TVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS :..: .:.: .:.: . . . : ...: :: : : .. ...:::..::....:::. CCDS57 LRATKNGIISDAVSTNNAFEPDEDIEDLEELDIP--TKEIEIQVDWNSELPVKVNVPKVP 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB6 LHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVK .:::.:: .:.::::: .::.:. :..:: :: :.::... .: ::::.. ::: ... CCDS57 IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFDDNIR 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB6 SSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF .. ::::.:::.:.. CCDS57 KDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEA 720 730 740 750 760 770 >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 1746 init1: 1117 opt: 1763 Z-score: 2177.2 bits: 413.6 E(32554): 5.9e-115 Smith-Waterman score: 1763; 39.2% identity (71.6% similar) in 735 aa overlap (8-736:15-731) 10 20 30 40 50 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI .: : ::..: ...: . . .. :.:: .:.:.: . : CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA . ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:. CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER :.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : : CCDS57 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT :.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . CCDS57 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI . .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.:: CCDS57 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA :.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:. CCDS57 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.::::: CCDS57 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL :.:: ......:.:.:: :::. : ..::.:... :::::.:::... .:: .: . CCDS57 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY ::. ::. .. ::: :: ..: . :::...::: :. ..:... .:..: . : .. CCDS57 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK 480 490 500 510 520 530 540 550 560 570 580 pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV : :.:::. .:::.:: .. : .: .: :. : ::.:: : . . .. .. CCDS57 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL : :: . : ...... :..: : . . .: : ..:.. CCDS57 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV 600 610 620 630 640 650 660 670 680 690 700 pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF ::::. :.:.: .:. : .:..:. . . ::..: . . .. :.: .::.. . .. CCDS57 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELL 650 660 670 680 690 700 710 720 730 740 750 760 pF1KB6 FLTIHDAVLHILMKKDYSTSKFN--PSQEKDGKIDFTINTNGGLRNRVYEVPVETKF : .:::::: ... . .. . :::: CCDS57 FHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA 710 720 730 740 >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 1584 init1: 1117 opt: 1690 Z-score: 2087.4 bits: 396.8 E(32554): 6e-110 Smith-Waterman score: 1690; 39.9% identity (72.0% similar) in 690 aa overlap (8-693:15-685) 10 20 30 40 50 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI .: : ::..: ...: . . .. :.:: .:.:.: . : CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA . ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:. CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER :.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : : CCDS43 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT :.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . CCDS43 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI . .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.:: CCDS43 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA :.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:. CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.::::: CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL :.:: ......:.:.:: :::. : ..::.:... :::::.:::... .:: .: . CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY ::. ::. .. ::: :: ..: . :::...::: :. ..:... .:..: . : .. CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK 480 490 500 510 520 530 540 550 560 570 580 pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV : :.:::. .:::.:: .. : .: .: :. : ::.:: : . . .. .. CCDS43 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL : :: . : ...... :..: : . . .: : ..:.. CCDS43 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV 600 610 620 630 640 650 660 670 680 690 700 pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF ::::. :.:.: .:. : .:..:. . . ::..: . ::.. CCDS43 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSA-FIQR 650 660 670 680 710 720 730 740 750 760 pF1KB6 FLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF >>CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 (516 aa) initn: 1437 init1: 970 opt: 1459 Z-score: 1803.2 bits: 343.8 E(32554): 4e-94 Smith-Waterman score: 1459; 44.8% identity (77.2% similar) in 500 aa overlap (8-504:15-504) 10 20 30 40 50 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI .: : ::..: ...: . . .. :.:: .:.:.: . : CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA . ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:. CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER :.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : : CCDS43 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT :.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . CCDS43 VKVA--MSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI . .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.:: CCDS43 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA :.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:. CCDS43 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.::::: CCDS43 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL :.:: ......:.:.:: :::. : ..::.:... :::::.:::... .:: .: . CCDS43 QLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY ::. ::. .. ::: :: ..: . :::...::: CCDS43 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSFHTEMTRRWRP 480 490 500 510 540 550 560 570 580 590 pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVT >>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 (791 aa) initn: 1450 init1: 1020 opt: 1393 Z-score: 1718.7 bits: 328.8 E(32554): 2.1e-89 Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (8-718:7-735) 10 20 30 40 50 60 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI .:.: : .:: . :... .: : . . ..:. :: : : .:..:.:. CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG :::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.: CCDS30 LSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG 60 70 80 90 100 110 130 140 150 160 170 pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA ... : : ..:..:: . . .:. . . . ::..: : .: : :. CCDS30 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH ..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::. CCDS30 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT : : :: .. .. ... .::::.:. ::: . .:::.: :. :. ::: :.:.. CCDS30 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV :.:...: :: . ..... .::... :: :..: : ... .: :..:.:.... ... CCDS30 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB6 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG . . . :. : .:.:::.:::: .:. . :. . ::: . . ...:::.:.:.: CCDS30 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB6 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI ...:.:..:..:. : :: ::::.:: :::. : :... ::::.: :: ::...:. CCDS30 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB6 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI .. :.: :.:..:::..:..::.::: . .::.. :.:: : : : . .:.:: CCDS30 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB6 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP . ::.:::: .::.:.: .:..: ..: ..: :.: .: :...:.. : CCDS30 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK 540 550 560 570 580 590 600 610 620 630 640 pF1KB6 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK---- . .. .. : :. .. . ... . : : .. . : . :.: CCDS30 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD 600 610 620 630 640 650 650 660 670 680 690 pF1KB6 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN ...:.::::.:.:::.:. ....: .. . . .: : :..:. . . .. CCDS30 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS 660 670 680 690 700 710 700 710 720 730 740 750 pF1KB6 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR . : :: .. . : .:::::: CCDS30 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY 720 730 740 750 760 770 >>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 (887 aa) initn: 1450 init1: 1020 opt: 1393 Z-score: 1718.0 bits: 328.8 E(32554): 2.3e-89 Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (8-718:7-735) 10 20 30 40 50 60 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI .:.: : .:: . :... .: : . . ..:. :: : : .:..:.:. CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG :::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.: CCDS30 LSWLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG 60 70 80 90 100 110 130 140 150 160 170 pF1KB6 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA ... : : ..:..:: . . .:. . . . ::..: : .: : :. CCDS30 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH ..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::. CCDS30 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT : : :: .. .. ... .::::.:. ::: . .:::.: :. :. ::: :.:.. CCDS30 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV :.:...: :: . ..... .::... :: :..: : ... .: :..:.:.... ... CCDS30 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB6 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG . . . :. : .:.:::.:::: .:. . :. . ::: . . ...:::.:.:.: CCDS30 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB6 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI ...:.:..:..:. : :: ::::.:: :::. : :... ::::.: :: ::...:. CCDS30 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB6 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI .. :.: :.:..:::..:..::.::: . .::.. :.:: : : : . .:.:: CCDS30 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB6 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP . ::.:::: .::.:.: .:..: ..: ..: :.: .: :...:.. : CCDS30 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK 540 550 560 570 580 590 600 610 620 630 640 pF1KB6 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK---- . .. .. : :. .. . ... . : : .. . : . :.: CCDS30 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD 600 610 620 630 640 650 650 660 670 680 690 pF1KB6 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN ...:.::::.:.:::.:. ....: .. . . .: : :..:. . . .. CCDS30 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS 660 670 680 690 700 710 700 710 720 730 740 750 pF1KB6 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR . : :: .. . : .:::::: CCDS30 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY 720 730 740 750 760 770 >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 1667 init1: 1134 opt: 1344 Z-score: 1658.5 bits: 317.6 E(32554): 4.6e-86 Smith-Waterman score: 1678; 37.9% identity (71.4% similar) in 721 aa overlap (9-721:29-724) 10 20 30 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHL- : . ::. . . .:: :: .. : CCDS46 MGLADASGPRDTQALLSATQAMDLRRRDYHMERPLLNQEHLEE----LGRWGSAPRTHQW 10 20 30 40 50 40 50 60 70 80 90 pF1KB6 KVCCSCSPQKAKRIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVD .. .:: .: ..:. .:. ::: : ...:::.:..::.:..:. . ::::.:::. CCDS46 RTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAG 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB6 IPPVYGLYASFFPAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGL .:::.:::.::.:..::..:::::::::: : ..:.::: .. . . .:. : CCDS46 LPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVMSVMVGSVTESLAPQALND-------- 120 130 140 150 160 160 170 180 190 200 210 pF1KB6 PNNSNNSSLLDDERVRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAV . : . : ::.::. ...:: :..:...:....:::: :::: :. :.:::::: CCDS46 --SMINETARDAARVQVAS--TLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAV 170 180 190 200 210 220 220 230 240 250 260 270 pF1KB6 HVLVSQLKFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEIN .:.:::::..: : . ::. :.:.. .. : .. ..... .::: .. .:. .:: .: CCDS46 QVFVSQLKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLN 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB6 QRFKDKLPVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNT ......::.::: :.. . :.:.::: .:.::.: :::.. :. ::..:... :.. CCDS46 DKLQQQLPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKL 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB6 VGDCFGIAMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSR ::. : ::.:.::.:.:......:.. : .:.::::.::::.:.. :.:. : : ..:: CCDS46 VGSAFTIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSR 350 360 370 380 390 400 400 410 420 430 440 450 pF1KB6 SAVQESTGGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIG : :::::::..:.:: :.....:.... .: :. : :.::::. . :::::: :.... CCDS46 SLVQESTGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMR 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB6 RLWRKDKYDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNI ::. .. : :::..:: ::.:.: :::...: :.:: .: :::.:. :.:... :.: CCDS46 SLWKANRADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDI 470 480 490 500 510 520 520 530 540 550 560 570 pF1KB6 YKNKKDYYDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRK-- :.. .: . : .:::.:: . .:::: :. : . : . .. ...: :.: CCDS46 YRDVAEYSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQE 530 540 550 560 570 580 580 590 600 610 620 630 pF1KB6 ---IRKLQKQGLL--QVTPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWN ...:::. : :. : : . .: .... : : . : . CCDS46 QLKLKQLQKEEKLRKQAGPLLSACLAPQQVSSGDKME-------DATANGQEDSKAPDGS 590 600 610 620 630 640 650 660 670 680 690 pF1KB6 DDLPLNIEVPKISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIE :.. :. ..::::::..:.::.:. ...::.:...: .:.:.::... . . CCDS46 TLKALGL--PQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVS 640 650 660 670 680 690 700 710 720 730 740 750 pF1KB6 KLNRYEFFDGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLR .:. .:::. . .. .: ..:::: : CCDS46 QLEAGHFFDASITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 700 710 720 730 740 >>CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 (739 aa) initn: 968 init1: 895 opt: 1293 Z-score: 1595.4 bits: 305.9 E(32554): 1.5e-82 Smith-Waterman score: 1335; 32.2% identity (68.8% similar) in 712 aa overlap (23-725:57-724) 10 20 30 40 50 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTF-LDHLKVCCSCSPQKAK : ..:. . : : . .:. :.::: ::: CCDS43 IHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAK 30 40 50 60 70 80 60 70 80 90 100 110 pF1KB6 RIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFF ..:...:. .::: : ::. .:.:..::. .::. : :..:..::. ::::::.::: CCDS43 NMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFF 90 100 110 120 130 140 120 130 140 150 160 170 pF1KB6 PAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLD- .:::...::::::::: : .: .:.: .:. ..:: : .. .: ::.:.::. CCDS43 ASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLNH 150 160 170 180 190 200 180 190 200 210 220 pF1KB6 -DERV------RVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLV ..:. . ....:: ..:. :.:.:....::: .:::..:.:::.:.:. .:. CCDS43 TSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTILT 210 220 230 240 250 260 230 240 250 260 270 280 pF1KB6 SQLKFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFK :: :... :..: . :.. . :: .:.:::. ::.:.:. :::. .::.:..:: CCDS43 SQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHFK 270 280 290 300 310 320 290 300 310 320 330 340 pF1KB6 DKLPVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDC .:: .:::::....: :. .:. ... .. ...: . ::.:: .:. . . ... : CCDS43 SKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVDA 330 340 350 360 370 380 350 360 370 380 390 400 pF1KB6 FGIAMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQ ..:....::.. :.. ... :. : . .:::. :.:. ::. . :. :. :.::... :. CCDS43 IAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLVK 390 400 410 420 430 440 410 420 430 440 450 460 pF1KB6 ESTGGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWR :::: .::..:.. :...:.:.:.:. :. ::::::..... ::.: : .: .. ..: CCDS43 ESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMWS 450 460 470 480 490 500 470 480 490 500 510 520 pF1KB6 KDKYDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNK ...: .::..:.. . .:. .:: ..: :... ...::: :: : :. . ....... CCDS43 ISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFESV 510 520 530 540 550 560 530 540 550 560 570 580 pF1KB6 KDYYDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQK . : .. :.:::: .:.:. : :. : . .:. : .:: . ::... CCDS43 SAYKNLQIKPGIKIFRFVAPLYYINKECFKSALYKQT-VNPILIKVAWKKAAK--RKIKE 570 580 590 600 610 620 590 600 610 620 630 640 pF1KB6 QGLLQVTPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPK . . :. :.: :.. .. . : ::. CCDS43 K----------VVTLGGIQD---EMS-------------------VQLSHD-PLE----- 630 640 650 660 670 680 690 700 pF1KB6 ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGE ::....: ::..:::..... :: . ... : ..: .. . ..:. :. : CCDS43 --LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKE 650 660 670 680 690 700 710 720 730 740 750 760 pF1KB6 VKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETK . ...: ....:. ..:. CCDS43 -EENLLFYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD 710 720 730 >>CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 (712 aa) initn: 1639 init1: 760 opt: 1251 Z-score: 1543.6 bits: 296.3 E(32554): 1.2e-79 Smith-Waterman score: 1592; 37.3% identity (68.2% similar) in 735 aa overlap (8-736:15-699) 10 20 30 40 50 pF1KB6 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRI .: : ::..: ...: . . .. :.:: .:.:.: . : CCDS55 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 VLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPA . ..::..:::::..::..:.:.:::::::.. . ::::::.:. .::..:::.::.:. CCDS55 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB6 IIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDDER :.: :.:::::::.::: ..:.:.: :.. . ::: . :. : .:.. : : CCDS55 IMYCFLGTSRHISIGPFAVISLMIG----GVAVRLVPDDIVIPGGV-NATNGTEARDALR 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 VRVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLT :.:: :::.::::::. .:. :.:::.:::.: :. ::::::::::..:.::..: . CCDS55 VKVAM--SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 VPSHTDPVSIFKVLYS---VFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPI . .. .::.:.:: :...... :. .: ..:.:. .. ::.:.:::.:::.:: CCDS55 TKRYS---GIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 PIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVA :.::. .:...:.: : ..:. ..: ::: . :. :: .::. :. . : ..::.:. CCDS55 PLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB6 FAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKT :.:..:.:.. . :. : .::::::::::: : . ..:. :. : .:::: :::.::::: CCDS55 FSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKT 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB6 QIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCL :.:: ......:.:.:: :::. : .. CCDS55 QLAGCLASLMILLVILATGFLFESLPQT-------------------------------- 420 430 480 490 500 510 520 530 pF1KB6 IWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMY ::. ::. .. ::: :: ..: . :::...::: :. ..:... .:..: . : .. CCDS55 IWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVK 440 450 460 470 480 490 540 550 560 570 580 pF1KB6 EPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK-LQKQGLLQV : :.:::. .:::.:: .. : .: .: :. : ::.:: : . . .. .. CCDS55 EIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANMANA 500 510 520 530 540 550 590 600 610 620 630 640 pF1KB6 TPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKISLHSL : :: . : ...... :..: : . . .: : ..:.. CCDS55 TVVKADAEVDGEDATKPEEEDGEVKYPPIVIKST---FPEEMQRFMP-----PGDNVHTV 560 570 580 590 600 610 650 660 670 680 690 700 pF1KB6 ILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGEVKSSIF ::::. :.:.: .:. : .:..:. . . ::..: . . .. :.: .::.. . .. CCDS55 ILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFFENPALWELL 620 630 640 650 660 670 710 720 730 740 750 760 pF1KB6 FLTIHDAVLHILMKKDYSTSKFN--PSQEKDGKIDFTINTNGGLRNRVYEVPVETKF : .:::::: ... . .. . :::: CCDS55 FHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA 680 690 700 710 764 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 08:20:17 2016 done: Sat Nov 5 08:20:18 2016 Total Scan time: 3.830 Total Display time: 0.270 Function used was FASTA [36.3.4 Apr, 2011]