FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5649, 739 aa 1>>>pF1KB5649 739 - 739 aa - 739 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1164+/-0.00119; mu= 15.1779+/- 0.071 mean_var=63.9261+/-12.767, 0's: 0 Z-trim(99.9): 37 B-trim: 0 in 0/49 Lambda= 0.160411 statistics sampled from 5873 (5903) to 5873 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.522), E-opt: 0.2 (0.181), width: 16 Scan time: 3.370 The best scores are: opt bits E(32554) CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 4777 1115.0 0 CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 2142 505.2 1.4e-142 CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 1296 309.4 1.3e-83 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1111 266.6 9.1e-71 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1111 266.6 9.9e-71 CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 1091 262.0 2.6e-69 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 991 238.8 2.3e-62 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 982 236.8 9.5e-62 CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 982 236.8 9.8e-62 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 982 236.8 9.8e-62 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 966 233.0 1.1e-60 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 959 231.4 3.4e-60 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 919 222.2 1.6e-57 CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 884 214.1 6.9e-55 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 884 214.1 7.7e-55 CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 832 202.0 2.6e-51 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 803 195.3 2.5e-49 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 795 193.5 1e-48 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 695 170.3 1.2e-41 CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 669 164.3 4.7e-40 CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 598 147.9 1.7e-35 CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 543 135.1 1.8e-31 CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 539 134.2 8.1e-31 CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 403 102.7 9.5e-22 CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 272 72.4 2.3e-12 >>CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 (739 aa) initn: 4777 init1: 4777 opt: 4777 Z-score: 5968.5 bits: 1115.0 E(32554): 0 Smith-Waterman score: 4777; 99.9% identity (99.9% similar) in 739 aa overlap (1-739:1-739) 10 20 30 40 50 60 pF1KB5 MSSESKEQHNVSPRDSAEGNDSYPSGIHLELQRESSTDFKQFETNDQCRPYHRILIERQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MSSESKEQHNVSPRDSAEGNDSYPSGIHLELQRESSTDFKQFETNDQCRPYHRILIERQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 KSDTNFKEFVIKKLQKNCQCSPAKAKNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KSDTNFKEFVIKKLQKNCQCSPAKAKNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 LLVPQSIAYSLLAGQEPVYGLYTSFFASIIYFLLGTSRHISVGIFGVLCLMIGETVDREL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LLVPQSIAYSLLAGQEPVYGLYTSFFASIIYFLLGTSRHISVGIFGVLCLMIGETVDREL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QKAGYDNAHSAPSLGMVSNGSTLLNHTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QKAGYDNAHSAPSLGMVSNGSTLLNHTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 VGFVSVYLSDALLSGFVTGASFTILTSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VGFVSVYLSDALLSGFVTGASFTILTSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 NLCDLITSLLCLLVLLPTKELNEHFKSKLKAPIPIELVVVVAATLASHFGKLHENYNSSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NLCDLITSLLCLLVLLPTKELNEHFKSKLKAPIPIELVVVVAATLASHFGKLHENYNSSI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 AGHIPTGFMPPKVPEWNLIPSVAVDAIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AGHIPTGFMPPKVPEWNLIPSVAVDAIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 IGFCNIIPSFFHCFTTSAALAKTLVKESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IGFCNIIPSFFHCFTTSAALAKTLVKESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 SVLGVITIVNLRGALRKFRDLPKMWSISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SVLGVITIVNLRGALRKFRDLPKMWSISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIF 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 CVILRTQKPKSSLLGLVEESEVFESVSAYKNLQTKPGIKIFRFVAPLYYINKECFKSALY ::::::::::::::::::::::::::::::::: :::::::::::::::::::::::::: CCDS43 CVILRTQKPKSSLLGLVEESEVFESVSAYKNLQIKPGIKIFRFVAPLYYINKECFKSALY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 KQTVNPILIKVAWKKAAKRKIKEKVVTLGGIQDEMSVQLSHDPLELHTIVIDCSAIQFLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KQTVNPILIKVAWKKAAKRKIKEKVVTLGGIQDEMSVQLSHDPLELHTIVIDCSAIQFLD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 TAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKEEENLLFYSVYEAMAFAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKEEENLLFYSVYEAMAFAE 670 680 690 700 710 720 730 pF1KB5 VSKNQKGVCVPNGLSLSSD ::::::::::::::::::: CCDS43 VSKNQKGVCVPNGLSLSSD 730 >>CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 (701 aa) initn: 2185 init1: 1452 opt: 2142 Z-score: 2673.2 bits: 505.2 E(32554): 1.4e-142 Smith-Waterman score: 2162; 48.4% identity (78.5% similar) in 678 aa overlap (56-719:17-687) 30 40 50 60 70 80 pF1KB5 GIHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKA ..::. . ...:.. .: .:.:: . CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCV 10 20 30 40 90 100 110 120 130 140 pF1KB5 KNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSF . .. .::. .:: .: .. . :::::::..::.::::.:::::::: .:.:.::::: CCDS33 RALVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSF 50 60 70 80 90 100 150 160 170 180 190 200 pF1KB5 FASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLN ::..::::.:::::.:::::..::::.:..:::::: ::.: .... . : .:.::: . CCDS33 FANLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPG--ANSSTLNG 110 120 130 140 150 160 210 220 230 240 250 260 pF1KB5 HTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTIL .. : ..:::: :....:...:.::: :: ...::::.:::. ::.::. ::: ::: CCDS33 SAAMLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTIL 170 180 190 200 210 220 270 280 290 300 310 320 pF1KB5 TSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHF ::: :.:::. .:: .: : .. ::. ..:. ..:.::..:: .:: ::: .:::.... CCDS33 TSQLKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRY 230 240 250 260 270 280 330 340 350 360 370 380 pF1KB5 KSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVD . .:..:.: ::.:.:.:::.::::.::. ..::.:: ::::::::.::: :. ::.: CCDS33 RHRLRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALD 290 300 310 320 330 340 390 400 410 420 430 440 pF1KB5 AIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLV :.:..... :...::.::::..:::.:.::::. :.: ::..:.:.:::.:::::::.:: CCDS33 AVALALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLV 350 360 370 380 390 400 450 460 470 480 490 500 pF1KB5 KESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMW : .:::.::::.::.: :.:::::..::::..::.:::. . .:.::::::: :::..: CCDS33 KTATGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLW 410 420 430 440 450 460 510 520 530 540 550 560 pF1KB5 SISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFES .: :...: : . :.::: :::.:: .:.. . :::.:...::. . .. .:. CCDS33 RMSPADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYED 470 480 490 500 510 520 570 580 590 600 610 620 pF1KB5 VSAYKNLQTKPGIKIFRFVAPLYYINKECFKSALYKQTVNPILIKVAWKKAAKRKI--KE .. ...: .::...::: .:::: ::. : ..::. : : ::.:: .: CCDS33 ATEFEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-----AGCMAARRKEGGSE 530 540 550 560 570 630 640 650 660 670 pF1KB5 KVVTLGG-IQDE----MSVQLSHDPLE--LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEA : :: : : .:.. . : .::.::::. . :::.::. ::...:::: : CCDS33 TGVGEGGPAQGEDLGPVSTRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGA 580 590 600 610 620 630 680 690 700 710 720 730 pF1KB5 IGIQVLLAQCNPTVRDSLTNGEYCKK-----EEENLLFYSVYEAMAFAEVSKNQKGVCVP .::..::: :.: ::: :. : . . ::. :: ::..:. : CCDS33 LGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDA 640 650 660 670 680 690 pF1KB5 NGLSLSSD CCDS33 HL 700 >>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa) initn: 971 init1: 898 opt: 1296 Z-score: 1614.5 bits: 309.4 E(32554): 1.3e-83 Smith-Waterman score: 1338; 32.1% identity (69.0% similar) in 714 aa overlap (57-724:23-725) 30 40 50 60 70 80 pF1KB5 IHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAK : ..:. . : : . .:. :.::: ::: CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTF-LDHLKVCCSCSPQKAK 10 20 30 40 50 90 100 110 120 130 140 pF1KB5 NMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFF ..:...:. .::: : ::. .:.:..::. .::. : :..:..::. ::::::.::: CCDS57 RIVLSLFPIASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFF 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB5 ASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMV--SNGSTLL .:::...::::::::: : .: .:.: .:. ..:: : ..: .::. ::.:.:: CCDS57 PAIIYLFFGTSRHISVGPFPILSMMVGLAVSGAVSKAVPD--RNATTLGLPNNSNNSSLL 120 130 140 150 160 210 220 230 240 250 260 pF1KB5 NHTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTI . ..:. . ....:: ..:. :.:.:....::: .:::..:.:::.:.:. . CCDS57 D--DERV------RVAAAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHV 170 180 190 200 210 220 270 280 290 300 310 320 pF1KB5 LTSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEH :.:: :... :..: . :.. . :: .:.:::. ::.:.:. :::. .::.:.. CCDS57 LVSQLKFIFQLTVPSHTDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQR 230 240 250 260 270 280 330 340 350 360 370 380 pF1KB5 FKSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAV ::.:: .:::::....: :. .:. ... .. ...: . ::.:: .:. . . ... CCDS57 FKDKLPVPIPIEFIMTVIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVG 290 300 310 320 330 340 390 400 410 420 430 440 pF1KB5 DAIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTL : ..:....::.. :.. ... :. : . .:::. :.:. ::. . :. :. :.::... CCDS57 DCFGIAMVAFAVAFSVASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSA 350 360 370 380 390 400 450 460 470 480 490 500 pF1KB5 VKESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKM :.:::: .::..:.. :...:.:.:.:. :. ::::::..... ::.: : .: .. .. CCDS57 VQESTGGKTQIAGLIGAIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRL 410 420 430 440 450 460 510 520 530 540 550 560 pF1KB5 WSISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFE : ...: .::..:.. . .:. .:: ..: :... ...::: :: : :. . ...... CCDS57 WRKDKYDCLIWIMTFIFTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYK 470 480 490 500 510 520 570 580 590 600 610 620 pF1KB5 SVSAYKNLQTKPGIKIFRFVAPLYYINKECFKSALYKQT-VNPILIKVAWKKAAK--RKI . . : .. :.:::: .:.:. : :. : . .:. : .:: . ::. CCDS57 NKKDYYDMYEPEGVKIFRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKL 530 540 550 560 570 580 630 640 pF1KB5 KEK----------VVTLGGIQD---EMS---VQLSHDPLE-------------------- ... . :. :.: :.. ... .:.. CCDS57 QKQGLLQVTPKGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEV 590 600 610 620 630 640 650 660 670 680 690 700 pF1KB5 ----LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCK ::....: ::..:::..... :: . ... : ..: .. . ..:. :. CCDS57 PKISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFD 650 660 670 680 690 700 710 720 730 pF1KB5 KE-EENLLFYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD : . ...: ....:. ..:. CCDS57 GEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVE 710 720 730 740 750 760 >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 1636 init1: 1075 opt: 1111 Z-score: 1383.9 bits: 266.6 E(32554): 9.1e-71 Smith-Waterman score: 1530; 36.9% identity (69.3% similar) in 681 aa overlap (49-691:20-684) 20 30 40 50 60 70 pF1KB5 GNDSYPSGIHLELQRESSTDFKQFETNDQCRPY--HRILIERQEKSDTNFKEFVIKKLQK :: : .: :: . .: . . . ::.. CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKD-KVPDSIADKLKQ 10 20 30 40 80 90 100 110 120 130 pF1KB5 NCQCSPAKAKNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQE :.: : .:.: :::. .::: : .:. .:::..::. .:.: .::..:...::. CCDS43 AFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVP 50 60 70 80 90 100 140 150 160 170 180 190 pF1KB5 PVYGLYTSFFASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGM :..:::.::. :.: .::::::::.: :.:. :::: .. : . :. . CCDS43 PIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLV-----------PDDIV 110 120 130 140 150 200 210 220 230 240 250 pF1KB5 VSNGSTLLNHTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGF . .: . : : : . . :. .::...:. : .: . :::..::.. :. :: CCDS43 IPGGVNATNGTEAR----DALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGF 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB5 VTGASFTILTSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLL .:.:. ..::. :::.:.. : .:. :.. . . :..:... :.:.: ..:. . .:: CCDS43 TTAAAVHVFTSMLKYLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLL 220 230 240 250 260 270 320 330 340 350 360 370 pF1KB5 PTKELNEHFKSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEW ::.::.:: :: ::::.:. .:: .: : .:.:.:: ...: .: :..:: :. CCDS43 GGKEFNERFKEKLPAPIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDT 280 290 300 310 320 330 380 390 400 410 420 430 pF1KB5 NLIPSVAVDAIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTT .:. : ::::::.:.::..:.:... .:.:::: : .:::. :.:.:: : :.:. :. CCDS43 SLFHLVYVDAIAIAIVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSI 340 350 360 370 380 390 440 450 460 470 480 490 pF1KB5 SAALAKTLVKESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALR : .:...::.:.:: .:::.: ...:..:::.:. . :: :: ..::..:.::::.: . CCDS43 SCSLSRSLVQEGTGGKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFM 400 410 420 430 440 450 500 510 520 530 540 550 pF1KB5 KFRDLPKMWSISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGL .: ::: .: :... .::..:..:: .:. . ::...: .... :: :::.:. ..:: CCDS43 QFSDLPFFWRTSKIELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGK 460 470 480 490 500 510 560 570 580 590 600 610 pF1KB5 VEESEVFESVSAYKNLQTKPGIKIFRFVAPLYYINKECFKSALYKQT-VNPILIKVAWKK . :..:. ...::.... ::::::.. ::.:: :.. ...:: ..: ::: .: : .: CCDS43 LPETDVYIDIDAYEEVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRK 520 530 540 550 560 570 620 630 640 pF1KB5 AAKRKIKE---------KVVTLGGIQD--------EMSVQLSHDPL-------------- : .. :: :: . : : . .... :. CCDS43 AMRKYAKEVGNANMANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFM 580 590 600 610 620 630 650 660 670 680 690 700 pF1KB5 ----ELHTIVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYC ..::...: . ..:.:..:..:: . ..: .:: : :: :. .. CCDS43 PPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR 640 650 660 670 680 710 720 730 pF1KB5 KKEEENLLFYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 1649 init1: 1075 opt: 1111 Z-score: 1383.3 bits: 266.6 E(32554): 9.9e-71 Smith-Waterman score: 1564; 36.6% identity (69.4% similar) in 707 aa overlap (49-716:20-710) 20 30 40 50 60 70 pF1KB5 GNDSYPSGIHLELQRESSTDFKQFETNDQCRPY--HRILIERQEKSDTNFKEFVIKKLQK :: : .: :: . .: . . . ::.. CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKD-KVPDSIADKLKQ 10 20 30 40 80 90 100 110 120 130 pF1KB5 NCQCSPAKAKNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQE :.: : .:.: :::. .::: : .:. .:::..::. .:.: .::..:...::. CCDS57 AFTCTPKKIRNIIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVP 50 60 70 80 90 100 140 150 160 170 180 190 pF1KB5 PVYGLYTSFFASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGM :..:::.::. :.: .::::::::.: :.:. :::: .. : . :. . CCDS57 PIFGLYSSFYPVIMYCFLGTSRHISIGPFAVISLMIGGVAVRLV-----------PDDIV 110 120 130 140 150 200 210 220 230 240 250 pF1KB5 VSNGSTLLNHTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGF . .: . : : : . . :. .::...:. : .: . :::..::.. :. :: CCDS57 IPGGVNATNGTEAR----DALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGF 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB5 VTGASFTILTSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLL .:.:. ..::. :::.:.. : .:. :.. . . :..:... :.:.: ..:. . .:: CCDS57 TTAAAVHVFTSMLKYLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLL 220 230 240 250 260 270 320 330 340 350 360 370 pF1KB5 PTKELNEHFKSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEW ::.::.:: :: ::::.:. .:: .: : .:.:.:: ...: .: :..:: :. CCDS57 GGKEFNERFKEKLPAPIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDT 280 290 300 310 320 330 380 390 400 410 420 430 pF1KB5 NLIPSVAVDAIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTT .:. : ::::::.:.::..:.:... .:.:::: : .:::. :.:.:: : :.:. :. CCDS57 SLFHLVYVDAIAIAIVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSI 340 350 360 370 380 390 440 450 460 470 480 490 pF1KB5 SAALAKTLVKESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALR : .:...::.:.:: .:::.: ...:..:::.:. . :: :: ..::..:.::::.: . CCDS57 SCSLSRSLVQEGTGGKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFM 400 410 420 430 440 450 500 510 520 530 540 550 pF1KB5 KFRDLPKMWSISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGL .: ::: .: :... .::..:..:: .:. . ::...: .... :: :::.:. ..:: CCDS57 QFSDLPFFWRTSKIELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGK 460 470 480 490 500 510 560 570 580 590 600 610 pF1KB5 VEESEVFESVSAYKNLQTKPGIKIFRFVAPLYYINKECFKSALYKQT-VNPILIKVAWKK . :..:. ...::.... ::::::.. ::.:: :.. ...:: ..: ::: .: : .: CCDS57 LPETDVYIDIDAYEEVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRK 520 530 540 550 560 570 620 630 640 pF1KB5 AAKRKIKE---------KVVTLGGIQD--------EMSVQLSHDPL-------------- : .. :: :: . : : . .... :. CCDS57 AMRKYAKEVGNANMANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFM 580 590 600 610 620 630 650 660 670 680 690 700 pF1KB5 ----ELHTIVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYC ..::...: . ..:.:..:..:: . ..: .:: : :: :. : ..:: ... CCDS57 PPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFF 640 650 660 670 680 690 710 720 730 pF1KB5 KKEEE-NLLFYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD .. .:::.:...:. CCDS57 ENPALWELLFHSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA 700 710 720 730 740 >>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa) initn: 1451 init1: 1050 opt: 1091 Z-score: 1357.9 bits: 262.0 E(32554): 2.6e-69 Smith-Waterman score: 1479; 34.4% identity (71.0% similar) in 724 aa overlap (49-727:24-738) 20 30 40 50 60 70 pF1KB5 GNDSYPSGIHLELQRESSTDFKQFETNDQCRP-YHRILIERQEKSDTNFKEFVIKKLQKN :: : .. ...:.. . .. . ..: : CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKC 10 20 30 40 50 80 90 100 110 120 130 pF1KB5 CQCSPAKAKNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEP :.:: .: ... ..:.:.::::: .:. .:.::.::. .:.. . :..::.:::. CCDS57 CSCSRKRAFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPV 60 70 80 90 100 110 140 150 160 170 180 190 pF1KB5 VYGLYTSFFASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMV ::::..:: . ::..::::::::: : :. ::.: .: :. : . : : CCDS57 GYGLYSAFFPILTYFIFGTSRHISVGPFPVVSLMVGSVV---LSMA--PDEHFLVS---S 120 130 140 150 160 200 210 220 230 240 250 pF1KB5 SNGSTLLNHTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFV ::: :.:: : .. ....:..:...:. :. .: .:.::. ::.: :..::. CCDS57 SNG-TVLNTTMIDTAARDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFT 170 180 190 200 210 220 260 270 280 290 300 310 pF1KB5 TGASFTILTSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLP :.:.: .:.:: : .:... ::: :.: : ...:.:: ::: :. ..:: ..: . CCDS57 TAAAFQVLVSQLKIVLNVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMA 230 240 250 260 270 280 320 330 340 350 360 370 pF1KB5 TKELNEHFKSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWN .::::..:. :. .:::::..:.. :: :. ..:..:::..:. :: ::.::..: . CCDS57 VKELNDRFRHKIPVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVS 290 300 310 320 330 340 380 390 400 410 420 430 pF1KB5 LIPSVAVDAIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTS :. . . ...:.....::.::.....: :. ::. .:::. :.:. ::. .:: ::... CCDS57 LFSEMLAASFSIAVVAYAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVAT 350 360 370 380 390 400 440 450 460 470 480 490 pF1KB5 AALAKTLVKESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRK .::..: :.:::: .::..:...: ......:... :. ::::::....:.::.: . . CCDS57 TALSRTAVQESTGGKTQVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQ 410 420 430 440 450 460 500 510 520 530 540 550 pF1KB5 FRDLPKMWSISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLV . :.:..: ...:.::: : . : .:. ..:::.:. :... :.::.: :. . :: . CCDS57 LCDIPRLWRQNKIDAVIWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSI 470 480 490 500 510 520 560 570 580 590 600 pF1KB5 EESEVFESVSAYKNLQTKPGIKIFRFVAPLYYIN----KECFKSAL-------YKQTVNP .....:.. :::.. :.::.:: .:..: : :.:.::.. :.. .. CCDS57 PSTDIYKSTKNYKNIEEPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKA 530 540 550 560 570 580 610 620 630 640 pF1KB5 I-----LIKVAWKKAAKRKIKEKVVTLGG-------IQD---------EMSVQL---SHD . ::: . .:.: : .:. .. :.: :. .:. :. CCDS57 LRKIQKLIKSGQLRATKNGIISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSEL 590 600 610 620 630 640 650 660 670 680 690 pF1KB5 PLE-------LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLT :.. .:..:.::.::.:::..:...:. . .... : ..: .:. . : ..: CCDS57 PVKVNVPKVPIHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLE 650 660 670 680 690 700 700 710 720 730 pF1KB5 N-GEYCKKEEENLLFYSVYEAMAFAEVS-KNQKGVCVPNGLSLSSD . : . . ... .: .:..:. . . . :.:.: CCDS57 QCGFFDDNIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELT 710 720 730 740 750 760 CCDS57 EEELDVQDEAMRTLAS 770 780 >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 1380 init1: 978 opt: 991 Z-score: 1233.3 bits: 238.8 E(32554): 2.3e-62 Smith-Waterman score: 1394; 34.6% identity (70.2% similar) in 684 aa overlap (79-719:61-723) 50 60 70 80 90 100 pF1KB5 RPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAKNMILGFLPVLQWLPKYDLKKNI ::: :.: ..: :::: :::.: .. . CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 40 50 60 70 80 90 110 120 130 140 150 160 pF1KB5 LGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFFASIIYFLLGTSRHISVGIFGVL :::..::: :.:. .::..::.:::: ::.:::.::. .::::.::::::::: :.:. CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVM 100 110 120 130 140 150 170 180 190 200 210 220 pF1KB5 CLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLNHTSDRICDKSCYAIMVGSTVTFI .:.: ... .: : ...:.:. .. ..:.::.. . CCDS46 SVMVGSVTESLAPQALND---------------SMINETA-----RDAARVQVASTLSVL 160 170 180 190 230 240 250 260 270 280 pF1KB5 AGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTILTSQAKYLLGLNLPRTNGVGSLIT .:..::..:... ::: .:::. :. :..:.:. ...:: ::..::.: .: ::: CCDS46 VGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIY 200 210 220 230 240 250 290 300 310 320 330 340 pF1KB5 TWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHFKSKLKAPIPIELVVVVAATLASH : ..: .. .... ..:. . .::. .: ::......: ::: ::.....:: :. CCDS46 TVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISY 260 270 280 290 300 310 350 360 370 380 390 400 pF1KB5 FGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVDAIAISIIGFAITVSLSEMFAKKH :.. .. ...:.::.:..:: .:. .:. ... .:..:...::::..::...:: .: CCDS46 GMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRH 320 330 340 350 360 370 410 420 430 440 450 460 pF1KB5 GYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLVKESTGCHTQLSGVVTALVLLLVL :: : .:::. :.:. :.: ..:.:: .: .....::.:::: ..:..:....: .::.. CCDS46 GYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLII 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB5 LVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMWSISRMDTVIWFVTMLSSALLSTE . .. ::..: :.::..: ::::.: ::.. :. ..:. .: : .::.::. .. ::. . CCDS46 VKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLD 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB5 IGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFESVSAYKNLQTKPGIKIFRFVAPLY .::.:.: ::.. :..::: :. :.:: : .......:. :.. . :.:.:: : .: CCDS46 LGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVY 500 510 520 530 540 550 590 600 610 620 pF1KB5 YINKECFKSALYKQTVN---PILI---KVAWKKAAKRKIK-----EKV------------ . : : ...:: :: . .:: : :: . :.: ::. CCDS46 FANAEFYSDAL-KQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAGPLLSACL 560 570 580 590 600 630 640 650 660 pF1KB5 ----VTLGGIQDEMSVQLSHD--------------PL-ELHTIVIDCSAIQFLDTAGIHT :. : ... ... ..: : ..:....: .:..:.::. ... CCDS46 APQQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFHSLILDLGALSFVDTVCLKS 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 LKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKE-EENLLFYSVYEAMAFAEVSKNQ ::.. .:.. : ..: .: :. : ..: :.. .. :: ::..:..:: CCDS46 LKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHLFASVHDAVTFALQHPRP 670 680 690 700 710 720 730 pF1KB5 KGVCVPNGLSLSSD CCDS46 VPDSPVSVTRL 730 740 >>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa) initn: 1380 init1: 978 opt: 982 Z-score: 1222.0 bits: 236.8 E(32554): 9.5e-62 Smith-Waterman score: 1342; 32.9% identity (68.4% similar) in 681 aa overlap (79-699:40-700) 50 60 70 80 90 100 pF1KB5 RPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAKNMILGFLPVLQWLPKYDLKKNI ::: :.: ..: :::: :::.: .. . CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 10 20 30 40 50 60 110 120 130 140 150 160 pF1KB5 LGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFFASIIYFLLGTSRHISVGIFGVL :::..::: :.:. .::..::.:::: ::.:::.::. .::::.::::::::: :.:. CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVM 70 80 90 100 110 120 170 180 190 200 210 220 pF1KB5 CLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLNHTSDRICDKSCYAIMVGSTVTFI .:.: ... .: : ...:.:. .. ..:.::.. . CCDS46 SVMVGSVTESLAPQALND---------------SMINETA-----RDAARVQVASTLSVL 130 140 150 160 230 240 250 260 270 280 pF1KB5 AGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTILTSQAKYLLGLNLPRTNGVGSLIT .:..::..:... ::: .:::. :. :..:.:. ...:: ::..::.: .: ::: CCDS46 VGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIY 170 180 190 200 210 220 290 300 310 320 330 340 pF1KB5 TWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHFKSKLKAPIPIELVVVVAATLASH : ..: .. .... ..:. . .::. .: ::......: ::: ::.....:: :. CCDS46 TVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISY 230 240 250 260 270 280 350 360 370 380 390 400 pF1KB5 FGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVDAIAISIIGFAITVSLSEMFAKKH :.. .. ...:.::.:..:: .:. .:. ... .:..:...::::..::...:: .: CCDS46 GMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRH 290 300 310 320 330 340 410 420 430 440 450 460 pF1KB5 GYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLVKESTGCHTQLSGVVTALVLLLVL :: : .:::. :.:. :.: ..:.:: .: .....::.:::: ..:..:....: .::.. CCDS46 GYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLII 350 360 370 380 390 400 470 480 490 500 510 520 pF1KB5 LVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMWSISRMDTVIWFVTMLSSALLSTE . .. ::..: :.::..: ::::.: ::.. :. ..:. .: : .::.::. .. ::. . CCDS46 VKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLD 410 420 430 440 450 460 530 540 550 560 570 580 pF1KB5 IGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFESVSAYKNLQTKPGIKIFRFVAPLY .::.:.: ::.. :..::: :. :.:: : .......:. :.. . :.:.:: : .: CCDS46 LGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVY 470 480 490 500 510 520 590 600 610 620 630 pF1KB5 YINKECFKSALYKQTVNPILIKVAWKKA--------------AKRKIKEKVVTLGG---- . : : ...:: .. . . .. :: ..:....... : CCDS46 FANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVS 530 540 550 560 570 580 640 pF1KB5 --------------IQDEMSVQLSH-DPLE---------------------------LHT ..: .:.: : .: .:. CCDS46 INVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFHS 590 600 610 620 630 640 650 660 670 680 690 700 pF1KB5 IVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKEEENLL ...: .:..:.::. ...::.. .:.. : ..: .: :. : ..: :.. CCDS46 LILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKH 650 660 670 680 690 700 710 720 730 pF1KB5 FYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD CCDS46 LFASVHDAVTFALQHPRPVPDSPVSVTRL 710 720 730 >>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa) initn: 1380 init1: 978 opt: 982 Z-score: 1221.8 bits: 236.8 E(32554): 9.8e-62 Smith-Waterman score: 1339; 32.8% identity (68.2% similar) in 680 aa overlap (79-699:61-720) 50 60 70 80 90 100 pF1KB5 RPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAKNMILGFLPVLQWLPKYDLKKNI ::: :.: ..: :::: :::.: .. . CCDS46 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 40 50 60 70 80 90 110 120 130 140 150 160 pF1KB5 LGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFFASIIYFLLGTSRHISVGIFGVL :::..::: :.:. .::..::.:::: ::.:::.::. .::::.::::::::: :.:. CCDS46 LGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVM 100 110 120 130 140 150 170 180 190 200 210 220 pF1KB5 CLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLNHTSDRICDKSCYAIMVGSTVTFI .:.: ... .: : ...:.:. .. ..:.::.. . CCDS46 SVMVGSVTESLAPQALND---------------SMINETA-----RDAARVQVASTLSVL 160 170 180 190 230 240 250 260 270 280 pF1KB5 AGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTILTSQAKYLLGLNLPRTNGVGSLIT .:..::..:... ::: .:::. :. :..:.:. ...:: ::..::.: .: ::: CCDS46 VGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIY 200 210 220 230 240 250 290 300 310 320 330 340 pF1KB5 TWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHFKSKLKAPIPIELVVVVAATLASH : ..: .. .... ..:. . .::. .: ::......: ::: ::.....:: :. CCDS46 TVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISY 260 270 280 290 300 310 350 360 370 380 390 400 pF1KB5 FGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVDAIAISIIGFAITVSLSEMFAKKH :.. .. ...:.::.:..:: .:. .:. ... .:..:...::::..::...:: .: CCDS46 GMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRH 320 330 340 350 360 370 410 420 430 440 450 460 pF1KB5 GYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLVKESTGCHTQLSGVVTALVLLLVL :: : .:::. :.:. :.: ..:.:: .: .....::.:::: ..:..:....: .::.. CCDS46 GYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLII 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB5 LVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMWSISRMDTVIWFVTMLSSALLSTE . .. ::..: :.::..: ::::.: ::.. :. ..:. .: : .::.::. .. ::. . CCDS46 VKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLD 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB5 IGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFESVSAYKNLQTKPGIKIFRFVAPLY .::.:.: ::.. :..::: :. :.:: : .......:. :.. . :.:.:: : .: CCDS46 LGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVY 500 510 520 530 540 550 590 600 610 620 630 pF1KB5 YINKECFKSALYKQTVNPILIKVAWKKA--------------AKRKIKEKVVTLGG---- . : : ...:: .. . . .. :: ..:....... : CCDS46 FANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVS 560 570 580 590 600 610 640 pF1KB5 --------------IQDEMSVQLSHDPLE---------------------------LHTI ..: . : : .: .:.. CCDS46 INVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFHSL 620 630 640 650 660 670 650 660 670 680 690 700 pF1KB5 VIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKEEENLLF ..: .:..:.::. ...::.. .:.. : ..: .: :. : ..: :.. CCDS46 ILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKHL 680 690 700 710 720 730 710 720 730 pF1KB5 YSVYEAMAFAEVSKNQKGVCVPNGLSLSSD CCDS46 FASVHDAVTFALQHPRPVPDSPVSVTRL 740 750 >>CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 (759 aa) initn: 1380 init1: 978 opt: 982 Z-score: 1221.8 bits: 236.8 E(32554): 9.8e-62 Smith-Waterman score: 1342; 32.9% identity (68.4% similar) in 681 aa overlap (79-699:61-721) 50 60 70 80 90 100 pF1KB5 RPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKAKNMILGFLPVLQWLPKYDLKKNI ::: :.: ..: :::: :::.: .. . CCDS43 MERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVWLPRYPVRDWL 40 50 60 70 80 90 110 120 130 140 150 160 pF1KB5 LGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSFFASIIYFLLGTSRHISVGIFGVL :::..::: :.:. .::..::.:::: ::.:::.::. .::::.::::::::: :.:. CCDS43 LGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSRHISVGTFAVM 100 110 120 130 140 150 170 180 190 200 210 220 pF1KB5 CLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLNHTSDRICDKSCYAIMVGSTVTFI .:.: ... .: : ...:.:. .. ..:.::.. . CCDS43 SVMVGSVTESLAPQALND---------------SMINETA-----RDAARVQVASTLSVL 160 170 180 190 230 240 250 260 270 280 pF1KB5 AGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTILTSQAKYLLGLNLPRTNGVGSLIT .:..::..:... ::: .:::. :. :..:.:. ...:: ::..::.: .: ::: CCDS43 VGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIY 200 210 220 230 240 250 290 300 310 320 330 340 pF1KB5 TWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHFKSKLKAPIPIELVVVVAATLASH : ..: .. .... ..:. . .::. .: ::......: ::: ::.....:: :. CCDS43 TVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISY 260 270 280 290 300 310 350 360 370 380 390 400 pF1KB5 FGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVDAIAISIIGFAITVSLSEMFAKKH :.. .. ...:.::.:..:: .:. .:. ... .:..:...::::..::...:: .: CCDS43 GMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRH 320 330 340 350 360 370 410 420 430 440 450 460 pF1KB5 GYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLVKESTGCHTQLSGVVTALVLLLVL :: : .:::. :.:. :.: ..:.:: .: .....::.:::: ..:..:....: .::.. CCDS43 GYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLII 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB5 LVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMWSISRMDTVIWFVTMLSSALLSTE . .. ::..: :.::..: ::::.: ::.. :. ..:. .: : .::.::. .. ::. . CCDS43 VKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLD 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB5 IGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFESVSAYKNLQTKPGIKIFRFVAPLY .::.:.: ::.. :..::: :. :.:: : .......:. :.. . :.:.:: : .: CCDS43 LGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVY 500 510 520 530 540 550 590 600 610 620 630 pF1KB5 YINKECFKSALYKQTVNPILIKVAWKKA--------------AKRKIKEKVVTLGG---- . : : ...:: .. . . .. :: ..:....... : CCDS43 FANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVS 560 570 580 590 600 610 640 pF1KB5 --------------IQDEMSVQLSH-DPLE---------------------------LHT ..: .:.: : .: .:. CCDS43 INVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFHS 620 630 640 650 660 670 650 660 670 680 690 700 pF1KB5 IVIDCSAIQFLDTAGIHTLKEVRRDYEAIGIQVLLAQCNPTVRDSLTNGEYCKKEEENLL ...: .:..:.::. ...::.. .:.. : ..: .: :. : ..: :.. CCDS43 LILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDASITKKH 680 690 700 710 720 730 710 720 730 pF1KB5 FYSVYEAMAFAEVSKNQKGVCVPNGLSLSSD CCDS43 LFASVHDAVTFALQHPRPVPDSPVSVTRL 740 750 739 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 17:51:43 2016 done: Thu Nov 3 17:51:43 2016 Total Scan time: 3.370 Total Display time: 0.200 Function used was FASTA [36.3.4 Apr, 2011]