FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3831, 701 aa 1>>>pF1KB3831 701 - 701 aa - 701 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9761+/-0.000862; mu= 21.8202+/- 0.051 mean_var=67.3875+/-13.598, 0's: 0 Z-trim(107.0): 29 B-trim: 312 in 1/49 Lambda= 0.156237 statistics sampled from 9285 (9312) to 9285 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.286), width: 16 Scan time: 4.150 The best scores are: opt bits E(32554) CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 4598 1045.7 0 CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 2140 491.7 1.7e-138 CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 224) 1298 301.5 9e-82 CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 1293 300.8 5.2e-81 CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 1180 275.3 2.4e-73 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 993 233.1 1.1e-60 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 993 233.1 1.1e-60 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 990 232.4 1.8e-60 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 990 232.4 1.8e-60 CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 990 232.5 1.8e-60 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 990 232.5 1.8e-60 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 849 200.5 5e-51 CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 802 190.1 1e-47 CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 783 185.8 2.1e-46 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 783 185.8 2.3e-46 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 778 184.6 4e-46 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 766 181.9 2.8e-45 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 764 181.6 4.8e-45 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 741 176.3 1.3e-43 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 741 176.3 1.3e-43 CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 646 154.8 3.2e-37 CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 464 113.9 1e-24 CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 439 108.0 2.5e-23 CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 390 96.9 5e-20 >>CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 (701 aa) initn: 4598 init1: 4598 opt: 4598 Z-score: 5594.6 bits: 1045.7 E(32554): 0 Smith-Waterman score: 4598; 100.0% identity (100.0% similar) in 701 aa overlap (1-701:1-701) 10 20 30 40 50 60 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 GPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 VATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 EMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 TVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAAT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 CMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVF 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 RFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKEGGSETGVGEGGPAQGEDLGPVSTRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKEGGSETGVGEGGPAQGEDLGPVSTRA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 ALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRG 610 620 630 640 650 660 670 680 690 700 pF1KB3 GFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL ::::::::::::::::::::::::::::::::::::::::: CCDS33 GFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL 670 680 690 700 >>CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 (739 aa) initn: 2183 init1: 1450 opt: 2140 Z-score: 2600.0 bits: 491.7 E(32554): 1.7e-138 Smith-Waterman score: 2160; 48.4% identity (78.5% similar) in 678 aa overlap (17-687:56-719) 10 20 30 40 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCV ..::. . ...:.. .: .:.:: . CCDS43 GIHLELQRESSTDFKQFETNDQCRPYHRILIERQEKSDTNFKEFVIKKLQKNCQCSPAKA 30 40 50 60 70 80 50 60 70 80 90 100 pF1KB3 RALVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSF . .. .::. .:: .: .. . :::::::..::.::::.:::::::: .:.:.::::: CCDS43 KNMILGFLPVLQWLPKYDLKKNILGDVMSGLIVGILLVPQSIAYSLLAGQEPVYGLYTSF 90 100 110 120 130 140 110 120 130 140 150 160 pF1KB3 FANLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPG--ANSSTLNG ::..::::.:::::.:::::..::::.:..:::::: ::.: .... . : .:.::: . CCDS43 FASIIYFLLGTSRHISVGIFGVLCLMIGETVDRELQKAGYDNAHSAPSLGMVSNGSTLLN 150 160 170 180 190 200 170 180 190 200 210 220 pF1KB3 SAAMLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTIL .. : ..:::: :....:...:.::: :: ...::::.:::. ::.::. ::: ::: CCDS43 HTSDRICDKSCYAIMVGSTVTFIAGVYQVAMGFFQVGFVSVYLSDALLSGFVTGASFTIL 210 220 230 240 250 260 230 240 250 260 270 280 pF1KB3 TSQLKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRY ::: :.:::. .:: .: : .. ::. ..:. ..:.::..:: .:: ::: .:::.... CCDS43 TSQAKYLLGLNLPRTNGVGSLITTWIHVFRNIHKTNLCDLITSLLCLLVLLPTKELNEHF 270 280 290 300 310 320 290 300 310 320 330 340 pF1KB3 RHRLRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALD . .:..:.: ::.:.:.:::.::::.::. ..::.:: ::::::::.::: :. ::.: CCDS43 KSKLKAPIPIELVVVVAATLASHFGKLHENYNSSIAGHIPTGFMPPKVPEWNLIPSVAVD 330 340 350 360 370 380 350 360 370 380 390 400 pF1KB3 AVALALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLV :.:..... :...::.::::..:::.:.::::. :.: ::..:.:.:::.:::::::.:: CCDS43 AIAISIIGFAITVSLSEMFAKKHGYTVKANQEMYAIGFCNIIPSFFHCFTTSAALAKTLV 390 400 410 420 430 440 410 420 430 440 450 460 pF1KB3 KTATGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLW : .:::.::::.::.: :.:::::..::::..::.:::. . .:.::::::: :::..: CCDS43 KESTGCHTQLSGVVTALVLLLVLLVIAPLFYSLQKSVLGVITIVNLRGALRKFRDLPKMW 450 460 470 480 490 500 470 480 490 500 510 520 pF1KB3 RMSPADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYED .: :...: : . :.::: :::.:: .:.. . :::.:...::. . .. .:. CCDS43 SISRMDTVIWFVTMLSSALLSTEIGLLVGVCFSIFCVILRTQKPKSSLLGLVEESEVFES 510 520 530 540 550 560 530 540 550 560 570 pF1KB3 ATEFEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-----AGCMAARRKEGGSE .. ...: .::...::: .:::: ::. : ..::. : : ::.:: .: CCDS43 VSAYKNLQIKPGIKIFRFVAPLYYINKECFKSALYKQTVNPILIKVAWKKAAKRK--IKE 570 580 590 600 610 620 580 590 600 610 620 630 pF1KB3 TGVGEGGPAQGEDLGPVSTRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGA : :: : : .:.. . : .::.::::. . :::.::. ::...:::: : CCDS43 KVVTLGG-IQDE----MSVQLSHDPLE--LHTIVIDCSAIQFLDTAGIHTLKEVRRDYEA 630 640 650 660 670 640 650 660 670 680 690 pF1KB3 LGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDA .::..::: :.: ::: :. : . . ::. :: ::..:. : CCDS43 IGIQVLLAQCNPTVRDSLTNGEYCKK-----EEENLLFYSVYEAMAFAEVSKNQKGVCVP 680 690 700 710 720 730 700 pF1KB3 HL CCDS43 NGLSLSSD >>CCDS33933.1 SLC26A1 gene_id:10861|Hs108|chr4 (224 aa) initn: 1320 init1: 1298 opt: 1298 Z-score: 1581.6 bits: 301.5 E(32554): 9e-82 Smith-Waterman score: 1298; 98.5% identity (99.0% similar) in 196 aa overlap (1-196:1-196) 10 20 30 40 50 60 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 ATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQ ::::::::::::. : CCDS33 ATALTLMTGLYQTSWGRNSFQQHPWQLTQRSDSQELLEEEERSC 190 200 210 220 >>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa) initn: 1371 init1: 976 opt: 1293 Z-score: 1567.9 bits: 300.8 E(32554): 5.2e-81 Smith-Waterman score: 1355; 32.6% identity (68.9% similar) in 700 aa overlap (28-684:43-726) 10 20 30 40 50 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPAT :. :. : :::: . .... :.: CCDS57 LPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKRAFGVLKTLVPIL 20 30 40 50 60 70 60 70 80 90 100 110 pF1KB3 RWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGT .:: .:: .:.: .::.::. :.. . :..::.:::.. :.::..:: : ::..:: CCDS57 EWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSAFFPILTYFIFGT 80 90 100 110 120 130 120 130 140 150 160 170 pF1KB3 SRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCG-RDCY :::.::: : .. ::::.:: :..: :.. : ..:...:: . :.: . :: CCDS57 SRHISVGPFPVVSLMVGSVV---LSMA---PDEHFLVSSSNGTVLNTT--MIDTAARDTA 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 AIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRI . .:.::::..:. :...: :..::. ::..::. ::. .:. .:.:::: .:.: CCDS57 RVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVST 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB3 PRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTEL ..: .. : . .... :..:. : ... . ..: .:.:::.::.::.. ::.: :. CCDS57 KNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPIPIEV 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB3 LVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFS .: ..:: .:. ..:.: ...... .:: ::.::..: :.... . ..:.:: :.. CCDS57 IVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVAYAIA 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB3 ISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSS .:.....: .. :.. .:::..: : :.. .:. ::....::... :. .:: .::... CCDS57 VSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKTQVAG 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB3 VVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAG ..::..:....:::. :.. ::.:::: :....:.: . .. :.:::::.. ::..:. CCDS57 IISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAVIWVF 430 440 450 460 470 480 480 490 500 510 520 530 pF1KB3 TAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPG : . .... . :::::.:..::... :.: : :. : .: .:... ..... : CCDS57 TCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIEEPQG 490 500 510 520 530 540 540 550 560 570 580 pF1KB3 VRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARR-----------KEG---GSETGV :...::..:..:.: : : . . : .:.:: . .: : : ....:. CCDS57 VKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKLIKSGQLRATKNGI 550 560 570 580 590 600 590 600 610 pF1KB3 GEGG--------PAQG-EDLG-------------------PVSTRAALVPAAAGFHTVVI . : . ::: ::.. . :: .:..:. CCDS57 ISDAVSTNNAFEPDEDIEDLEELDIPTKEIEIQVDWNSELPVKVNVPKVP----IHSLVL 610 620 630 640 650 660 620 630 640 650 660 670 pF1KB3 DCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEE ::. . :::..:: .:. . ... . ... .: . : . : . ::. :. ... CCDS57 DCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQDYVIEKLEQCGFFD----DNIRKD 670 680 690 700 710 680 690 700 pF1KB3 QLFLSVHDAVQTARARHRELEATDAHL .::.::::. CCDS57 TFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTLELIETELTEEELDVQDEAMR 720 730 740 750 760 770 >>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa) initn: 1209 init1: 817 opt: 1180 Z-score: 1430.4 bits: 275.3 E(32554): 2.4e-73 Smith-Waterman score: 1186; 32.0% identity (64.0% similar) in 691 aa overlap (37-684:42-717) 10 20 30 40 50 60 pF1KB3 PLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLLPATRWLRQYRPR : :::: .. .: .:.: . :: :: . CCDS57 ARPVYSTNAFEENHKKTGRHHKTFLDHLKVC-CSCSPQKAKRIVLSLFPIASWLPAYRLK 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB3 EYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFLMGTSRHVSVGIF :.: .:..::. ::. : :..:..::. . :.:.::.::: .::...:::::.::: : CCDS57 EWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFGTSRHISVGPF 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB3 SLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAMLDCGRDCYAIRVATA--L .: .::: .:. .. : :.... : ... :.: .:: : .:::.: . CCDS57 PILSMMVGLAVSGAVSKAV--PDRNATTLGLPNNSNNSS--LLDDER----VRVAAAASV 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 TLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLGVRIPRHQGPGM :...:. :. .:.::.::: :::. :..::. .:.: .:.:::: .. . .: : : CCDS57 TVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSHTDPVS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 VVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLPTELLVIVVATL . . :.. ..:. :.::. . : :. .::...:.. .: ::.: :... :.:. CCDS57 IFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMTVIAAG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 VSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAAAFSISLAEMFA ::. ....:: .:.::. ::.:: .:. . .: .. : ..:.:: : ..:.: ... CCDS57 VSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSVASVYS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 RSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQLSSVVSATVVL .. : . .::::.:.: :.. . .. :: :.::..: :. .:: .::......: .:: CCDS57 LKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIGAIIVL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 LVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALVWAGTAATCMLV .:.::.. :. ::.:::: . . .:.: : . .. :::: . : :.: : ... CCDS57 IVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFIFTIVL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 STEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVPEPGVRVFRFGG . :: :.: ..::... ::: :. . :: :: : .:.. .. . ::..:: . CCDS57 GLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKIFRCPS 490 500 510 520 530 540 550 560 570 580 pF1KB3 PLYYANKDFFLQSLYSLTG------LDAGCMAARRKEGGSETGVGEGGPA---------- :.:.:: :: ..: . .: : : :. . .. :. . : CCDS57 PIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRKLQKQGLLQVTPKGFICTVDTIK 550 560 570 580 590 600 590 600 610 620 pF1KB3 -QGEDLG---------PVSTR--------------AALVPAAAGFHTVVIDCAPLLFLDA . :.: :..: :: . .:....: . . :::. CCDS57 DSDEELDNNQIEVLDQPINTTDLPFHIDWNDDLPLNIEVPKIS-LHSLILDFSAVSFLDV 610 620 630 640 650 660 630 640 650 660 670 680 pF1KB3 AGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFL-GEGPGDTAEEEQLFLSVHDA ..: :... ... . ... .. . . :.: :. :: .. .::..::: CCDS57 SSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLNRYEFFDGE-----VKSSIFFLTIHDA 670 680 690 700 710 690 700 pF1KB3 VQTARARHRELEATDAHL : CCDS57 VLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNRVYEVPVETKF 720 730 740 750 760 >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 1374 init1: 969 opt: 993 Z-score: 1203.2 bits: 233.1 E(32554): 1.1e-60 Smith-Waterman score: 1366; 33.4% identity (69.3% similar) in 668 aa overlap (16-650:26-680) 10 20 30 40 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRG-LREMLKARLWCSCSCSVLCVRAL :: ..: . . . . .: . .:. .: . CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB3 VQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFAN . .:: :.:: :. .::. ::..::. :.. .::..:...::.. ::..::.::. CCDS43 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB3 LIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAML ..: ..:::::.:.: :... ::.: :. : . :. : . ::. ..: ::. : CCDS43 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLV------PD-DIVIPGGVNAT-NGTEA-- 130 140 150 160 170 170 180 190 200 210 220 pF1KB3 DCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLK :: ..:: ..::..:. : .:: :.:::. ::..::. ::. .:.: ..::.:: CCDS43 ---RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK 180 190 200 210 220 230 240 250 260 270 280 pF1KB3 HLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLR .:.::. :..: :: . ...:... . :::.. .. . ...::..::...:....: CCDS43 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP 230 240 250 260 270 280 290 300 310 320 330 340 pF1KB3 VPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALA .:.: :....:..: .: .:.. .. .:.: .: :..:: :. :.. : .::.:.: CCDS43 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB3 LVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATG .:. . .::.:. .: .:::.: .::::.:.: :: . .... :. : .:..:::. .:: CCDS43 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG 350 360 370 380 390 400 410 420 430 440 450 460 pF1KB3 CRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPA .:::.. ... ..:::.:: . ::..: ..::. ...:.:.: . . ::: .:: : CCDS43 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB3 DALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFE . .: : .. .... . ::...::..::.. ::: : .:... .: : : .: CCDS43 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB3 GLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-AGCMAARRK---EGGSETG---- . ::...:....:.::::.:.. ..: ::.. : :.:::: . ..:.: CCDS43 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM 530 540 550 560 570 580 590 600 610 pF1KB3 -----VGEGGPAQGED------------LGPVSTRAAL-------VPAAAGFHTVVIDCA : . ..::: :. .... .: . . :::..: . CCDS43 ANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFMPPGDNVHTVILDFT 590 600 610 620 630 640 620 630 640 650 660 670 pF1KB3 PLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLF . :.:..::.:: . ..:: .:: . :: :: CCDS43 QVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR 650 660 670 680 680 690 700 pF1KB3 LSVHDAVQTARARHRELEATDAHL >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 1405 init1: 969 opt: 993 Z-score: 1202.7 bits: 233.1 E(32554): 1.1e-60 Smith-Waterman score: 1426; 33.8% identity (68.6% similar) in 717 aa overlap (16-697:26-725) 10 20 30 40 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRG-LREMLKARLWCSCSCSVLCVRAL :: ..: . . . . .: . .:. .: . CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVPDSIADKLKQAFTCTPKKIRNI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB3 VQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFAN . .:: :.:: :. .::. ::..::. :.. .::..:...::.. ::..::.::. CCDS57 IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYPV 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB3 LIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGANSSTLNGSAAML ..: ..:::::.:.: :... ::.: :. : . :. : . ::. ..: ::. : CCDS57 IMYCFLGTSRHISIGPFAVISLMIGGVAVRLV------PD-DIVIPGGVNAT-NGTEA-- 130 140 150 160 170 170 180 190 200 210 220 pF1KB3 DCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLK :: ..:: ..::..:. : .:: :.:::. ::..::. ::. .:.: ..::.:: CCDS57 ---RDALRVKVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLK 180 190 200 210 220 230 240 250 260 270 280 pF1KB3 HLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLR .:.::. :..: :: . ...:... . :::.. .. . ...::..::...:....: CCDS57 YLFGVKTKRYSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLP 230 240 250 260 270 280 290 300 310 320 330 340 pF1KB3 VPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALA .:.: :....:..: .: .:.. .. .:.: .: :..:: :. :.. : .::.:.: CCDS57 APIPLEFFAVVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIA 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB3 LVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATG .:. . .::.:. .: .:::.: .::::.:.: :: . .... :. : .:..:::. .:: CCDS57 IVGFSVTISMAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTG 350 360 370 380 390 400 410 420 430 440 450 460 pF1KB3 CRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPA .:::.. ... ..:::.:: . ::..: ..::. ...:.:.: . . ::: .:: : CCDS57 GKTQLAGCLASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKI 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB3 DALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFE . .: : .. .... . ::...::..::.. ::: : .:... .: : : .: CCDS57 ELTIWLTTFVSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYE 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB3 GLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLD-AGCMAARRK---EGGSETG---- . ::...:....:.::::.:.. ..: ::.. : :.:::: . ..:.: CCDS57 EVKEIPGIKIFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANM 530 540 550 560 570 580 590 600 610 pF1KB3 -----VGEGGPAQGED------------LGPVSTRAAL-------VPAAAGFHTVVIDCA : . ..::: :. .... .: . . :::..: . CCDS57 ANATVVKADAEVDGEDATKPEEEDGEVKYPPIVIKSTFPEEMQRFMPPGDNVHTVILDFT 590 600 610 620 630 640 620 630 640 650 660 670 pF1KB3 PLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDTAEEEQLF . :.:..::.:: . ..:: .:: . :: :: : . :.:. :. :.: : : :: CCDS57 QVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDLTRNRFF-ENP---ALWELLF 650 660 670 680 690 700 680 690 700 pF1KB3 LSVHDAVQTARARHR--ELEATDAHL :.:::: .. :. : ::. CCDS57 HSIHDAVLGSQLREALAEQEASAPPSQEDLEPNATPATPEA 710 720 730 740 >>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa) initn: 1377 init1: 959 opt: 990 Z-score: 1199.1 bits: 232.4 E(32554): 1.8e-60 Smith-Waterman score: 1316; 33.3% identity (65.7% similar) in 720 aa overlap (19-681:25-715) 10 20 30 40 50 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRALVQDLL : ::: . : : .:: . . ::. . : CCDS46 MDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYALLLQHL 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 PATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFANLIYFL :. :: .: :..: ::..::: ..:. .::..::.::::: :...::.::. .:::: CCDS46 PVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 MGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAAMLDCGR .:::::.::: :... .:::.:.. .: : : :.: .: .: : CCDS46 FGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA------R 120 130 140 150 180 190 200 210 220 230 pF1KB3 DCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQLKHLLG : ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...::::...: CCDS46 DAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFG 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB3 VRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHRLRVPLP ... :.:: .. : : . :..: :::..: .::...: :.:. ...: .:.: CCDS46 LHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIP 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB3 TELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVALALVAA :::... :: .:. :..:: .:.:.::.:..:: .:. .:..... .: ..:.:. CCDS46 GELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGF 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB3 AFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTATGCRTQ :..:::...:: ::: : .::::.:.: :.. ....:: .: ....:::. .:: .: CCDS46 AIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQ 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB3 LSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMSPADALV .....:. .::... :. ::::: ..::: .:.:.:.: ::.. :. ::. . :: :. CCDS46 VAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLI 400 410 420 430 440 450 480 490 500 510 520 530 pF1KB3 WAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATEFEGLVP : : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..:. CCDS46 WLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKE 460 470 480 490 500 510 540 550 560 570 pF1KB3 EPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAAR--------------------- ::.::: .. .:.:: .:. ..: . :.:. . .. CCDS46 VRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEK 520 530 540 550 560 570 580 590 pF1KB3 -RKEGGSETGVG-------------------------------EGGPAQGEDLGPV---S ::...: :.. : . :.:.. . . : CCDS46 LRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMQVSSGDKMEDATANGQEDSKAPDGS 580 590 600 610 620 630 600 610 620 630 640 650 pF1KB3 TRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDIL : :: ::....: . : :.:.. ...:... .:. . . . .: : :: . : CCDS46 TLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQL 640 650 660 670 680 690 660 670 680 690 700 pF1KB3 SRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL : :. . ...:: ::: CCDS46 EAGHFFDA----SITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 700 710 720 730 >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 1400 init1: 982 opt: 990 Z-score: 1199.1 bits: 232.4 E(32554): 1.8e-60 Smith-Waterman score: 1371; 34.3% identity (67.0% similar) in 712 aa overlap (19-692:46-728) 10 20 30 40 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRA : ::: . : : .:: . . : CCDS46 LSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYA 20 30 40 50 60 50 60 70 80 90 100 pF1KB3 LVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFA :. . ::. :: .: :..: ::..::: ..:. .::..::.::::: :...::.::. CCDS46 LLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYP 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB3 NLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAA .::::.:::::.::: :... .:::.:.. .: : : :.: .: .: CCDS46 VFIYFLFGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA- 130 140 150 160 170 170 180 190 200 210 220 pF1KB3 MLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQ :: ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...:: CCDS46 -----RDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQ 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB3 LKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHR ::...:... :.:: .. : : . :..: :::..: .::...: :.:. ... CCDS46 LKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQ 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB3 LRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVA : .:.: :::... :: .:. :..:: .:.:.::.:..:: .:. .:..... .: . CCDS46 LPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFT 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB3 LALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTA .:.:. :..:::...:: ::: : .::::.:.: :.. ....:: .: ....:::. . CCDS46 IAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQES 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB3 TGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMS :: .:.....:. .::... :. ::::: ..::: .:.:.:.: ::.. :. ::. . CCDS46 TGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKAN 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB3 PADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATE :: :.: : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..: CCDS46 RADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAE 480 490 500 510 520 530 530 540 550 560 570 pF1KB3 FEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAARRKE------------ . ::.::: .. .:.:: .:. ..: . :.:. . ...:. CCDS46 YSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQ 540 550 560 570 580 590 580 590 600 610 pF1KB3 -GGSETGVGEGGPAQGEDLGP--VSTRAALVPAAAG----------------------FH : ..:: . :.: ::. . :.:. :: CCDS46 LQKEEKLRKQAGPLLSACLAPQQVSSGDKMEDATANGQEDSKAPDGSTLKALGLPQPDFH 600 610 620 630 640 650 620 630 640 650 660 670 pF1KB3 TVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPPVRDILSRGGFLGEGPGDT ....: . : :.:.. ...:... .:. . . . .: : :: . : : :. . CCDS46 SLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFFDA----S 660 670 680 690 700 680 690 700 pF1KB3 AEEEQLFLSVHDAVQTARARHRELEATDAHL ...:: :::::: : . : CCDS46 ITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 710 720 730 740 >>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa) initn: 1377 init1: 959 opt: 990 Z-score: 1199.0 bits: 232.5 E(32554): 1.8e-60 Smith-Waterman score: 1326; 33.5% identity (65.8% similar) in 720 aa overlap (19-682:46-736) 10 20 30 40 pF1KB3 MDESPEPLQQGRGPVPVRRQRPAPRGLREMLKARLWCSCSCSVLCVRA : ::: . : : .:: . . : CCDS46 LSATQAMDLRRRDYHMERPLLNQEHLEELGRWGSAPR----THQWRTWLQCSRAR--AYA 20 30 40 50 60 50 60 70 80 90 100 pF1KB3 LVQDLLPATRWLRQYRPREYLAGDVMSGLVIGIILVPQAIAYSLLAGLQPIYSLYTSFFA :. . ::. :: .: :..: ::..::: ..:. .::..::.::::: :...::.::. CCDS46 LLLQHLPVLVWLPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYP 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB3 NLIYFLMGTSRHVSVGIFSLLCLMVGQVVDRELQLAGFDPSQDGLQPGA-NSSTLNGSAA .::::.:::::.::: :... .:::.:.. .: : : :.: .: .: CCDS46 VFIYFLFGTSRHISVGTFAVMSVMVGSVTE-------------SLAPQALNDSMINETA- 130 140 150 160 170 170 180 190 200 210 220 pF1KB3 MLDCGRDCYAIRVATALTLMTGLYQVLMGVLRLGFVSAYLSQPLLDGFAMGASVTILTSQ :: ..::..:....::.:: .:....::: .:::.::. :.. .:.: ...:: CCDS46 -----RDAARVQVASTLSVLVGLFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQ 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB3 LKHLLGVRIPRHQGPGMVVLTWLSLLRGAGQANVCDVVTSTVCLAVLLAAKELSDRYRHR ::...:... :.:: .. : : . :..: :::..: .::...: :.:. ... CCDS46 LKYVFGLHLSSHSGPLSLIYTVLEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQ 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB3 LRVPLPTELLVIVVATLVSHFGQLHKRFGSSVAGDIPTGFMPPQVPEPRLMQRVALDAVA : .:.: :::... :: .:. :..:: .:.:.::.:..:: .:. .:..... .: . CCDS46 LPMPIPGELLTLIGATGISYGMGLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFT 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB3 LALVAAAFSISLAEMFARSHGYSVRANQELLAVGCCNVLPAFLHCFATSAALAKSLVKTA .:.:. :..:::...:: ::: : .::::.:.: :.. ....:: .: ....:::. . CCDS46 IAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQES 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB3 TGCRTQLSSVVSATVVLLVLLALAPLFHDLQRSVLACVIVVSLRGALRKVWDLPRLWRMS :: .:.....:. .::... :. ::::: ..::: .:.:.:.: ::.. :. ::. . CCDS46 TGGNSQVAGAISSLFILLIIVKLGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKAN 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB3 PADALVWAGTAATCMLVSTEAGLLAGVILSLLSLAGRTQRPRTALLARIGDTAFYEDATE :: :.: : .. .:.. . ::...::.::: .. ::: :. ..:... :: .:.:..: CCDS46 RADLLIWLVTFTATILLNLDLGLVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAE 480 490 500 510 520 530 530 540 550 560 570 pF1KB3 FEGLVPEPGVRVFRFGGPLYYANKDFFLQSLYSLTGLDAGCMAAR--------------- . ::.::: .. .:.:: .:. ..: . :.:. . .. CCDS46 YSEAKEVRGVKVFRSSATVYFANAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQ 540 550 560 570 580 590 580 590 pF1KB3 -------RKEGGSETGVG------------------------------EGGPAQGEDLGP ::...: :.. : . :.:.. . CCDS46 LQKEEKLRKQAASPKGASVSINVNTSLEDMRSNNVEDCKMMVSSGDKMEDATANGQEDSK 600 610 620 630 640 650 600 610 620 630 640 650 pF1KB3 V---STRAALVPAAAGFHTVVIDCAPLLFLDAAGVSTLQDLRRDYGALGISLLLACCSPP . :: :: ::....: . : :.:.. ...:... .:. . . . .: : : CCDS46 APDGSTLKALGLPQPDFHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSP 660 670 680 690 700 710 660 670 680 690 700 pF1KB3 VRDILSRGGFLGEGPGDTAEEEQLFLSVHDAVQTARARHRELEATDAHL : . : : :. . ...:: :::: CCDS46 VVSQLEAGHFFDA----SITKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 720 730 740 750 701 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:02:30 2016 done: Thu Nov 3 14:02:31 2016 Total Scan time: 4.150 Total Display time: 0.220 Function used was FASTA [36.3.4 Apr, 2011]