FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2586, 791 aa 1>>>pF1KE2586 791 - 791 aa - 791 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.5745+/-0.00104; mu= 10.0623+/- 0.062 mean_var=116.2935+/-23.259, 0's: 0 Z-trim(107.4): 32 B-trim: 23 in 1/49 Lambda= 0.118931 statistics sampled from 9553 (9579) to 9553 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.294), width: 16 Scan time: 2.520 The best scores are: opt bits E(32554) CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 791) 5179 900.1 0 CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 ( 887) 5179 900.1 0 CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 738) 1724 307.3 6.1e-83 CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 759) 1724 307.3 6.3e-83 CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 758) 1722 306.9 8e-83 CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 740) 1535 274.8 3.6e-73 CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 685) 1484 266.1 1.4e-70 CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 744) 1484 266.1 1.5e-70 CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 ( 780) 1430 256.8 9.9e-68 CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 ( 764) 1393 250.5 7.9e-66 CCDS43629.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 516) 1320 237.9 3.3e-62 CCDS55150.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 712) 1123 204.1 6.5e-52 CCDS63627.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 651) 1090 198.4 3.1e-50 CCDS63628.1 SLC26A6 gene_id:65010|Hs108|chr3 ( 723) 1082 197.1 8.7e-50 CCDS4813.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 970) 983 180.1 1.5e-44 CCDS6254.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 656) 946 173.7 8.4e-43 CCDS6255.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 663) 946 173.7 8.5e-43 CCDS4300.1 SLC26A2 gene_id:1836|Hs108|chr5 ( 739) 881 162.6 2.1e-39 CCDS5732.1 SLC26A5 gene_id:375611|Hs108|chr7 ( 335) 828 153.4 5.7e-37 CCDS8949.2 SLC26A10 gene_id:65012|Hs108|chr12 ( 563) 786 146.3 1.3e-34 CCDS33934.1 SLC26A1 gene_id:10861|Hs108|chr4 ( 701) 783 145.8 2.3e-34 CCDS4814.1 SLC26A8 gene_id:116369|Hs108|chr6 ( 865) 520 100.7 1.1e-20 CCDS75765.1 SLC26A7 gene_id:115111|Hs108|chr8 ( 355) 365 74.0 5e-13 CCDS11771.2 SLC26A11 gene_id:284129|Hs108|chr17 ( 606) 340 69.8 1.6e-11 >>CCDS30990.1 SLC26A9 gene_id:115019|Hs108|chr1 (791 aa) initn: 5179 init1: 5179 opt: 5179 Z-score: 4805.8 bits: 900.1 E(32554): 0 Smith-Waterman score: 5179; 99.9% identity (100.0% similar) in 791 aa overlap (1-791:1-791) 10 20 30 40 50 60 pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 WLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 WLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG 730 740 750 760 770 780 790 pF1KE2 SMFHAETLTAL ::::::::::: CCDS30 SMFHAETLTAL 790 >>CCDS30989.1 SLC26A9 gene_id:115019|Hs108|chr1 (887 aa) initn: 5179 init1: 5179 opt: 5179 Z-score: 4805.0 bits: 900.1 E(32554): 0 Smith-Waterman score: 5179; 99.9% identity (100.0% similar) in 791 aa overlap (1-791:1-791) 10 20 30 40 50 60 pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 WLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 WLPKYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 HQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 AIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 FIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 CKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 YDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITML 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPY 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 GVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYF 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 DFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFG 730 740 750 760 770 780 790 pF1KE2 SMFHAETLTAL ::::::::::: CCDS30 SMFHAETLTALESLSAAGGCYPYRSESLVSPLFTRQALAAMDKPPAHSTPPTSALSLAAE 790 800 810 820 830 840 >>CCDS46826.1 SLC26A6 gene_id:65010|Hs108|chr3 (738 aa) initn: 1316 init1: 1178 opt: 1724 Z-score: 1602.5 bits: 307.3 E(32554): 6.1e-83 Smith-Waterman score: 1724; 37.2% identity (73.1% similar) in 713 aa overlap (32-744:30-728) 10 20 30 40 50 60 pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW : .. :. ..:: :. :... :::: : CCDS46 MDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH :: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: . CCDS46 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA .. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :.. CCDS46 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF ..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...: CCDS46 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC ...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: : CCDS46 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY . .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .::: CCDS46 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV ::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... .. CCDS46 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG :: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: : CCDS46 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA ..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .::: CCDS46 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD :.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. . CCDS46 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN 540 550 560 570 580 590 610 620 630 640 650 660 pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT ... .:: . .:: : :. : .. ...:: . : . : : CCDS46 VNTSLEDMRSNNVEDCKMMQVS----SGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD 600 610 620 630 640 670 680 690 700 710 720 pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL ::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:. CCDS46 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI 650 660 670 680 690 700 730 740 750 760 770 780 pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS ::.: :.:::: :: . : : CCDS46 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 710 720 730 >>CCDS43087.1 SLC26A6 gene_id:65010|Hs108|chr3 (759 aa) initn: 1316 init1: 1178 opt: 1724 Z-score: 1602.3 bits: 307.3 E(32554): 6.3e-83 Smith-Waterman score: 1724; 37.2% identity (73.1% similar) in 713 aa overlap (32-744:51-749) 10 20 30 40 50 60 pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW : .. :. ..:: :. :... :::: : CCDS43 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW 30 40 50 60 70 80 70 80 90 100 110 120 pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH :: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: . CCDS43 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA .. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :.. CCDS43 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG 150 160 170 180 190 190 200 210 220 230 240 pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF ..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...: CCDS43 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV 200 210 220 230 240 250 250 260 270 280 290 300 pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC ...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: : CCDS43 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM 260 270 280 290 300 310 310 320 330 340 350 360 pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY . .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .::: CCDS43 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY 320 330 340 350 360 370 370 380 390 400 410 420 pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV ::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... .. CCDS43 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK 380 390 400 410 420 430 430 440 450 460 470 480 pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG :: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: : CCDS43 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG 440 450 460 470 480 490 490 500 510 520 530 540 pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA ..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .::: CCDS43 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA 500 510 520 530 540 550 550 560 570 580 590 600 pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD :.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. . CCDS43 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN 560 570 580 590 600 610 610 620 630 640 650 660 pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT ... .:: . .:: : :. : .. ...:: . : . : : CCDS43 VNTSLEDMRSNNVEDCKMMQVS----SGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL ::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:. CCDS43 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS ::.: :.:::: :: . : : CCDS43 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 730 740 750 >>CCDS46825.1 SLC26A6 gene_id:65010|Hs108|chr3 (758 aa) initn: 1316 init1: 1178 opt: 1722 Z-score: 1600.5 bits: 306.9 E(32554): 8e-83 Smith-Waterman score: 1722; 37.2% identity (73.2% similar) in 713 aa overlap (32-744:51-748) 10 20 30 40 50 60 pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW : .. :. ..:: :. :... :::: : CCDS46 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW 30 40 50 60 70 80 70 80 90 100 110 120 pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH :: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: . CCDS46 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA .. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :.. CCDS46 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG 150 160 170 180 190 190 200 210 220 230 240 pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF ..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...: CCDS46 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV 200 210 220 230 240 250 250 260 270 280 290 300 pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC ...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: : CCDS46 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM 260 270 280 290 300 310 310 320 330 340 350 360 pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY . .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .::: CCDS46 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY 320 330 340 350 360 370 370 380 390 400 410 420 pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV ::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... .. CCDS46 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK 380 390 400 410 420 430 430 440 450 460 470 480 pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG :: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: : CCDS46 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG 440 450 460 470 480 490 490 500 510 520 530 540 pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA ..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .::: CCDS46 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA 500 510 520 530 540 550 550 560 570 580 590 600 pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD :.:.. . . . :.: . .. :.: :::::. ... :....: .. . . .. . CCDS46 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAASPKGASVSIN 560 570 580 590 600 610 610 620 630 640 650 660 pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT :. : .: : . .... : :. : .. ...:: . : . : : CCDS46 V-NTSLEDMRSN----NVEDCKMMVSSGDKMEDATANGQEDSKAP-DGSTLKALGLPQPD 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL ::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:. CCDS46 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS ::.: :.:::: :: . : : CCDS46 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 730 740 750 >>CCDS46824.1 SLC26A6 gene_id:65010|Hs108|chr3 (740 aa) initn: 1706 init1: 1178 opt: 1535 Z-score: 1427.2 bits: 274.8 E(32554): 3.6e-73 Smith-Waterman score: 1697; 37.4% identity (72.4% similar) in 713 aa overlap (32-744:51-730) 10 20 30 40 50 60 pF1KE2 SQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVGEKLRNAFRCSSAKIKAVVFGLLPVLSW : .. :. ..:: :. :... :::: : CCDS46 AMDLRRRDYHMERPLLNQEHLEELGRWGSAPRTHQWRTWLQCSRARAYALLLQHLPVLVW 30 40 50 60 70 80 70 80 90 100 110 120 pF1KE2 LPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLGGVH :: : ..:... :::.::: . .:.:::.:.::::.:: : ::::::.:.. ::..: . CCDS46 LPRYPVRDWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFIYFLFGTSR 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE2 QMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERLHVSATLACLTA .. :::::.:..::.. .:::. : :.:... .: .: :..:..::. :.. CCDS46 HISVGTFAVMSVMVGSVTESLAPQ--------ALNDSMINETARDAARVQVASTLSVLVG 150 160 170 180 190 190 200 210 220 230 240 pF1KE2 IIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSYTGPGSIVFTF ..:.:::...::::. :::: ..::. :::..:...: :::.::: . :..:: :...: CCDS46 LFQVGLGLIHFGFVVTYLSEPLVRGYTTAAAVQVFVSQLKYVFGLHLSSHSGPLSLIYTV 200 210 220 230 240 250 250 260 270 280 290 300 pF1KE2 IDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVVVVATAISGGC ...: .::........ : ..:. ::.:: :: . .... .::: :..... ::.:: : CCDS46 LEVCWKLPQSKVGTVVTAAVAGVVLVVVKLLNDKLQQQLPMPIPGELLTLIGATGISYGM 260 270 280 290 300 310 310 320 330 340 350 360 pF1KE2 KMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAMGRTLANKHGY . .......::.: :. ::.: .. .. ..:.::..:.:...: ...:. .: .::: CCDS46 GLKHRFEVDVVGNIPAGLVPPVAPNTQLFSKLVGSAFTIAVVGFAIAISLGKIFALRHGY 320 330 340 350 360 370 370 380 390 400 410 420 pF1KE2 DVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCVSLVVMITMLV ::::::..::: ::..:..:. . :..: .:. ...::.::::. :: ... .. CCDS46 RVDSNQELVALGLSNLIGGIFQCFPVSCSMSRSLVQESTGGNSQVAGAISSLFILLIIVK 380 390 400 410 420 430 430 440 450 460 470 480 pF1KE2 LGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFLSSFFLSLPYG :: .. :::.::.:.: ::::. :.::.: ::. .. : ::.:.: ....:.: : CCDS46 LGELFHDLPKAVLAAIIIVNLKGMLRQLSDMRSLWKANRADLLIWLVTFTATILLNLDLG 440 450 460 470 480 490 490 500 510 520 530 540 pF1KE2 VAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKIITYCSPLYFA ..:.: ::.:.:: .::. . .:.:: ::::: . :..:....:.:.. . .::: CCDS46 LVVAVIFSLLLVVVRTQMPHYSVLGQVPDTDIYRDVAEYSEAKEVRGVKVFRSSATVYFA 500 510 520 530 540 550 550 560 570 580 590 600 pF1KE2 NSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTKTVSLQELQQD :.:.. . . . :.: . .. :.: :::::. ... :....: .. . : CCDS46 NAEFYSDALKQRCGVDVDFLISQKKKLLKKQEQLKLKQLQKEEKLRKQAGPLLSACLAP- 560 570 580 590 600 610 610 620 630 640 650 660 pF1KE2 FENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSDMLASVPPFVT ... : .. : ::: . ::..: : . .: : :. : CCDS46 -QQVSSGDKMEDAT-ANG--------QEDSKAPDGS----TLKALGLPQ------P---D 620 630 640 670 680 690 700 710 720 pF1KE2 FHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDISHGGVFEDGSL ::.::::....:::: . .:.: .. . .: :.:... :. : ... : : :.:. CCDS46 FHSLILDLGALSFVDTVCLKSLKNIFHDFREIEVEVYMAACHSPVVSQLEAGHFF-DASI 650 660 670 680 690 700 730 740 750 760 770 780 pF1KE2 ECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSYWDLEQEMFGS ::.: :.:::: :: . : : CCDS46 TKKHLFASVHDAVTFALQHPRPVPDSPVSVTRL 710 720 730 740 >>CCDS43630.1 SLC26A5 gene_id:375611|Hs108|chr7 (685 aa) initn: 1548 init1: 1027 opt: 1484 Z-score: 1380.5 bits: 266.1 E(32554): 1.4e-70 Smith-Waterman score: 1584; 36.3% identity (71.9% similar) in 700 aa overlap (7-704:15-681) 10 20 30 40 50 pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYP--VGEKLRNAFRCSSAKIKA :: :.: .: ....... ::.. : ...::..:: :. ::. CCDS43 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKV-PDSIADKLKQAFTCTPKKIRN 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 VVFGLLPVLSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFP ... .::. .::: ::.:.:.. ::..:.: : .:.:::.:::.:: .: . ::::::.: CCDS43 IIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 LLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERL .. : ::: ... : :::::...:.. ..:.:.. :. ...: . : : .: :. CCDS43 VIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDI--VIPGGVNATN-GTEARDALRV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 HVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPS .:. ... :..:::. :: .::::::::.: ..::: :::..... :.:::.::. CCDS43 KVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 YTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIV :.: :.:.. . . .:. . :. :: .:. ..:. ::.: :. .:. ::: :... CCDS43 YSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 VVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLA ::..:.::.: .. ..:....:: . :. :..: .: .. . :...:::.. .... CCDS43 VVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTIS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 MGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLC :..::::::::.::.:::.:::: : .::.:. : :.:: .:. .:.:::.:.:. CCDS43 MAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCL 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 VSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSF .::......:. :. . ::..::.:.. ::::. . :..: ..:: ::.. ::...: CCDS43 ASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTF 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 LSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIK .::.::.: ::. ..: ...:.:...:: . .:... .::.:.. .:.....: ::: CCDS43 VSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVKEIPGIK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 IITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKT :. .:.:.:::... . . :::..: .. :..: ..: :. . : . CCDS43 IFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNAN-------MAN 540 550 560 570 580 600 610 620 630 640 650 pF1KE2 KTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPS :: . . : :.: : :... .: :.: :: .. : CCDS43 ATVVKADAEVDGEDA--TKPEEE----DGE-VKY--------------PPIVIKST-FPE 590 600 610 620 660 670 680 690 700 710 pF1KE2 DMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDI .: .:: . ::.:::.. :.:.: .:.:.:: . . :: .:. :.:.. : CCDS43 EMQRFMPPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAFIQR 630 640 650 660 670 680 720 730 740 750 760 770 pF1KE2 SHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRS >>CCDS5733.1 SLC26A5 gene_id:375611|Hs108|chr7 (744 aa) initn: 1627 init1: 1027 opt: 1484 Z-score: 1379.9 bits: 266.1 E(32554): 1.5e-70 Smith-Waterman score: 1668; 36.2% identity (71.5% similar) in 755 aa overlap (7-759:15-733) 10 20 30 40 50 pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYP--VGEKLRNAFRCSSAKIKA :: :.: .: ....... ::.. : ...::..:: :. ::. CCDS57 MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKV-PDSIADKLKQAFTCTPKKIRN 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 VVFGLLPVLSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFP ... .::. .::: ::.:.:.. ::..:.: : .:.:::.:::.:: .: . ::::::.: CCDS57 IIYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPIFGLYSSFYP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 LLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFNNATNESYVDTAAMEAERL .. : ::: ... : :::::...:.. ..:.:.. :. ...: . : : .: :. CCDS57 VIMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDI--VIPGGVNATN-GTEARDALRV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 HVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPS .:. ... :..:::. :: .::::::::.: ..::: :::..... :.:::.::. CCDS57 KVAMSVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 YTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIV :.: :.:.. . . .:. . :. :: .:. ..:. ::.: :. .:. ::: :... CCDS57 YSGIFSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 VVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLA ::..:.::.: .. ..:....:: . :. :..: .: .. . :...:::.. .... CCDS57 VVMGTGISAGFNLKESYNVDVVGTLPLGLLPPANPDTSLFHLVYVDAIAIAIVGFSVTIS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 MGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLC :..::::::::.::.:::.:::: : .::.:. : :.:: .:. .:.:::.:.:. CCDS57 MAKTLANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCL 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 VSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSF .::......:. :. . ::..::.:.. ::::. . :..: ..:: ::.. ::...: CCDS57 ASLMILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTF 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 LSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIK .::.::.: ::. ..: ...:.:...:: . .:... .::.:.. .:.....: ::: CCDS57 VSSLFLGLDYGLITAVIIALLTVIYRTQSPSYKVLGKLPETDVYIDIDAYEEVKEIPGIK 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 IITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKT :. .:.:.:::... . . :::..: .. :..: ..: :. . : . CCDS57 IFQINAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNAN-------MAN 540 550 560 570 580 600 610 620 630 640 650 pF1KE2 KTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPS :: . . : :.: : :... .: :.: :: .. : CCDS57 ATVVKADAEVDGEDA--TKPEEE----DGE-VKY--------------PPIVIKST-FPE 590 600 610 620 660 670 680 690 700 710 pF1KE2 DMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDI .: .:: . ::.:::.. :.:.: .:.:.:: . . :: .:. :.:.. ::: ::. CCDS57 EMQRFMPPGDNVHTVILDFTQVNFIDSVGVKTLAGIVKEYGDVGIYVYLAGCSAQVVNDL 630 640 650 660 670 680 720 730 740 750 760 770 pF1KE2 SHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRS ... ::. .: . .: ::::::: .: :.. .. .. :.. .: CCDS57 TRNRFFENPALW-ELLFHSIHDAVLGSQL--REALAEQEASAPPSQEDLEPNATPATPEA 690 700 710 720 730 740 780 790 pF1KE2 YWDLEQEMFGSMFHAETLTAL >>CCDS5746.1 SLC26A4 gene_id:5172|Hs108|chr7 (780 aa) initn: 1397 init1: 1064 opt: 1430 Z-score: 1329.5 bits: 256.8 E(32554): 9.9e-68 Smith-Waterman score: 1550; 35.2% identity (70.2% similar) in 739 aa overlap (8-742:20-734) 10 20 30 40 pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKK-DRTYPVGEKLRNAFRCSSAK :.:.: .:: :... :.. .. . :.: . :: . CCDS57 MAAPGGRSEPPQLPEYSCSYMVSRPVYSELAFQQQHERRLQERKTLRESLAKCCSCSRKR 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 IKAVVFGLLPVLSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSS .:. :.:.: :::.:..:.... :...:.: : . . ::::.:::: .:. ::::. CCDS57 AFGVLKTLVPILEWLPKYRVKEWLLSDVISGVSTGLVATLQGMAYALLAAVPVGYGLYSA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 FFPLLTYFFLGGVHQMVPGTFAVISILVGNICLQLAPESKFQVFN-NAT--NESYVDTAA :::.::::..: ... : : :.:..::.. :..::. .: : . :.: : ...:::: CCDS57 FFPILTYFIFGTSRHISVGPFPVVSLMVGSVVLSMAPDEHFLVSSSNGTVLNTTMIDTAA 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 MEAERLHVSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIF .. :. ....:. :..:::. .: .:.::.. ::.. .. :: :::..:.:.: :: .. CCDS57 RDTARVLIASALTLLVGIIQLIFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVL 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE2 GLTIPSYTGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPI ... .:.: ::..:...: .:. ::.:.. .:.. . . ::::: :. ::: :: CCDS57 NVSTKNYNGVLSIIYTLVEIFQNIGDTNLADFTAGLLTIVVCMAVKELNDRFRHKIPVPI 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE2 PTEMIVVVVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVS : :.::...::::: : .. :.:. :: : ::: : : :: ...:....::.:.:. CCDS57 PIEVIVTIIATAISYGANLEKNYNAGIVKSIPRGFLPPELPPVSLFSEMLAASFSIAVVA 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE2 YVINLAMGRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKS :.: ...:.. :.:. : .:.:::.::.: ::.:..::. : ::: : . ...:::. CCDS57 YAIAVSVGKVYATKYDYTIDGNQEFIAFGISNIFSGFFSCFVATTALSRTAVQESTGGKT 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE2 QVASLCVSLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCC :::.. . .:::..:.:: : :: ::::.:.. .:::. . :: : :::..:.: CCDS57 QVAGIISAAIVMIAILALGKLLEPLQKSVLAAVVIANLKGMFMQLCDIPRLWRQNKIDAV 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE2 IWVVSFLSSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQ ::: . . :..:.: :. .:. :..:.::...:: . .:... .:::: . :.:. . CCDS57 IWVFTCIVSIILGLDLGLLAGLIFGLLTVVLRVQFPSWNGLGSIPSTDIYKSTKNYKNIE 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE2 DIQGIKIITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRR . ::.::. . ::....: . :.. . . .:.: .: . : :.: .: .. : : CCDS57 EPQGVKILRFSSPIFYGNVDGFKKCIKSTVGFDAIRVYNKRLKALRKIQKL-IKSGQLRA 550 560 570 580 590 590 600 610 620 630 640 pF1KE2 SLFMKTKTVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAE . :. .: . .. . :: : . .. .. : .. : .: : :.... CCDS57 T---KNGIIS-DAVSTN--NAFEPDEDIEDLEELDIPTKEIEIQVDWNS----ELPVKVN 600 610 620 630 640 650 660 670 680 690 700 pF1KE2 APGEPSDMLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHA .: : .:.:.:: ...::.:..:...: . . . .: :.:...... CCDS57 VPKVP------------IHSLVLDCGAISFLDVVGVRSLRVIVKEFQRIDVNVYFASLQD 650 660 670 680 690 710 720 730 740 750 760 pF1KE2 QVYNDISHGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDS : . . . : :.: ... : ..:::.:. : ... CCDS57 YVIEKLEQCGFFDD-NIRKDTFFLTVHDAILYLQNQVKSQEGQGSILETITLIQDCKDTL 700 710 720 730 740 750 770 780 790 pF1KE2 EEDIRSYWDLEQEMFGSMFHAETLTAL CCDS57 ELIETELTEEELDVQDEAMRTLAS 760 770 780 >>CCDS5748.1 SLC26A3 gene_id:1811|Hs108|chr7 (764 aa) initn: 1450 init1: 1020 opt: 1393 Z-score: 1295.3 bits: 250.5 E(32554): 7.9e-66 Smith-Waterman score: 1496; 34.5% identity (68.5% similar) in 737 aa overlap (7-735:8-718) 10 20 30 40 50 pF1KE2 MSQPRPRYVVDRAAYSLTLFDDEFEKKDRTYPVG-EKLRNAFRCSSAKIKAVVFGLLPV .:.: : .:: . :... .: : . . ..:. :: : : .:..:.:. CCDS57 MIEPFGNQYIVARPVYSTNAFEENHKKTGRHHKTFLDHLKVCCSCSPQKAKRIVLSLFPI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 LSWLPNYKIKDYIIPDLLGGLSGGSIQVPQGMAFALLANLPAVNGLYSSFFPLLTYFFLG :::: :..:.... :...:.: : . : ::.:::::...: : :::.:::: . :.:.: CCDS57 ASWLPAYRLKEWLLSDIVSGISTGIVAVLQGLAFALLVDIPPVYGLYASFFPAIIYLFFG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 GVHQMVPGTFAVISILVG----NICLQLAPE---SKFQVFNNATNESYVDTAAMEAERLH ... : : ..:..:: . . .:. . . . ::..: : .: : :. CCDS57 TSRHISVGPFPILSMMVGLAVSGAVSKAVPDRNATTLGLPNNSNNSSLLDD---ERVRVA 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 VSATLACLTAIIQMGLGFMQFGFVAIYLSESFIRGFMTAAGLQILISVLKYIFGLTIPSY ..:... :..:::...:....:::.::::::.: :: :::....:.: ::.:: ::.::. CCDS57 AAASVTVLSGIIQLAFGILRIGFVVIYLSESLISGFTTAAAVHVLVSQLKFIFQLTVPSH 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 TGPGSIVFTFIDICKNLPHTNIASLIFALISGAFLVLVKELNARYMHKIRFPIPTEMIVV : : :: .. .. ... .::::.:. ::: . .:::.: :. :. ::: :.:.. CCDS57 TDPVSIFKVLYSVFSQIEKTNIADLVTALIVLLVVSIVKEINQRFKDKLPVPIPIEFIMT 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 VVATAISGGCKMPKKYHMQIVGEIQRGFPTPVSPVVSQWKDMIGTAFSLAIVSYVINLAM :.:...: :: . ..... .::... :: :..: : ... .: :..:.:.... ... CCDS57 VIAAGVSYGCDFKNRFKVAVVGDMNPGFQPPITPDVETFQNTVGDCFGIAMVAFAVAFSV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 GRTLANKHGYDVDSNQEMIALGCSNFFGSFFKIHVICCALSVTLAVDGAGGKSQVASLCV . . . :. : .:.:::.:::: .:. . :. . ::: . . ...:::.:.:.: CCDS57 ASVYSLKYDYPLDGNQELIALGLGNIVCGVFRGFAGSTALSRSAVQESTGGKTQIAGLIG 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 SLVVMITMLVLGIYLYPLPKSVLGALIAVNLKNSLKQLTDPYYLWRKSKLDCCIWVVSFL ...:.:..:..:. : :: ::::.:: :::. : :... ::::.: :: ::...:. CCDS57 AIIVLIVVLAIGFLLAPLQKSVLAALALGNLKGMLMQFAEIGRLWRKDKYDCLIWIMTFI 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 SSFFLSLPYGVAVGVAFSVLVVVFQTQFRNGYALAQVMDTDIYVNPKTYNRAQDIQGIKI .. :.: :.:..:::..:..::.::: . .::.. :.:: : : : . .:.:: CCDS57 FTIVLGLGLGLAASVAFQLLTIVFRTQFPKCSTLANIGRTNIYKNKKDYYDMYEPEGVKI 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 ITYCSPLYFANSEIFRQKVIAKTGMDPQKVLLAKQKYLKKQEKRRMRPTQQRRSLFMKTK . ::.:::: .::.:.: .:..: ..: ..: :.: .: :...:.. : CCDS57 FRCPSPIYFANIGFFRRKLIDAVGFSPLRILRKRNKALRKIRK------LQKQGLLQVTP 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 TVSLQELQQDFENAPPTDPNNNQTPANGTSVSYITFSPDSSSPAQSEPPASAEAPGEPSD . .. .. : :. .. . ... . : : .. . : . :.: CCDS57 KGFICTVDTIKDSDEELDNNQIEVLDQPINTTDLPFHIDWND----DLPLNIEVPK---- 600 610 620 630 640 660 670 680 690 700 710 pF1KE2 MLASVPPFVTFHTLILDMSGVSFVDLMGIKALAKLSSTYGKIGVKVFLVNIHAQVYNDIS ...:.::::.:.:::.:. ....: .. . . .: : :..:. . . .. CCDS57 --------ISLHSLILDFSAVSFLDVSSVRGLKSILQEFIRIKVDVYIVGTDDDFIEKLN 650 660 670 680 690 720 730 740 750 760 770 pF1KE2 HGGVFEDGSLECKHVFPSIHDAVLFAQANARDVTPGHNFQGAPGDAELSLYDSEEDIRSY . : :: .. . : .:::::: CCDS57 RYEFF-DGEVKSSIFFLTIHDAVLHILMKKDYSTSKFNPSQEKDGKIDFTINTNGGLRNR 700 710 720 730 740 750 791 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 16:34:39 2016 done: Tue Nov 8 16:34:40 2016 Total Scan time: 2.520 Total Display time: 0.150 Function used was FASTA [36.3.4 Apr, 2011]