FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3856, 1241 aa 1>>>pF1KB3856 1241 - 1241 aa - 1241 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.1729+/-0.000901; mu= 10.1469+/- 0.054 mean_var=165.6193+/-32.949, 0's: 0 Z-trim(112.1): 49 B-trim: 0 in 0/53 Lambda= 0.099660 statistics sampled from 12862 (12905) to 12862 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.396), width: 16 Scan time: 4.730 The best scores are: opt bits E(32554) CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241) 8209 1193.2 0 CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227) 8090 1176.1 0 CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232) 8090 1176.1 0 CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232) 4504 660.5 7.5e-189 CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259) 4330 635.5 2.6e-181 CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093) 1714 259.3 3.9e-68 CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040) 1711 258.8 5e-68 CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090) 1705 258.0 9.5e-68 CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095) 1705 258.0 9.5e-68 CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131) 1705 258.0 9.8e-68 CCDS46438.1 SLC4A10 gene_id:57282|Hs108|chr2 (1088) 1700 257.3 1.6e-67 CCDS54412.1 SLC4A10 gene_id:57282|Hs108|chr2 (1099) 1700 257.3 1.6e-67 CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 ( 911) 1666 252.3 4e-66 CCDS82751.1 SLC4A7 gene_id:9497|Hs108|chr3 (1206) 1369 209.7 3.6e-53 CCDS82748.1 SLC4A7 gene_id:9497|Hs108|chr3 (1210) 1369 209.7 3.6e-53 CCDS33721.1 SLC4A7 gene_id:9497|Hs108|chr3 (1214) 1369 209.7 3.6e-53 CCDS82749.1 SLC4A7 gene_id:9497|Hs108|chr3 (1246) 1369 209.7 3.7e-53 CCDS82747.1 SLC4A7 gene_id:9497|Hs108|chr3 (1259) 1369 209.7 3.7e-53 CCDS54411.1 SLC4A10 gene_id:57282|Hs108|chr2 (1118) 1347 206.5 3e-52 CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035) 1190 183.9 1.8e-45 CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079) 1190 184.0 1.8e-45 CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094) 1190 184.0 1.9e-45 CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 945) 1155 178.9 5.4e-44 CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121) 964 151.5 1.1e-35 CCDS47278.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 959) 934 147.1 2e-34 CCDS58973.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 983) 934 147.1 2e-34 CCDS54446.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 875) 851 135.2 7.3e-31 CCDS13052.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 891) 851 135.2 7.4e-31 CCDS54445.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 918) 851 135.2 7.6e-31 CCDS58974.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 896) 827 131.7 8.1e-30 CCDS58233.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 638) 596 98.4 6.1e-20 CCDS58232.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 747) 596 98.4 7e-20 CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137) 553 92.4 7.1e-18 >>CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241 aa) initn: 8209 init1: 8209 opt: 8209 Z-score: 6382.8 bits: 1193.2 E(32554): 0 Smith-Waterman score: 8209; 100.0% identity (100.0% similar) in 1241 aa overlap (1-1241:1-1241) 10 20 30 40 50 60 pF1KB3 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB3 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB3 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB3 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB3 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB3 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB3 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB3 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB3 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB3 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 pF1KB3 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV ::::::::::::::::::::::::::::::::::::::::: CCDS59 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV 1210 1220 1230 1240 >>CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227 aa) initn: 8090 init1: 8090 opt: 8090 Z-score: 6290.4 bits: 1176.1 E(32554): 0 Smith-Waterman score: 8090; 100.0% identity (100.0% similar) in 1224 aa overlap (18-1241:4-1227) 10 20 30 40 50 60 pF1KB3 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE ::::::::::::::::::::::::::::::::::::::::::: CCDS56 MTQPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE 10 20 30 40 70 80 90 100 110 120 pF1KB3 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB3 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB3 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB3 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB3 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB3 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB3 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV 410 420 430 440 450 460 490 500 510 520 530 540 pF1KB3 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA 470 480 490 500 510 520 550 560 570 580 590 600 pF1KB3 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT 530 540 550 560 570 580 610 620 630 640 650 660 pF1KB3 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL 590 600 610 620 630 640 670 680 690 700 710 720 pF1KB3 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL 650 660 670 680 690 700 730 740 750 760 770 780 pF1KB3 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS 710 720 730 740 750 760 790 800 810 820 830 840 pF1KB3 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF 770 780 790 800 810 820 850 860 870 880 890 900 pF1KB3 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT 830 840 850 860 870 880 910 920 930 940 950 960 pF1KB3 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ 890 900 910 920 930 940 970 980 990 1000 1010 1020 pF1KB3 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS 950 960 970 980 990 1000 1030 1040 1050 1060 1070 1080 pF1KB3 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK 1010 1020 1030 1040 1050 1060 1090 1100 1110 1120 1130 1140 pF1KB3 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH 1070 1080 1090 1100 1110 1120 1150 1160 1170 1180 1190 1200 pF1KB3 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR 1130 1140 1150 1160 1170 1180 1210 1220 1230 1240 pF1KB3 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV ::::::::::::::::::::::::::::::::::::::::: CCDS56 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV 1190 1200 1210 1220 >>CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232 aa) initn: 8090 init1: 8090 opt: 8090 Z-score: 6290.4 bits: 1176.1 E(32554): 0 Smith-Waterman score: 8090; 100.0% identity (100.0% similar) in 1224 aa overlap (18-1241:9-1232) 10 20 30 40 50 60 pF1KB3 MSSAPRRPAKGADSFCTPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE ::::::::::::::::::::::::::::::::::::::::::: CCDS56 MDFLLRPQPEPESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSRGGE 10 20 30 40 50 70 80 90 100 110 120 pF1KB3 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 EPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRRPGASPTGETPT 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 IEEGEEDEDEASEAEGARALTQPSPVSTPSSVQFFLQEDDSADRKAERTSPSSPAPLPHQ 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB3 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 EATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB3 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 IGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB3 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 REGREPGPTPRARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERW 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB3 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVL 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB3 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 RALLLKHSHPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGVPETRLEV 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB3 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREA 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB3 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 VELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLT 540 550 560 570 580 590 610 620 630 640 650 660 pF1KB3 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 AINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLEPKSAQDKAL 600 610 620 630 640 650 670 680 690 700 710 720 pF1KB3 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAAL 660 670 680 690 700 710 730 740 750 760 770 780 pF1KB3 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 SPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFS 720 730 740 750 760 770 790 800 810 820 830 840 pF1KB3 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 FCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETF 780 790 800 810 820 830 850 860 870 880 890 900 pF1KB3 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 YKLVKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNT 840 850 860 870 880 890 910 920 930 940 950 960 pF1KB3 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ALLSLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQ 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KB3 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 KLSVPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIIS 960 970 980 990 1000 1010 1030 1040 1050 1060 1070 1080 pF1KB3 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 KKERMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDK 1020 1030 1040 1050 1060 1070 1090 1100 1110 1120 1130 1140 pF1KB3 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PKIQEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLH 1080 1090 1100 1110 1120 1130 1150 1160 1170 1180 1190 1200 pF1KB3 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LLLMPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLR 1140 1150 1160 1170 1180 1190 1210 1220 1230 1240 pF1KB3 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV ::::::::::::::::::::::::::::::::::::::::: CCDS56 MVVLTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV 1200 1210 1220 1230 >>CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232 aa) initn: 3774 init1: 1663 opt: 4504 Z-score: 3503.9 bits: 660.5 E(32554): 7.5e-189 Smith-Waterman score: 4611; 59.5% identity (77.8% similar) in 1267 aa overlap (8-1241:8-1232) 10 20 30 40 50 pF1KB3 MSSAPRRPAKGADSFCTPE---PESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSR : ::. . :. : : .: :.:.:.: .::.: :: ..... . CCDS24 MANGVIPPPGGASPL--PQVRVPLEEPPLSPDV-EEEDDDLGKTLAVSRFGDLISKPPAW 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 GGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRR-----PGA :.:.:::.:.:::.::..::: :::::..::: . :. : .:. ::. .: CCDS24 DPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSA 60 70 80 90 100 110 120 130 140 150 160 pF1KB3 SPTGETPTI-EEG------EEDEDEASEAEGARALTQPSPVSTPSSVQFFL--QEDDSAD :. :: : ::: ::.:.: :.:. ..: .::....: . .:::: CCDS24 PPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPHSGTPQKAKFSIGSDEDDSPG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB3 RKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGR . :.. ..: : :: . .:. :... . .:.: .: : ..: CCDS24 LPG-RAAVTKPLPSVGPHTDKSPQHSSSSPS----PRARASRLA-----------GEKSR 180 190 200 210 220 230 240 250 260 270 280 pF1KB3 PL-PKAQPGHRSYNLQERRRIGSMTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFED : :.: ::.:.:: :: : . .::::: ::: :..:::: :::::.:: CCDS24 PWSPSA-----SYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLED 230 240 250 260 270 290 300 310 320 330 pF1KB3 VPGVRRHLVRKNAKGSTQSGREGREPGPTP-----RARPRAPHKPHEVFVELNELLLDKN ::::::::.: .. ::.:: : : .: . . . ..:::::::::::.::.. CCDS24 NPGVRRHLVKKPSR--TQGGR-GSPSGLAPILRRKKKKKKLDRRPHEVFVELNELMLDRS 280 290 300 310 320 330 340 350 360 370 380 390 pF1KB3 QEPQWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLP :::.::::::::::::::::::::::::::::::::::::::::.::::.::::.: ::: CCDS24 QEPHWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTIAHGAALLDLEQTTLP 340 350 360 370 380 390 400 410 420 430 440 450 pF1KB3 GVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPSDEKDFSF-PRNISAGSLGSLLGHH :.:: ::: :..::::. ::::.:::.::::::::.:.:: .: ::: :..:..:.::.: CCDS24 GIAHLVVETMIVSDQIRPEDRASVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNH 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB3 HGQGAESDPHVTEPLMG---GVPETRLEVERE-RELPPPAPPAGITRSKSKHELKLLEKI : ... : . : :. : : . . .: : : . :.:: ::::::: CCDS24 HPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS---LKLLEKI 460 470 480 490 500 520 530 540 550 560 570 pF1KB3 PENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAVLEVPVPVRFLFLLLGPSSANMDYH ::.::::::::::: :: .:. ::::: ::: :..::::::::::::..:::: .. ::: CCDS24 PEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYH 510 520 530 540 550 560 580 590 600 610 620 630 pF1KB3 EIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQ :.::::.:::::: :::::: ::.:.:::.::. ::: :.:.:::::.:..:::::: :: CCDS24 ELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQ 570 580 590 600 610 620 640 650 660 670 680 pF1KB3 RQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQMVEAAGAAEDDPLRRTGRPFGGLIR :..:.::.: : .. : : .: : : :.. . .. ::::: ::: ::::.: CCDS24 RELLRKRREREQTKVEMTTRG--GYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVR 630 640 650 660 670 680 690 700 710 720 730 740 pF1KB3 DVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPAITFGGLLGEKTQDLIGVSELIMST ::::::::: ::.:::: ::.:::.:::::::::::::::::::::. :.::::::.:: CCDS24 DVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVST 690 700 710 720 730 740 750 760 770 780 790 800 pF1KB3 ALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCSSNHLEYLVGRVWIGFWLVFLALLM :. ::.: :::::::::.::::::::::::::.:: .. ::::.::::.:.::: ..: . CCDS24 AVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLAL 750 760 770 780 790 800 810 820 830 840 850 860 pF1KB3 VALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKLVKIFQEHPLHGCSASNSSEVDGGE :: :::::::..: :::::::::::::::::::::: :.: :::: ... ..:. CCDS24 VAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPPEGA-LEGSL 810 820 830 840 850 860 870 880 890 900 910 920 pF1KB3 NMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFF . :: : :.. .: : .::.:::::::::.:: ::::::::::::.::::. CCDS24 D---AG----LEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFLRKFRNSRFL 870 880 890 900 910 930 940 950 960 970 980 pF1KB3 PGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKS :. ::.:::::.::.::.:::::::: :::::::.::.:.:::.:.::.: : ::: CCDS24 GGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSAR 920 930 940 950 960 970 990 1000 1010 1020 1030 1040 pF1KB3 PFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICA ::: :::::. .::.::.::::::::::.::.:.: : : :::::::::::: ..::.:. CCDS24 PFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCG 980 990 1000 1010 1020 1030 1050 1060 1070 1080 1090 1100 pF1KB3 LFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIG :::::::.:::::::::.:::::: :.::::::.::::.::::::.:.: :::::::.: CCDS24 LFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMG 1040 1050 1060 1070 1080 1090 1110 1120 1130 1140 1150 1160 pF1KB3 DLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFT .::.::::::::::::::::::.:::. .:: :.::: ::::. :: ::.: :::::: CCDS24 AVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFT 1100 1110 1120 1130 1140 1150 1170 1180 1190 1200 1210 1220 pF1KB3 ALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDE .:: :.::::.: ::::::::::.:.:::::: .: :.: :::.. ::...::: ::: CCDS24 CIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDSEDAEPNFDE 1160 1170 1180 1190 1200 1210 1230 1240 pF1KB3 REGVDEYNEMPMPV .: :::::. ::: CCDS24 -DGQDEYNELHMPV 1220 1230 >>CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259 aa) initn: 3774 init1: 1663 opt: 4330 Z-score: 3368.6 bits: 635.5 E(32554): 2.6e-181 Smith-Waterman score: 4602; 58.9% identity (77.9% similar) in 1276 aa overlap (8-1241:8-1259) 10 20 30 40 50 pF1KB3 MSSAPRRPAKGADSFCTPE---PESLGPGTPGFPEQEEDELHRTLGVERFEEILQEAGSR : ::. . :. : : .: :.:.:.: .::.: :: ..... . CCDS24 MANGVIPPPGGASPL--PQVRVPLEEPPLSPDV-EEEDDDLGKTLAVSRFGDLISKPPAW 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 GGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRKTPQGPGRKPRRR-----PGA :.:.:::.:.:::.::..::: :::::..::: . :. : .:. ::. .: CCDS24 DPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSA 60 70 80 90 100 110 120 130 140 150 160 pF1KB3 SPTGETPTI-EEG------EEDEDEASEAEGARALTQPSPVSTPSSVQFFL--QEDDSAD :. :: : ::: ::.:.: :.:. ..: .::....: . .:::: CCDS24 PPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPHSGTPQKAKFSIGSDEDDSPG 120 130 140 150 160 170 170 180 190 200 210 pF1KB3 RKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEAEA-VAVASG-------TAGG . :.. ..: : :: . .:. : .. ........ . .:..: .. . CCDS24 LPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDGTTDLALSSPRLLCCLPSSPS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB3 DDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQALLPRVPTDEIEAQTLATADLD . :: :..: ::.:.:: :: : . .::::: ::: :..:::: CCDS24 PRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLD 240 250 260 270 280 290 280 290 300 310 320 pF1KB3 LMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTP-----RARPRAPHKPHEVFVE :::::.:: ::::::::.: .. ::.:: : : .: . . . ..::::::: CCDS24 DMKSHRLEDNPGVRRHLVKKPSR--TQGGR-GSPSGLAPILRRKKKKKKLDRRPHEVFVE 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB3 LNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTLAHGAVL ::::.::..:::.::::::::::::::::::::::::::::::::::::::::.::::.: CCDS24 LNELMLDRSQEPHWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTIAHGAAL 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB3 LDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPSDEKDFSF-PRNISAG :::.: ::::.:: ::: :..::::. ::::.:::.::::::::.:.:: .: ::: :.. CCDS24 LDLEQTTLPGIAHLVVETMIVSDQIRPEDRASVLRTLLLKHSHPNDDKDSGFFPRNPSSS 420 430 440 450 460 470 450 460 470 480 490 500 pF1KB3 SLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-RELPPPAPPAGITRSKSK :..:.::.:: ... : . : :. : : . . .: : : . :.:: CCDS24 SMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS- 480 490 500 510 520 510 520 530 540 550 560 pF1KB3 HELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAVLEVPVPVRFLFLLLG :::::::::.::::::::::: :: .:. ::::: ::: :..::::::::::::..:: CCDS24 --LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLG 530 540 550 560 570 580 570 580 590 600 610 620 pF1KB3 PSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFLDCSVVLPPSEVQGEE :: .. ::::.::::.:::::: :::::: ::.:.:::.::. ::: :.:.:::::.:.. CCDS24 PSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRD 590 600 610 620 630 640 630 640 650 660 670 pF1KB3 LLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQMVEAAGAAEDDPLRRT :::::: :::..:.::.: : .. : : .: : : :.. . .. ::::: :: CCDS24 LLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLELGGSEATPEDDPLLRT 650 660 670 680 690 700 680 690 700 710 720 730 pF1KB3 GRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPAITFGGLLGEKTQDLI : ::::.:::::::::: ::.:::: ::.:::.:::::::::::::::::::::. :. CCDS24 GSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLM 710 720 730 740 750 760 740 750 760 770 780 790 pF1KB3 GVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCSSNHLEYLVGRVWIGF ::::::.:::. ::.: :::::::::.::::::::::::::.:: .. ::::.::::.:. CCDS24 GVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGL 770 780 790 800 810 820 800 810 820 830 840 850 pF1KB3 WLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKLVKIFQEHPLHGCSAS ::: ..: .:: :::::::..: :::::::::::::::::::::: :.: :::: CCDS24 WLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPP 830 840 850 860 870 880 860 870 880 890 900 910 pF1KB3 NSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFL ... ..:. . :: : :.. .: : .::.:::::::::.:: ::::::::: CCDS24 EGA-LEGSLD---AG----LEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFL 890 900 910 920 930 920 930 940 950 960 970 pF1KB3 RKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGW :::.::::. :. ::.:::::.::.::.:::::::: :::::::.::.:.:::.:.::.: CCDS24 RKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSW 940 950 960 970 980 990 980 990 1000 1010 1020 1030 pF1KB3 VINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLL : ::: ::: :::::. .::.::.::::::::::.::.:.: : : ::::::::::: CCDS24 FIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLL 1000 1010 1020 1030 1040 1050 1040 1050 1060 1070 1080 1090 pF1KB3 IVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVAL : ..::.:.:::::::.:::::::::.:::::: :.::::::.::::.::::::.:.: CCDS24 IGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIAS 1060 1070 1080 1090 1100 1110 1100 1110 1120 1130 1140 1150 pF1KB3 LVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKV :::::::.: .::.::::::::::::::::::.:::. .:: :.::: ::::. :: :: CCDS24 LVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKV 1120 1130 1140 1150 1160 1170 1160 1170 1180 1190 1200 1210 pF1KB3 RTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDA .: :::::: .:: :.::::.: ::::::::::.:.:::::: .: :.: :::.. ::. CCDS24 KTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDS 1180 1190 1200 1210 1220 1230 1220 1230 1240 pF1KB3 NEAEPVFDEREGVDEYNEMPMPV ..::: ::: .: :::::. ::: CCDS24 EDAEPNFDE-DGQDEYNELHMPV 1240 1250 >>CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093 aa) initn: 2265 init1: 739 opt: 1714 Z-score: 1336.7 bits: 259.3 E(32554): 3.9e-68 Smith-Waterman score: 2320; 39.0% identity (67.9% similar) in 1044 aa overlap (218-1217:3-1005) 190 200 210 220 230 240 pF1KB3 KGAQAGTQVEEAEAEAVAVASGTAGGDDGGASGRPLPKAQPGHRSYNLQERRRIGSMTGA :.: : : ::. ... . .. :. CCDS44 MPAAGSNEPD---GVLSYQRPDEEAVVDQGGT 10 20 250 260 270 280 290 300 pF1KB3 EQALLPRVPTDEIEAQTLATADLDL---MKSHRFEDVPGVRRHLVRKNAKGSTQSGREGR : . .:.:.. . . . .::: . . : ..: : .::..: :.:: CCDS44 STILNIHYEKEELEGHRTLYVGVRMPLGRQSHRHHRTHG-QKHRRRGRGKGASQ-GEEGL 30 40 50 60 70 80 310 320 330 340 350 pF1KB3 EP--GPTPRARPR--------APHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVE : :: : . : :::.:.::.:. . .... .:.:::::.::::::: CCDS44 EALAHDTPSQRVQFILGTEEDEEHVPHELFTELDEICMKEGEDAEWKETARWLKFEEDVE 90 100 110 120 130 140 360 370 380 390 400 410 pF1KB3 EETERWGKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAE . :::.::.::.::..::.::: : .:.::::. ... .. ...:. .:.... CCDS44 DGGERWSKPYVATLSLHSLFELRSCLINGTVLLDMHANSIEEISDLILDQQELSSDLNDS 150 160 170 180 190 200 420 430 440 450 460 470 pF1KB3 DRANVLRALLLKHSHPSDEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG-- :..: .::: :: : ...: .. : : . .:. .::::. . : CCDS44 MRVKVREALLKKHHHQNEKKRNNLIPIVRSFAEVGK---------KQSDPHLMDK-HGQT 210 220 230 240 250 480 490 500 510 520 pF1KB3 ----GVPETRLEVERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFL .:: : :::. . :. . :: .:....::: .:::. :::: :..: CCDS44 VSPQSVPTTNLEVKNGVNCEHS--PVDL----SKVDLHFMKKIPTGAEASNVLVGEVDIL 260 270 280 290 300 310 530 540 550 560 570 580 pF1KB3 SRPTMAFVRLREAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHE .:: .::::: :: :... :::.:.::::.:::: . ...:::::::..:.:.:. ::. CCDS44 DRPIVAFVRLSPAVLLSGLTEVPIPTRFLFILLGPVGKGQQYHEIGRSMATIMTDEIFHD 320 330 340 350 360 370 590 600 610 620 630 640 pF1KB3 AAYLADEREDLLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTG .:: : ::.:::..:. ::: .::::.: . .. . : .::. : .:.: CCDS44 VAYKAKERDDLLAGIDEFLDQVTVLPPGEWDPSIRIEPPKNVPSQ--EKRKMPG--VPNG 380 390 400 410 420 650 660 670 680 690 700 pF1KB3 AGLEPKSAQDKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQ . .. : :. :.:::: ::::. :..:. : : ::.::::. : CCDS44 NVCHIEQ----------EPHGGHSGPELQRTGRLFGGLVLDIKRKAPWYWSDYRDALSLQ 430 440 450 460 470 710 720 730 740 750 760 pF1KB3 CLAAVIFIYFAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGF :::. .:.: : .::.::::::::: :. :.. : ...... :... :...: : ..: CCDS44 CLASFLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYSLFAGQALTILGS 480 490 500 510 520 530 770 780 790 800 810 820 pF1KB3 SGPLLVFEEAFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIF .::.::::. .:.::.. : :: :. ::.: .:: ...:: ..: :: ...:::.: : CCDS44 TGPVLVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSLVCYITRFTEEAF 540 550 560 570 580 590 830 840 850 860 870 pF1KB3 AFLISLIFIYETFYKLVKIFQEHPLHGCSASNSSEV--------DGGENMT---WAGARP : :: .:::::.. ::... . .:.: : . . .. .: : : CCDS44 ASLICIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPNNHTLQYWKDHNI 600 610 620 630 640 650 880 890 900 910 920 pF1KB3 TLGP---GNRSLAG-QSGQGKPRGQ---------PNTALLSLVLMAGTFFIAFFLRKFKN . . .: ... : .:. :. :.. . : .:. ::... :. ::. CCDS44 VTAEVHWANLTVSECQEMHGEFMGSACGHHGPYTPDVLFWSCILFFTTFILSSTLKTFKT 660 670 680 690 700 710 930 940 950 960 970 980 pF1KB3 SRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPL ::.:: :.: ...::.: ..:. ::..:. : . . ::.::: :. : . :::.:::. CCDS44 SRYFPTRVRSMVSDFAVFLTIFTMVIIDFLI-GVPSPKLQVPSVFKPTRDD-RGWIINPI 720 730 740 750 760 770 990 1000 1010 1020 1030 1040 pF1KB3 GEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMG : : : : ..:...::.: :::::. :::..::..::. :.:: :.:::::... : CCDS44 G---PNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKLKKGCGYHLDLLMVAIML 780 790 800 810 820 830 1050 1060 1070 1080 1090 1100 pF1KB3 GICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLS :.:...::::..:::: :.::.:.: . :. :::..::. ..:::::::.. .:.: : CCDS44 GVCSIMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGIREQRVTGLMIFVLMGCS 840 850 860 870 880 890 1110 1120 1130 1140 1150 1160 pF1KB3 IVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRM . . .:. ::. ::.:.::::::.::.::::..::.:. :: ::.:: :...: .. CCDS44 VFMTAILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPAKHQPDFIYLRHVPLRKV 900 910 920 930 940 950 1170 1180 1190 1200 1210 1220 pF1KB3 HLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEP :::: .:: ::.:::.. .. :...::.... : .: : . :. ::.. :: CCDS44 HLFTLIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKV-MDLCFSKRELSWLDDLMPES 960 970 980 990 1000 1010 1230 1240 pF1KB3 VFDEREGVDEYNEMPMPV CCDS44 KKKKLDDAKKKAKEEEEAEKMLEIGGDKFPLESRKLLSSPGKNISCRCDPSEINISDEMP 1020 1030 1040 1050 1060 1070 >>CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040 aa) initn: 2265 init1: 739 opt: 1711 Z-score: 1334.7 bits: 258.8 E(32554): 5e-68 Smith-Waterman score: 2317; 40.3% identity (69.4% similar) in 980 aa overlap (274-1217:6-952) 250 260 270 280 290 300 pF1KB3 MTGAEQALLPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG .::: . . : ..: : .::..: :.:: CCDS73 MPLGRQSHRHHRTHG-QKHRRRGRGKGASQ-GEEG 10 20 30 310 320 330 340 350 pF1KB3 REP--GPTPRARPR--------APHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDV : :: : . : :::.:.::.:. . .... .:.:::::.:::::: CCDS73 LEALAHDTPSQRVQFILGTEEDEEHVPHELFTELDEICMKEGEDAEWKETARWLKFEEDV 40 50 60 70 80 90 360 370 380 390 400 410 pF1KB3 EEETERWGKPHVASLSFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKA :. :::.::.::.::..::.::: : .:.::::. ... .. ...:. .:.... CCDS73 EDGGERWSKPYVATLSLHSLFELRSCLINGTVLLDMHANSIEEISDLILDQQELSSDLND 100 110 120 130 140 150 420 430 440 450 460 470 pF1KB3 EDRANVLRALLLKHSHPSDEKDFSFPRNISAGSLGSL--LGHHHGQGAESDPHVTEPLMG :..: .::: :: : ...: :: . :. .:..... : : CCDS73 SMRVKVREALLKKHHHQNEKK-----RNNLIPIVRSFAEVGKKQSDPHLMDKHGQTVSPQ 160 170 180 190 200 480 490 500 510 520 530 pF1KB3 GVPETRLEVERERELPPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPT .:: : :::. . :. . :: .:....::: .:::. :::: :..:.:: CCDS73 SVPTTNLEVKNGVNCEH--SPVDL----SKVDLHFMKKIPTGAEASNVLVGEVDILDRPI 210 220 230 240 250 260 540 550 560 570 580 590 pF1KB3 MAFVRLREAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYL .::::: :: :... :::.:.::::.:::: . ...:::::::..:.:.:. ::..:: CCDS73 VAFVRLSPAVLLSGLTEVPIPTRFLFILLGPVGKGQQYHEIGRSMATIMTDEIFHDVAYK 270 280 290 300 310 320 600 610 620 630 640 650 pF1KB3 ADEREDLLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPTGAGLE : ::.:::..:. ::: .::::.: . .. . : .::. : .:.: . CCDS73 AKERDDLLAGIDEFLDQVTVLPPGEWDPSIRIEPPKNVPSQ--EKRKMPG--VPNGNVCH 330 340 350 360 370 660 670 680 690 700 710 pF1KB3 PKSAQDKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAA .. : :. :.:::: ::::. :..:. : : ::.::::. ::::. CCDS73 IEQ----------EPHGGHSGPELQRTGRLFGGLVLDIKRKAPWYWSDYRDALSLQCLAS 380 390 400 410 420 720 730 740 750 760 770 pF1KB3 VIFIYFAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPL .:.: : .::.::::::::: :. :.. : ...... :... :...: : ..: .::. CCDS73 FLFLYCACMSPVITFGGLLGEATEGRISAIESLFGASMTGIAYSLFAGQALTILGSTGPV 430 440 450 460 470 480 780 790 800 810 820 830 pF1KB3 LVFEEAFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLI ::::. .:.::.. : :: :. ::.: .:: ...:: ..: :: ...:::.: :: :: CCDS73 LVFEKILFKFCKDYALSYLSLRACIGLWTAFLCIVLVATDASSLVCYITRFTEEAFASLI 490 500 510 520 530 540 840 850 860 870 880 pF1KB3 SLIFIYETFYKLVKIFQEHPLHGCSASNSSEV--------DGGENMT---WAGARPTLGP .:::::.. ::... . .:.: : . . .. .: : : . . CCDS73 CIIFIYEAIEKLIHLAETYPIHMHSQLDHLSLYYCRCTLPENPNNHTLQYWKDHNIVTAE 550 560 570 580 590 600 890 900 910 920 pF1KB3 ---GNRSLAG-QSGQGKPRGQ---------PNTALLSLVLMAGTFFIAFFLRKFKNSRFF .: ... : .:. :. :.. . : .:. ::... :. ::.::.: CCDS73 VHWANLTVSECQEMHGEFMGSACGHHGPYTPDVLFWSCILFFTTFILSSTLKTFKTSRYF 610 620 630 640 650 660 930 940 950 960 970 980 pF1KB3 PGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKS : :.: ...::.: ..:. ::..:. : . . ::.::: :. : . :::.:::.: CCDS73 PTRVRSMVSDFAVFLTIFTMVIIDFLI-GVPSPKLQVPSVFKPTR-DDRGWIINPIG--- 670 680 690 700 710 720 990 1000 1010 1020 1030 1040 pF1KB3 PFPVWMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICA : : : ..:...::.: :::::. :::..::..::. :.:: :.:::::... : :.:. CCDS73 PNPWWTVIAAIIPALLCTILIFMDQQITAVIINRKEHKLKKGCGYHLDLLMVAIMLGVCS 730 740 750 760 770 780 1050 1060 1070 1080 1090 1100 pF1KB3 LFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIG ..::::..:::: :.::.:.: . :. :::..::. ..:::::::.. .:.: :. . CCDS73 IMGLPWFVAATVLSITHVNSLKLESECSAPGEQPKFLGIREQRVTGLMIFVLMGCSVFMT 790 800 810 820 830 840 1110 1120 1130 1140 1150 1160 pF1KB3 DLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFT .:. ::. ::.:.::::::.::.::::..::.:. :: ::.:: :...: ..:::: CCDS73 AILKFIPMPVLYGVFLYMGVSSLQGIQFFDRLKLFGMPAKHQPDFIYLRHVPLRKVHLFT 850 860 870 880 890 900 1170 1180 1190 1200 1210 1220 pF1KB3 ALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDE .:: ::.:::.. .. :...::.... : .: : . :. ::.. :: CCDS73 LIQLTCLVLLWVIKASPAAIVFPMMVLALVFVRKV-MDLCFSKRELSWLDDLMPESKKKK 910 920 930 940 950 960 1230 1240 pF1KB3 REGVDEYNEMPMPV CCDS73 LDDAKKKAKEEEEAEKMLEIGGDKFPLESRKLLSSPGKNISCRCDPSEINISDEMPKTTV 970 980 990 1000 1010 1020 >>CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090 aa) initn: 2326 init1: 735 opt: 1705 Z-score: 1329.8 bits: 258.0 E(32554): 9.5e-68 Smith-Waterman score: 2324; 41.1% identity (70.0% similar) in 976 aa overlap (287-1217:68-1011) 260 270 280 290 300 310 pF1KB3 TDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG-REPGPTPRAR-- : ::. ... ..:::. :. :.. CCDS58 ESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQRVQFI 40 50 60 70 80 90 320 330 340 350 360 pF1KB3 -----PRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASL : ::..:.:..:: ..: .:.:::::.:::::::. .::.::.::.: CCDS58 LGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPYVATL 100 110 120 130 140 150 370 380 390 400 410 420 pF1KB3 SFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHS :..::.::: . .:.:.::. .:: .: .:...:. : :. : :: .::: .: CCDS58 SLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALLKRHH 160 170 180 190 200 210 430 440 450 460 470 480 pF1KB3 HPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGV---PET---RLEVER : ..:: :. : . :.... :..: ::::. : .:. :.. :. . CCDS58 H-QNEKRFT-SRIPLVRSFADI-GKKH-----SDPHLLE--RNGILASPQSAPGNLDNSK 220 230 240 250 260 490 500 510 520 530 pF1KB3 ERELPPPAPPAGITRSKS-----KHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRL :. . .: .: .: : ......::: .:::. :::: :.:: :: .::::: CCDS58 SGEIK--GNGSGGSRENSTVDFSKVDMNFMRKIPTGAEASNVLVGEVDFLERPIIAFVRL 270 280 290 300 310 320 540 550 560 570 580 590 pF1KB3 REAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADERED :: : .. :::::.:::::::::.. .::::::::.:::.:. ::..:: : .:.: CCDS58 APAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDRND 330 340 350 360 370 380 600 610 620 630 640 650 pF1KB3 LLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPT-GAGLEPKSAQ ::..:. ::: .::::.: . :. . . ..:. : .:. : : .. CCDS58 LLSGIDEFLDQVTVLPPGEWDP-----SIRIEPPKSVPSQEK--RKIPVFHNGSTPTLGE 390 400 410 420 430 660 670 680 690 700 710 pF1KB3 DKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIY ::: : . :.:::: ::::: :..:. : .::::.:::. ::::...:.: CCDS58 TPK-----EAAHHAGPE-LQRTGRLFGGLILDIKRKAPFFLSDFKDALSLQCLASILFLY 440 450 460 470 480 490 720 730 740 750 760 770 pF1KB3 FAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEE : .::.::::::::: :. :.. : .....: :... :...::: ..: .::.::::. CCDS58 CACMSPVITFGGLLGEATEGRISAIESLFGASLTGIAYSLFAGQPLTILGSTGPVLVFEK 500 510 520 530 540 550 780 790 800 810 820 830 pF1KB3 AFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFI ...:: . .: :: :. ::.: :: ...:: ..: :: ...:::.: :: :: .::: CCDS58 ILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDASSLVCYITRFTEEAFAALICIIFI 560 570 580 590 600 610 840 850 860 870 pF1KB3 YETFYKLVKI-----FQEH------PLHGCSASN----SSEV------DG--GENMTWAG ::.. :: . :. : ..: .. :.:. :. ..:..: . CCDS58 YEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPPNPSNETLAQWKKDNITAHNISWRN 620 630 640 650 660 670 880 890 900 910 920 930 pF1KB3 ARPTLGPGNRS--LAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFFPGRI . :. :.. :. : :.. . ..:. :::.. ::..::..:.:: .. CCDS58 LTVSECKKLRGVFLGSACGHHGPY-IPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKV 680 690 700 710 720 730 940 950 960 970 980 990 pF1KB3 RRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKSPFPV : .:.::.: ..:.::: .:: . . . :: :: : : :: :::.:.:::.. : CCDS58 RSTISDFAVFLTIVIMVTIDYLV-GVPSPKLHVPEKFEPTHPE-RGWIISPLGDN---PW 740 750 760 770 780 1000 1010 1020 1030 1040 1050 pF1KB3 WMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICALFGL : .. . .::.: :::::. :::..::..::. :.::.:.:::::.. .: :.:...:: CCDS58 WTLLIAAIPALLCTILIFMDQQITAVIINRKEHKLKKGAGYHLDLLMVGVMLGVCSVMGL 790 800 810 820 830 840 1060 1070 1080 1090 1100 1110 pF1KB3 PWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIGDLLR ::..:::: :..:.:.: : :. :::..::. ..:::::::.. .:.:::. . ..:. CCDS58 PWFVAATVLSISHVNSLKVESECSAPGEQPKFLGIREQRVTGLMIFILMGLSVFMTSVLK 850 860 870 880 890 900 1120 1130 1140 1150 1160 1170 pF1KB3 QIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFTALQL ::. ::.:.::::::.::.:::...:..:. :: ::.::. :.. : ..:.::..:: CCDS58 FIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPAKHQPDLIYLRYVPLWKVHIFTVIQL 910 920 930 940 950 960 1180 1190 1200 1210 1220 1230 pF1KB3 LCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDEREGV ::.:::.. .::...::.... : .: . . :: ::.. :: CCDS58 TCLVLLWVIKVSAAAVVFPMMVLALVFVRKL-MDLCFTKRELSWLDDLMPESKKKKEDDK 970 980 990 1000 1010 1020 1240 pF1KB3 DEYNEMPMPV CCDS58 KKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPVKALKYSPDKPVSVKISFEDEPRKKYVD 1030 1040 1050 1060 1070 1080 >>CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095 aa) initn: 2326 init1: 735 opt: 1705 Z-score: 1329.7 bits: 258.0 E(32554): 9.5e-68 Smith-Waterman score: 2324; 41.1% identity (70.0% similar) in 976 aa overlap (287-1217:73-1016) 260 270 280 290 300 310 pF1KB3 TDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG-REPGPTPRAR-- : ::. ... ..:::. :. :.. CCDS82 ESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQRVQFI 50 60 70 80 90 100 320 330 340 350 360 pF1KB3 -----PRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASL : ::..:.:..:: ..: .:.:::::.:::::::. .::.::.::.: CCDS82 LGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPYVATL 110 120 130 140 150 160 370 380 390 400 410 420 pF1KB3 SFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHS :..::.::: . .:.:.::. .:: .: .:...:. : :. : :: .::: .: CCDS82 SLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALLKRHH 170 180 190 200 210 220 430 440 450 460 470 480 pF1KB3 HPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGV---PET---RLEVER : ..:: :. : . :.... :..: ::::. : .:. :.. :. . CCDS82 H-QNEKRFT-SRIPLVRSFADI-GKKH-----SDPHLLE--RNGILASPQSAPGNLDNSK 230 240 250 260 270 490 500 510 520 530 pF1KB3 ERELPPPAPPAGITRSKS-----KHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRL :. . .: .: .: : ......::: .:::. :::: :.:: :: .::::: CCDS82 SGEIK--GNGSGGSRENSTVDFSKVDMNFMRKIPTGAEASNVLVGEVDFLERPIIAFVRL 280 290 300 310 320 330 540 550 560 570 580 590 pF1KB3 REAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADERED :: : .. :::::.:::::::::.. .::::::::.:::.:. ::..:: : .:.: CCDS82 APAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDRND 340 350 360 370 380 390 600 610 620 630 640 650 pF1KB3 LLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPT-GAGLEPKSAQ ::..:. ::: .::::.: . :. . . ..:. : .:. : : .. CCDS82 LLSGIDEFLDQVTVLPPGEWDP-----SIRIEPPKSVPSQEK--RKIPVFHNGSTPTLGE 400 410 420 430 440 660 670 680 690 700 710 pF1KB3 DKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIY ::: : . :.:::: ::::: :..:. : .::::.:::. ::::...:.: CCDS82 TPK-----EAAHHAGPE-LQRTGRLFGGLILDIKRKAPFFLSDFKDALSLQCLASILFLY 450 460 470 480 490 720 730 740 750 760 770 pF1KB3 FAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEE : .::.::::::::: :. :.. : .....: :... :...::: ..: .::.::::. CCDS82 CACMSPVITFGGLLGEATEGRISAIESLFGASLTGIAYSLFAGQPLTILGSTGPVLVFEK 500 510 520 530 540 550 780 790 800 810 820 830 pF1KB3 AFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFI ...:: . .: :: :. ::.: :: ...:: ..: :: ...:::.: :: :: .::: CCDS82 ILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDASSLVCYITRFTEEAFAALICIIFI 560 570 580 590 600 610 840 850 860 870 pF1KB3 YETFYKLVKI-----FQEH------PLHGCSASN----SSEV------DG--GENMTWAG ::.. :: . :. : ..: .. :.:. :. ..:..: . CCDS82 YEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPPNPSNETLAQWKKDNITAHNISWRN 620 630 640 650 660 670 880 890 900 910 920 930 pF1KB3 ARPTLGPGNRS--LAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFFPGRI . :. :.. :. : :.. . ..:. :::.. ::..::..:.:: .. CCDS82 LTVSECKKLRGVFLGSACGHHGPY-IPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKV 680 690 700 710 720 730 940 950 960 970 980 990 pF1KB3 RRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKSPFPV : .:.::.: ..:.::: .:: . . . :: :: : : :: :::.:.:::.. : CCDS82 RSTISDFAVFLTIVIMVTIDYLV-GVPSPKLHVPEKFEPTHPE-RGWIISPLGDN---PW 740 750 760 770 780 790 1000 1010 1020 1030 1040 1050 pF1KB3 WMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICALFGL : .. . .::.: :::::. :::..::..::. :.::.:.:::::.. .: :.:...:: CCDS82 WTLLIAAIPALLCTILIFMDQQITAVIINRKEHKLKKGAGYHLDLLMVGVMLGVCSVMGL 800 810 820 830 840 850 1060 1070 1080 1090 1100 1110 pF1KB3 PWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIGDLLR ::..:::: :..:.:.: : :. :::..::. ..:::::::.. .:.:::. . ..:. CCDS82 PWFVAATVLSISHVNSLKVESECSAPGEQPKFLGIREQRVTGLMIFILMGLSVFMTSVLK 860 870 880 890 900 910 1120 1130 1140 1150 1160 1170 pF1KB3 QIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFTALQL ::. ::.:.::::::.::.:::...:..:. :: ::.::. :.. : ..:.::..:: CCDS82 FIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPAKHQPDLIYLRYVPLWKVHIFTVIQL 920 930 940 950 960 970 1180 1190 1200 1210 1220 1230 pF1KB3 LCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDEREGV ::.:::.. .::...::.... : .: . . :: ::.. :: CCDS82 TCLVLLWVIKVSAAAVVFPMMVLALVFVRKL-MDLCFTKRELSWLDDLMPESKKKKEDDK 980 990 1000 1010 1020 1030 1240 pF1KB3 DEYNEMPMPV CCDS82 KKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPVKALKYSPDKPVSVKISFEDEPRKKYVD 1040 1050 1060 1070 1080 1090 >>CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131 aa) initn: 2326 init1: 735 opt: 1705 Z-score: 1329.5 bits: 258.0 E(32554): 9.8e-68 Smith-Waterman score: 2324; 41.1% identity (70.0% similar) in 976 aa overlap (287-1217:73-1016) 260 270 280 290 300 310 pF1KB3 TDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREG-REPGPTPRAR-- : ::. ... ..:::. :. :.. CCDS58 ESHRAVYIGVHVPFSKESRRRHRHRGHKHHHRRRKDKESDKEDGRESPSYDTPSQRVQFI 50 60 70 80 90 100 320 330 340 350 360 pF1KB3 -----PRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASL : ::..:.:..:: ..: .:.:::::.:::::::. .::.::.::.: CCDS58 LGTEDDDEEHIPHDLFTEMDELCYRDGEEYEWKETARWLKFEEDVEDGGDRWSKPYVATL 110 120 130 140 150 160 370 380 390 400 410 420 pF1KB3 SFRSLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHS :..::.::: . .:.:.::. .:: .: .:...:. : :. : :: .::: .: CCDS58 SLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDNMIASGQLDESIRENVREALLKRHH 170 180 190 200 210 220 430 440 450 460 470 480 pF1KB3 HPSDEKDFSFPRNISAGSLGSLLGHHHGQGAESDPHVTEPLMGGV---PET---RLEVER : ..:: :. : . :.... :..: ::::. : .:. :.. :. . CCDS58 H-QNEKRFT-SRIPLVRSFADI-GKKH-----SDPHLLE--RNGILASPQSAPGNLDNSK 230 240 250 260 270 490 500 510 520 530 pF1KB3 ERELPPPAPPAGITRSKS-----KHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRL :. . .: .: .: : ......::: .:::. :::: :.:: :: .::::: CCDS58 SGEIK--GNGSGGSRENSTVDFSKVDMNFMRKIPTGAEASNVLVGEVDFLERPIIAFVRL 280 290 300 310 320 330 540 550 560 570 580 590 pF1KB3 REAVELDAVLEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADERED :: : .. :::::.:::::::::.. .::::::::.:::.:. ::..:: : .:.: CCDS58 APAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIGRSIATLMTDEIFHDVAYKAKDRND 340 350 360 370 380 390 600 610 620 630 640 650 pF1KB3 LLTAINAFLDCSVVLPPSEVQGEELLRSVAHFQRQMLKKREEQGRLLPT-GAGLEPKSAQ ::..:. ::: .::::.: . :. . . ..:. : .:. : : .. CCDS58 LLSGIDEFLDQVTVLPPGEWDP-----SIRIEPPKSVPSQEK--RKIPVFHNGSTPTLGE 400 410 420 430 440 660 670 680 690 700 710 pF1KB3 DKALLQMVEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIY ::: : . :.:::: ::::: :..:. : .::::.:::. ::::...:.: CCDS58 TPK-----EAAHHAGPE-LQRTGRLFGGLILDIKRKAPFFLSDFKDALSLQCLASILFLY 450 460 470 480 490 720 730 740 750 760 770 pF1KB3 FAALSPAITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEE : .::.::::::::: :. :.. : .....: :... :...::: ..: .::.::::. CCDS58 CACMSPVITFGGLLGEATEGRISAIESLFGASLTGIAYSLFAGQPLTILGSTGPVLVFEK 500 510 520 530 540 550 780 790 800 810 820 830 pF1KB3 AFFSFCSSNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFI ...:: . .: :: :. ::.: :: ...:: ..: :: ...:::.: :: :: .::: CCDS58 ILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDASSLVCYITRFTEEAFAALICIIFI 560 570 580 590 600 610 840 850 860 870 pF1KB3 YETFYKLVKI-----FQEH------PLHGCSASN----SSEV------DG--GENMTWAG ::.. :: . :. : ..: .. :.:. :. ..:..: . CCDS58 YEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPPNPSNETLAQWKKDNITAHNISWRN 620 630 640 650 660 670 880 890 900 910 920 930 pF1KB3 ARPTLGPGNRS--LAGQSGQGKPRGQPNTALLSLVLMAGTFFIAFFLRKFKNSRFFPGRI . :. :.. :. : :.. . ..:. :::.. ::..::..:.:: .. CCDS58 LTVSECKKLRGVFLGSACGHHGPY-IPDVLFWCVILFFTTFFLSSFLKQFKTKRYFPTKV 680 690 700 710 720 730 940 950 960 970 980 990 pF1KB3 RRVIGDFGVPIAILIMVLVDYSIEDTYTQKLSVPSGFSVTAPEKRGWVINPLGEKSPFPV : .:.::.: ..:.::: .:: . . . :: :: : : :: :::.:.:::.. : CCDS58 RSTISDFAVFLTIVIMVTIDYLV-GVPSPKLHVPEKFEPTHPE-RGWIISPLGDN---PW 740 750 760 770 780 790 1000 1010 1020 1030 1040 1050 pF1KB3 WMMVASLLPAILVFILIFMETQITTLIISKKERMLQKGSGFHLDLLLIVAMGGICALFGL : .. . .::.: :::::. :::..::..::. :.::.:.:::::.. .: :.:...:: CCDS58 WTLLIAAIPALLCTILIFMDQQITAVIINRKEHKLKKGAGYHLDLLMVGVMLGVCSVMGL 800 810 820 830 840 850 1060 1070 1080 1090 1100 1110 pF1KB3 PWLAAATVRSVTHANALTVMSKAVAPGDKPKIQEVKEQRVTGLLVALLVGLSIVIGDLLR ::..:::: :..:.:.: : :. :::..::. ..:::::::.. .:.:::. . ..:. CCDS58 PWFVAATVLSISHVNSLKVESECSAPGEQPKFLGIREQRVTGLMIFILMGLSVFMTSVLK 860 870 880 890 900 910 1120 1130 1140 1150 1160 1170 pF1KB3 QIPLAVLFGIFLYMGVTSLNGIQFYERLHLLLMPPKHHPDVTYVKKVRTLRMHLFTALQL ::. ::.:.::::::.::.:::...:..:. :: ::.::. :.. : ..:.::..:: CCDS58 FIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPAKHQPDLIYLRYVPLWKVHIFTVIQL 920 930 940 950 960 970 1180 1190 1200 1210 1220 1230 pF1KB3 LCLALLWAVMSTAASLAFPFILILTVPLRMVVLTRIFTDREMKCLDANEAEPVFDEREGV ::.:::.. .::...::.... : .: . . :: ::.. :: CCDS58 TCLVLLWVIKVSAAAVVFPMMVLALVFVRKL-MDLCFTKRELSWLDDLMPESKKKKEDDK 980 990 1000 1010 1020 1030 1240 pF1KB3 DEYNEMPMPV CCDS58 KKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPVKALKYSVDPSIVNISDEMAKTAQWKAL 1040 1050 1060 1070 1080 1090 1241 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:04:04 2016 done: Thu Nov 3 14:04:05 2016 Total Scan time: 4.730 Total Display time: 0.550 Function used was FASTA [36.3.4 Apr, 2011]