FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3864, 1142 aa 1>>>pF1KB3864 1142 - 1142 aa - 1142 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.8521+/-0.000948; mu= 2.2034+/- 0.057 mean_var=262.8834+/-53.480, 0's: 0 Z-trim(114.4): 45 B-trim: 184 in 1/51 Lambda= 0.079103 statistics sampled from 14905 (14946) to 14905 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.768), E-opt: 0.2 (0.459), width: 16 Scan time: 4.800 The best scores are: opt bits E(32554) CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232) 5382 628.3 3.3e-179 CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259) 5382 628.3 3.3e-179 CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227) 3445 407.3 1.1e-112 CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232) 3445 407.3 1.1e-112 CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241) 3445 407.3 1.2e-112 CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 ( 911) 1539 189.7 2.7e-47 CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 945) 1107 140.4 1.9e-32 CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090) 1012 129.6 4e-29 CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095) 1012 129.6 4e-29 CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131) 1012 129.6 4.1e-29 CCDS82751.1 SLC4A7 gene_id:9497|Hs108|chr3 (1206) 1012 129.6 4.3e-29 CCDS82748.1 SLC4A7 gene_id:9497|Hs108|chr3 (1210) 1012 129.6 4.3e-29 CCDS33721.1 SLC4A7 gene_id:9497|Hs108|chr3 (1214) 1012 129.6 4.3e-29 CCDS82749.1 SLC4A7 gene_id:9497|Hs108|chr3 (1246) 1012 129.6 4.4e-29 CCDS82747.1 SLC4A7 gene_id:9497|Hs108|chr3 (1259) 1012 129.6 4.5e-29 CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035) 985 126.5 3.2e-28 CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079) 985 126.5 3.3e-28 CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094) 985 126.5 3.4e-28 CCDS46438.1 SLC4A10 gene_id:57282|Hs108|chr2 (1088) 977 125.6 6.3e-28 CCDS54412.1 SLC4A10 gene_id:57282|Hs108|chr2 (1099) 977 125.6 6.4e-28 CCDS54411.1 SLC4A10 gene_id:57282|Hs108|chr2 (1118) 977 125.6 6.5e-28 CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040) 961 123.7 2.2e-27 CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093) 961 123.8 2.3e-27 CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121) 952 122.7 4.7e-27 CCDS47278.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 959) 897 116.4 3.2e-25 CCDS58973.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 983) 897 116.4 3.3e-25 CCDS58974.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 896) 797 105.0 8.3e-22 CCDS54446.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 875) 644 87.5 1.5e-16 CCDS13052.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 891) 644 87.5 1.5e-16 CCDS54445.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 918) 644 87.5 1.5e-16 CCDS58233.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 638) 575 79.5 2.7e-14 CCDS58232.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 747) 575 79.6 3.1e-14 CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137) 562 78.2 1.2e-13 >>CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232 aa) initn: 6772 init1: 5380 opt: 5382 Z-score: 3330.9 bits: 628.3 E(32554): 3.3e-179 Smith-Waterman score: 6727; 87.8% identity (87.8% similar) in 1201 aa overlap (59-1142:59-1232) 30 40 50 60 70 80 pF1KB3 PDVEEEDDDLGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSAR :::::::::::::::::::::::::::::: CCDS24 PDVEEEDDDLGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSAR 30 40 50 60 70 80 90 100 110 120 130 140 pF1KB3 LPPPHKLRRLPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 LPPPHKLRRLPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGES 90 100 110 120 130 140 150 160 170 180 190 200 pF1KB3 EAEPVEPPPSGTPQKAKFSIGSDEDDSPGLPGRAAVTKPLPSVGPHTDKSPQHSSRPCSE :::::::: :::::::::::::::::::::::::::::::::::::::::::::: CCDS24 EAEPVEPPHSGTPQKAKFSIGSDEDDSPGLPGRAAVTKPLPSVGPHTDKSPQHSS----- 150 160 170 180 190 200 210 220 230 240 250 260 pF1KB3 LRDGDGTTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSAL :::::::::::::::::::::::::::::::::::::: CCDS24 ----------------------SSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSAL 210 220 230 240 270 280 290 300 310 320 pF1KB3 GNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSRTQGGRGSPS-- :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 GNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSRTQGGRGSPSGL 250 260 270 280 290 300 pF1KB3 ------------------------------------------------------------ CCDS24 APILRRKKKKKKLDRRPHEVFVELNELMLDRSQEPHWRETARWIKFEEDVEEETERWGKP 310 320 330 340 350 360 330 pF1KB3 -------------------------------------------------------VLRTL ::::: CCDS24 HVASLSFRSLLELRRTIAHGAALLDLEQTTLPGIAHLVVETMIVSDQIRPEDRASVLRTL 370 380 390 400 410 420 340 350 360 370 380 390 pF1KB3 LLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 LLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPH 430 440 450 460 470 480 400 410 420 430 440 450 pF1KB3 DPDAKEKPLHMPGGDGHRGKSLKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 DPDAKEKPLHMPGGDGHRGKSLKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVL 490 500 510 520 530 540 460 470 480 490 500 510 pF1KB3 LESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 LESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAI 550 560 570 580 590 600 520 530 540 550 560 570 pF1KB3 SEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTAPGKELSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 SEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTAPGKELSL 610 620 630 640 650 660 580 590 600 610 620 630 pF1KB3 ELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 ELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALS 670 680 690 700 710 720 640 650 660 670 680 690 pF1KB3 PAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 PAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKF 730 740 750 760 770 780 700 710 720 730 740 750 pF1KB3 CRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 CRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFY 790 800 810 820 830 840 760 770 780 790 800 810 pF1KB3 KLYKVFTEHPLLPFYPPEGALEGSLAAGLEPNGSALPPTEGPPSPRNQPNTALLSLILML ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS24 KLYKVFTEHPLLPFYPPEGALEGSLDAGLEPNGSALPPTEGPPSPRNQPNTALLSLILML 850 860 870 880 890 900 820 830 840 850 860 870 pF1KB3 GTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 GTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLS 910 920 930 940 950 960 880 890 900 910 920 930 pF1KB3 VTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 VTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKG 970 980 990 1000 1010 1020 940 950 960 970 980 990 pF1KB3 SGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 SGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQ 1030 1040 1050 1060 1070 1080 1000 1010 1020 1030 1040 1050 pF1KB3 RVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 RVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHH 1090 1100 1110 1120 1130 1140 1060 1070 1080 1090 1100 1110 pF1KB3 PEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 PEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQ 1150 1160 1170 1180 1190 1200 1120 1130 1140 pF1KB3 DRELQALDSEDAEPNFDEDGQDEYNELHMPV ::::::::::::::::::::::::::::::: CCDS24 DRELQALDSEDAEPNFDEDGQDEYNELHMPV 1210 1220 1230 >>CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259 aa) initn: 5380 init1: 5380 opt: 5382 Z-score: 3330.8 bits: 628.3 E(32554): 3.3e-179 Smith-Waterman score: 6785; 89.9% identity (89.9% similar) in 1174 aa overlap (86-1142:86-1259) 60 70 80 90 100 110 pF1KB3 AWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKT :::::::::::::::::::::::::::::: CCDS24 AWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKT 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 SAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPPSGTPQKAKFSIGSDEDDS ::::::::::::::::::::::::::::::::::::::::: :::::::::::::::::: CCDS24 SAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPHSGTPQKAKFSIGSDEDDS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 PGLPGRAAVTKPLPSVGPHTDKSPQHSSRPCSELRDGDGTTDLALSSPRLLCCLPSSPSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 PGLPGRAAVTKPLPSVGPHTDKSPQHSSRPCSELRDGDGTTDLALSSPRLLCCLPSSPSP 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 RARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 RARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDD 240 250 260 270 280 290 300 310 320 pF1KB3 MKSHRLEDNPGVRRHLVKKPSRTQGGRGSPS----------------------------- ::::::::::::::::::::::::::::::: CCDS24 MKSHRLEDNPGVRRHLVKKPSRTQGGRGSPSGLAPILRRKKKKKKLDRRPHEVFVELNEL 300 310 320 330 340 350 pF1KB3 ------------------------------------------------------------ CCDS24 MLDRSQEPHWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTIAHGAALLDLE 360 370 380 390 400 410 330 340 350 pF1KB3 ----------------------------VLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNS :::::::::::::::::::::::::::::::: CCDS24 QTTLPGIAHLVVETMIVSDQIRPEDRASVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNS 420 430 440 450 460 470 360 370 380 390 400 410 pF1KB3 VLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKSLKLLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 VLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKSLKLLEK 480 490 500 510 520 530 420 430 440 450 460 470 pF1KB3 IPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 IPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDY 540 550 560 570 580 590 480 490 500 510 520 530 pF1KB3 HELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 HELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAF 600 610 620 630 640 650 540 550 560 570 580 590 pF1KB3 QRELLRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 QRELLRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRD 660 670 680 690 700 710 600 610 620 630 640 650 pF1KB3 VRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 VRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTA 720 730 740 750 760 770 660 670 680 690 700 710 pF1KB3 VLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 VLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALV 780 790 800 810 820 830 720 730 740 750 760 770 pF1KB3 AAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPPEGALEGSLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: : CCDS24 AAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPPEGALEGSLDA 840 850 860 870 880 890 780 790 800 810 820 830 pF1KB3 GLEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFLRKFRNSRFLGGKARRIIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 GLEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFLRKFRNSRFLGGKARRIIG 900 910 920 930 940 950 840 850 860 870 880 890 pF1KB3 DFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 DFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVA 960 970 980 990 1000 1010 900 910 920 930 940 950 pF1KB3 AAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 AAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTA 1020 1030 1040 1050 1060 1070 960 970 980 990 1000 1010 pF1KB3 ATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMGAVLRRIPLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 ATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMGAVLRRIPLA 1080 1090 1100 1110 1120 1130 1020 1030 1040 1050 1060 1070 pF1KB3 VLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 VLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIAL 1140 1150 1160 1170 1180 1190 1080 1090 1100 1110 1120 1130 pF1KB3 LWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDSEDAEPNFDEDGQDEYNEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 LWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDSEDAEPNFDEDGQDEYNEL 1200 1210 1220 1230 1240 1250 1140 pF1KB3 HMPV :::: CCDS24 HMPV >-- initn: 610 init1: 610 opt: 610 Z-score: 387.6 bits: 83.7 E(32554): 2.9e-15 Smith-Waterman score: 610; 100.0% identity (100.0% similar) in 85 aa overlap (1-85:1-85) 10 20 30 40 50 60 pF1KB3 MANGVIPPPGGASPLPQVRVPLEEPPLSPDVEEEDDDLGKTLAVSRFGDLISKPPAWDPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 MANGVIPPPGGASPLPQVRVPLEEPPLSPDVEEEDDDLGKTLAVSRFGDLISKPPAWDPE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 KPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSAPPS ::::::::::::::::::::::::: CCDS24 KPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSAPPS 70 80 90 100 110 120 >>CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227 aa) initn: 3774 init1: 1663 opt: 3445 Z-score: 2136.2 bits: 407.3 E(32554): 1.1e-112 Smith-Waterman score: 3708; 53.6% identity (70.8% similar) in 1208 aa overlap (68-1142:54-1227) 40 50 60 70 80 90 pF1KB3 LGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRR :.:::.::..::: :::::..::: . :. CCDS56 LHRTLGVERFEEILQEAGSRGGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRK 30 40 50 60 70 80 100 110 120 130 140 150 pF1KB3 LPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPP : .:. ::. .: :. :: : ::: ::.:.: :.:. ..: : CCDS56 TPQGPGRKPRRR-----PGASPTGETPTI-EEG------EEDEDEASEAEGARALTQPSP 90 100 110 120 130 160 170 180 190 200 210 pF1KB3 SGTPQKAKFSIGSDEDDSPGLPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDG .::....: . .:::: . :.. ..: : :: . .:. : .. ........ CCDS56 VSTPSSVQFFL--QEDDSADRKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEA 140 150 160 170 180 220 230 240 250 260 270 pF1KB3 TTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGP . .:..: .. . . :: :..: ::.:.:: :: : . CCDS56 EA-VAVASG-------TAGGDDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQAL 190 200 210 220 230 280 290 300 310 320 pF1KB3 EQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSR--TQGGR---------- .::::: ::: :..:::: :::::.:: ::::::::.: .. ::.:: CCDS56 LPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTPR 240 250 260 270 280 290 pF1KB3 -------------------------------------------------GSP-------- :.: CCDS56 ARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFR 300 310 320 330 340 350 330 pF1KB3 ----------------------------------------------SVLRTLLLKHSHPN .:::.::::::::. CCDS56 SLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPS 360 370 380 390 400 410 340 350 360 370 380 390 pF1KB3 DDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEK :.:: .: ::: :..:..:.::.:: ... : . : :. : : . . .: CCDS56 DEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-REL 420 430 440 450 460 470 400 410 420 430 440 450 pF1KB3 PLHMPGGDGHRGKS---LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESV : : . :.:: :::::::::.::::::::::: :: .:. ::::: ::: :..: CCDS56 PPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAV 480 490 500 510 520 530 460 470 480 490 500 510 pF1KB3 LEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFL :::::::::::..:::: .. ::::.::::.:::::: :::::: ::.:.:::.::. :: CCDS56 LEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFL 540 550 560 570 580 590 520 530 540 550 560 570 pF1KB3 DGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLEL : :.:.:::::.:..:::::: :::..:.::.: : .. : : .: : : :.. CCDS56 DCSVVLPPSEVQGEELLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQM 600 610 620 630 640 580 590 600 610 620 630 pF1KB3 GGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPA . .. ::::: ::: ::::.:::::::::: ::.:::: ::.:::.:::::::::: CCDS56 VEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPA 650 660 670 680 690 700 640 650 660 670 680 690 pF1KB3 ITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCR :::::::::::. :.::::::.:::. ::.: :::::::::.::::::::::::::.:: CCDS56 ITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCS 710 720 730 740 750 760 700 710 720 730 740 750 pF1KB3 AQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKL .. ::::.::::.:.::: ..: .:: :::::::..: :::::::::::::::::::::: CCDS56 SNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKL 770 780 790 800 810 820 760 770 780 790 800 pF1KB3 YKVFTEHPLLPFYPPEGA-LEGSLA---AG----LEPNGSALPPTEGPPSPRNQPNTALL :.: :::: ... ..:. :: : :.. .: : .::.::::::: CCDS56 VKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALL 830 840 850 860 870 880 810 820 830 840 850 860 pF1KB3 SLILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLT ::.:: ::::::::::::.::::. :. ::.:::::.::.::.:::::::: :::::::. CCDS56 SLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLS 890 900 910 920 930 940 870 880 890 900 910 920 pF1KB3 VPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKA ::.:.:::.:.::.: : ::: ::: :::::. .::.::.::::::::::.::.:.: CCDS56 VPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKE 950 960 970 980 990 1000 930 940 950 960 970 980 pF1KB3 RRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQI : : :::::::::::: ..::.:.:::::::.:::::::::.:::::: :.::::::.: CCDS56 RMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKI 1010 1020 1030 1040 1050 1060 990 1000 1010 1020 1030 1040 pF1KB3 QEVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLIL :::.::::::.:.: :::::::.: .::.::::::::::::::::::.:::. .:: :.: CCDS56 QEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLL 1070 1080 1090 1100 1110 1120 1050 1060 1070 1080 1090 1100 pF1KB3 MPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCL :: ::::. :: ::.: :::::: .:: :.::::.: ::::::::::.:.:::::: . CCDS56 MPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVV 1130 1140 1150 1160 1170 1180 1110 1120 1130 1140 pF1KB3 LPRLFQDRELQALDSEDAEPNFDE-DGQDEYNELHMPV : :.: :::.. ::...::: ::: .: :::::. ::: CCDS56 LTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV 1190 1200 1210 1220 >>CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232 aa) initn: 3774 init1: 1663 opt: 3445 Z-score: 2136.2 bits: 407.3 E(32554): 1.1e-112 Smith-Waterman score: 3708; 53.6% identity (70.8% similar) in 1208 aa overlap (68-1142:59-1232) 40 50 60 70 80 90 pF1KB3 LGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRR :.:::.::..::: :::::..::: . :. CCDS56 LHRTLGVERFEEILQEAGSRGGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRK 30 40 50 60 70 80 100 110 120 130 140 150 pF1KB3 LPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPP : .:. ::. .: :. :: : ::: ::.:.: :.:. ..: : CCDS56 TPQGPGRKPRRR-----PGASPTGETPTI-EEG------EEDEDEASEAEGARALTQPSP 90 100 110 120 130 160 170 180 190 200 210 pF1KB3 SGTPQKAKFSIGSDEDDSPGLPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDG .::....: . .:::: . :.. ..: : :: . .:. : .. ........ CCDS56 VSTPSSVQFFL--QEDDSADRKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEA 140 150 160 170 180 190 220 230 240 250 260 270 pF1KB3 TTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGP . .:..: .. . . :: :..: ::.:.:: :: : . CCDS56 EA-VAVASG-------TAGGDDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQAL 200 210 220 230 240 280 290 300 310 320 pF1KB3 EQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSR--TQGGR---------- .::::: ::: :..:::: :::::.:: ::::::::.: .. ::.:: CCDS56 LPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTPR 250 260 270 280 290 300 pF1KB3 -------------------------------------------------GSP-------- :.: CCDS56 ARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFR 310 320 330 340 350 360 330 pF1KB3 ----------------------------------------------SVLRTLLLKHSHPN .:::.::::::::. CCDS56 SLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPS 370 380 390 400 410 420 340 350 360 370 380 390 pF1KB3 DDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEK :.:: .: ::: :..:..:.::.:: ... : . : :. : : . . .: CCDS56 DEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-REL 430 440 450 460 470 400 410 420 430 440 450 pF1KB3 PLHMPGGDGHRGKS---LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESV : : . :.:: :::::::::.::::::::::: :: .:. ::::: ::: :..: CCDS56 PPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAV 480 490 500 510 520 530 460 470 480 490 500 510 pF1KB3 LEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFL :::::::::::..:::: .. ::::.::::.:::::: :::::: ::.:.:::.::. :: CCDS56 LEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFL 540 550 560 570 580 590 520 530 540 550 560 570 pF1KB3 DGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLEL : :.:.:::::.:..:::::: :::..:.::.: : .. : : .: : : :.. CCDS56 DCSVVLPPSEVQGEELLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQM 600 610 620 630 640 650 580 590 600 610 620 630 pF1KB3 GGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPA . .. ::::: ::: ::::.:::::::::: ::.:::: ::.:::.:::::::::: CCDS56 VEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPA 660 670 680 690 700 710 640 650 660 670 680 690 pF1KB3 ITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCR :::::::::::. :.::::::.:::. ::.: :::::::::.::::::::::::::.:: CCDS56 ITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCS 720 730 740 750 760 770 700 710 720 730 740 750 pF1KB3 AQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKL .. ::::.::::.:.::: ..: .:: :::::::..: :::::::::::::::::::::: CCDS56 SNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKL 780 790 800 810 820 830 760 770 780 790 800 pF1KB3 YKVFTEHPLLPFYPPEGA-LEGSLA---AG----LEPNGSALPPTEGPPSPRNQPNTALL :.: :::: ... ..:. :: : :.. .: : .::.::::::: CCDS56 VKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALL 840 850 860 870 880 890 810 820 830 840 850 860 pF1KB3 SLILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLT ::.:: ::::::::::::.::::. :. ::.:::::.::.::.:::::::: :::::::. CCDS56 SLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLS 900 910 920 930 940 950 870 880 890 900 910 920 pF1KB3 VPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKA ::.:.:::.:.::.: : ::: ::: :::::. .::.::.::::::::::.::.:.: CCDS56 VPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKE 960 970 980 990 1000 1010 930 940 950 960 970 980 pF1KB3 RRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQI : : :::::::::::: ..::.:.:::::::.:::::::::.:::::: :.::::::.: CCDS56 RMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKI 1020 1030 1040 1050 1060 1070 990 1000 1010 1020 1030 1040 pF1KB3 QEVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLIL :::.::::::.:.: :::::::.: .::.::::::::::::::::::.:::. .:: :.: CCDS56 QEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLL 1080 1090 1100 1110 1120 1130 1050 1060 1070 1080 1090 1100 pF1KB3 MPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCL :: ::::. :: ::.: :::::: .:: :.::::.: ::::::::::.:.:::::: . CCDS56 MPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVV 1140 1150 1160 1170 1180 1190 1110 1120 1130 1140 pF1KB3 LPRLFQDRELQALDSEDAEPNFDE-DGQDEYNELHMPV : :.: :::.. ::...::: ::: .: :::::. ::: CCDS56 LTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV 1200 1210 1220 1230 >>CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241 aa) initn: 3774 init1: 1663 opt: 3445 Z-score: 2136.2 bits: 407.3 E(32554): 1.2e-112 Smith-Waterman score: 3708; 53.6% identity (70.8% similar) in 1208 aa overlap (68-1142:68-1241) 40 50 60 70 80 90 pF1KB3 LGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRR :.:::.::..::: :::::..::: . :. CCDS59 LHRTLGVERFEEILQEAGSRGGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRK 40 50 60 70 80 90 100 110 120 130 140 150 pF1KB3 LPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPP : .:. ::. .: :. :: : ::: ::.:.: :.:. ..: : CCDS59 TPQGPGRKPRRR-----PGASPTGETPTI-EEG------EEDEDEASEAEGARALTQPSP 100 110 120 130 140 160 170 180 190 200 210 pF1KB3 SGTPQKAKFSIGSDEDDSPGLPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDG .::....: . .:::: . :.. ..: : :: . .:. : .. ........ CCDS59 VSTPSSVQFFL--QEDDSADRKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEA 150 160 170 180 190 200 220 230 240 250 260 270 pF1KB3 TTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGP . .:..: .. . . :: :..: ::.:.:: :: : . CCDS59 EA-VAVASG-------TAGGDDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQAL 210 220 230 240 250 280 290 300 310 320 pF1KB3 EQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSR--TQGGR---------- .::::: ::: :..:::: :::::.:: ::::::::.: .. ::.:: CCDS59 LPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTPR 260 270 280 290 300 310 pF1KB3 -------------------------------------------------GSP-------- :.: CCDS59 ARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFR 320 330 340 350 360 370 330 pF1KB3 ----------------------------------------------SVLRTLLLKHSHPN .:::.::::::::. CCDS59 SLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPS 380 390 400 410 420 430 340 350 360 370 380 390 pF1KB3 DDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEK :.:: .: ::: :..:..:.::.:: ... : . : :. : : . . .: CCDS59 DEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-REL 440 450 460 470 480 400 410 420 430 440 450 pF1KB3 PLHMPGGDGHRGKS---LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESV : : . :.:: :::::::::.::::::::::: :: .:. ::::: ::: :..: CCDS59 PPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAV 490 500 510 520 530 540 460 470 480 490 500 510 pF1KB3 LEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFL :::::::::::..:::: .. ::::.::::.:::::: :::::: ::.:.:::.::. :: CCDS59 LEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFL 550 560 570 580 590 600 520 530 540 550 560 570 pF1KB3 DGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLEL : :.:.:::::.:..:::::: :::..:.::.: : .. : : .: : : :.. CCDS59 DCSVVLPPSEVQGEELLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQM 610 620 630 640 650 660 580 590 600 610 620 630 pF1KB3 GGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPA . .. ::::: ::: ::::.:::::::::: ::.:::: ::.:::.:::::::::: CCDS59 VEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPA 670 680 690 700 710 720 640 650 660 670 680 690 pF1KB3 ITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCR :::::::::::. :.::::::.:::. ::.: :::::::::.::::::::::::::.:: CCDS59 ITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCS 730 740 750 760 770 780 700 710 720 730 740 750 pF1KB3 AQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKL .. ::::.::::.:.::: ..: .:: :::::::..: :::::::::::::::::::::: CCDS59 SNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKL 790 800 810 820 830 840 760 770 780 790 800 pF1KB3 YKVFTEHPLLPFYPPEGA-LEGSLA---AG----LEPNGSALPPTEGPPSPRNQPNTALL :.: :::: ... ..:. :: : :.. .: : .::.::::::: CCDS59 VKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALL 850 860 870 880 890 900 810 820 830 840 850 860 pF1KB3 SLILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLT ::.:: ::::::::::::.::::. :. ::.:::::.::.::.:::::::: :::::::. CCDS59 SLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLS 910 920 930 940 950 960 870 880 890 900 910 920 pF1KB3 VPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKA ::.:.:::.:.::.: : ::: ::: :::::. .::.::.::::::::::.::.:.: CCDS59 VPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKE 970 980 990 1000 1010 1020 930 940 950 960 970 980 pF1KB3 RRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQI : : :::::::::::: ..::.:.:::::::.:::::::::.:::::: :.::::::.: CCDS59 RMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKI 1030 1040 1050 1060 1070 1080 990 1000 1010 1020 1030 1040 pF1KB3 QEVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLIL :::.::::::.:.: :::::::.: .::.::::::::::::::::::.:::. .:: :.: CCDS59 QEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLL 1090 1100 1110 1120 1130 1140 1050 1060 1070 1080 1090 1100 pF1KB3 MPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCL :: ::::. :: ::.: :::::: .:: :.::::.: ::::::::::.:.:::::: . CCDS59 MPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVV 1150 1160 1170 1180 1190 1200 1110 1120 1130 1140 pF1KB3 LPRLFQDRELQALDSEDAEPNFDE-DGQDEYNELHMPV : :.: :::.. ::...::: ::: .: :::::. ::: CCDS59 LTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV 1210 1220 1230 1240 >>CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 (911 aa) initn: 2718 init1: 1483 opt: 1539 Z-score: 962.5 bits: 189.7 E(32554): 2.7e-47 Smith-Waterman score: 2875; 58.1% identity (79.0% similar) in 787 aa overlap (359-1142:158-911) 330 340 350 360 370 380 pF1KB3 RTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHGPDGAVPTMADDLGEPA-P .: . : .. :. :.. :.:. : CCDS11 LAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRSGDPSQP 130 140 150 160 170 180 390 400 410 420 430 440 pF1KB3 LWPHDPDAKEKPLHMPGGDGHRGKSLK-LLEKIPEDAEATVVLVGCVPFLEQPAAAFVRL : :. . . . . : : .:.: . .::::: :.:::.:::: . :::::. .:::: CCDS11 LLPQHSSLETQLFCEQGDGGTEGHSPSGILEKIPPDSEATLVLVGRADFLEQPVLGFVRL 190 200 210 220 230 240 450 460 470 480 490 500 pF1KB3 NEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQD .::. ::.: :.:::.:::::.::: :: .:::. :::::...:. ::.:..: . CCDS11 QEAAELEAV-ELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMSERVFRIDAYMAQSRGE 250 260 270 280 290 300 510 520 530 540 550 560 pF1KB3 LLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTAPG :: .. ::: :.:.::... ... : :.. ::::::.: . .: . . : CCDS11 LLHSLEGFLDCSLVLPPTDAPSEQALLSLVPVQRELLRRRYQSSPAKPDSSFYKG----- 310 320 330 340 350 360 570 580 590 600 610 620 pF1KB3 KELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIY :.:.:. : :::: .::..:::::::.:::::.: ::. ::. : .:::.::: CCDS11 ----LDLNGG---P-DDPLQQTGQLFGGLVRDIRRRYPYYLSDITDAFSPQVLAAVIFIY 370 380 390 400 410 630 640 650 660 670 680 pF1KB3 FAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEE ::::::::::::::::::.. ::::::..:::: :.::.::::::::::::::::::::: CCDS11 FAALSPAITFGGLLGEKTRNQMGVSELLISTAVQGILFALLGAQPLLVVGFSGPLLVFEE 420 430 440 450 460 470 690 700 710 720 730 740 pF1KB3 AFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFI :::.::... :::..::::.:.::...:. .:: :::::::.:: .:::::.:::::::: CCDS11 AFFSFCETNGLEYIVGRVWIGFWLILLVVLVVAFEGSFLVRFISRYTQEIFSFLISLIFI 480 490 500 510 520 530 750 760 770 780 790 800 pF1KB3 YETFYKLYKVFTEHPLLPFYPPEGALEGSLAAGLEPNGSALPPTEGPPSPRNQPNTALLS :::: :: :.: .::: : . : .: .:: ::::::: CCDS11 YETFSKLIKIFQDHPLQKTY--------------NYNVLMVPKPQGP-----LPNTALLS 540 550 560 570 810 820 830 840 850 860 pF1KB3 LILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTV :.:: ::::.:..::::.:: .. :: ::.:::::.:::::.:::::. : :::::::.: CCDS11 LVLMAGTFFFAMMLRKFKNSSYFPGKLRRVIGDFGVPISILIMVLVDFFIQDTYTQKLSV 580 590 600 610 620 630 870 880 890 900 910 920 pF1KB3 PTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKAR : :..:.. . :.: : ::: :: ::: :.:.:::::.::::.:.:::.::::. : CCDS11 PDGFKVSNSSARGWVIHPLGLRSEFPIWMMFASALPALLVFILIFLESQITTLIVSKPER 640 650 660 670 680 690 930 940 950 960 970 980 pF1KB3 RLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQ ...:::::::::::. ..::. .:::.:::.:.:::::::.:::::: : .:: ::: CCDS11 KMVKGSGFHLDLLLVVGMGGVAALFGMPWLSATTVRSVTHANALTVMGKASTPGAAAQIQ 700 710 720 730 740 750 990 1000 1010 1020 1030 1040 pF1KB3 EVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILM ::.:::..:.:.: ::::::.: .: :::::::::::::::::::::::: .:.::.. CCDS11 EVKEQRISGLLVAVLVGLSILMEPILSRIPLAVLFGIFLYMGVTSLSGIQLFDRILLLFK 760 770 780 790 800 810 1050 1060 1070 1080 1090 1100 pF1KB3 PAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLL : :.::. ::: .:::::::::: ::. :.:.::::::: ::::.::.:.::::::. :: CCDS11 PPKYHPDVPYVKRVKTWRMHLFTGIQIICLAVLWVVKSTPASLALPFVLILTVPLRRVLL 820 830 840 850 860 870 1110 1120 1130 1140 pF1KB3 PRLFQDRELQALDSEDAEPNFDED-GQDEYNELHMPV : .:.. ::: ::..::. .:::. :.:::.:. ::: CCDS11 PLIFRNVELQCLDADDAKATFDEEEGRDEYDEVAMPV 880 890 900 910 >>CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 (945 aa) initn: 1605 init1: 696 opt: 1107 Z-score: 695.8 bits: 140.4 E(32554): 1.9e-32 Smith-Waterman score: 1667; 41.0% identity (67.1% similar) in 748 aa overlap (415-1131:192-914) 390 400 410 420 430 440 pF1KB3 PAPLWPHDPDAKEKPLHMPGGDGHRGKSLKLLEKIPEDAEATVVLVGCVPFLEQPAAAFV : .:.: ::: .::.: . :: :: .::: CCDS58 TGTRPCWGSTHPRKASDNEEAPLREQCQNPLRQKLPPGAEAGTVLAGELGFLAQPLGAFV 170 180 190 200 210 220 450 460 470 480 490 500 pF1KB3 RLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDR :: . :.: :. :: .: ::. ..::: . :::.::. :.:.:: :. .. .:.. CCDS58 RLRNPVVLGSLTEVSLPSRFFCLLLGPCMLGKGYHEMGRAAAVLLSDPQFQWSVRRASNL 230 240 250 260 270 280 510 520 530 540 550 560 pF1KB3 QDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTA .:::.:.. ::. :.::.. . . . . .:: .: ... . :. CCDS58 HDLLAALDAFLEEVTVLPPGRWDPTARIPPPKCLPSQ--HKRLPSQQREIRGPAVPRLTS 290 300 310 320 330 570 580 590 600 610 620 pF1KB3 PGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLF : . : .:: : ::: :. : ::::. :::: :: .:::. CCDS58 --AEDRHRHGPHAHSPE---LQRTG-----------RKVPWYPSDFLDALHLQCFSAVLY 340 350 360 370 380 630 640 650 660 670 680 pF1KB3 IYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVF ::.:... :::::::::. :.: .:: : ...::: :. : :...::: ... .::.::: CCDS58 IYLATVTNAITFGGLLGDATDGAQGVLESFLGTAVAGAAFCLMAGQPLTILSSTGPVLVF 390 400 410 420 430 440 690 700 710 720 730 740 pF1KB3 EEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLI :. .:.: : .:.:: :.:::.:...: :.:::.:.: ::::.. ::.: : ::::: CCDS58 ERLLFSFSRDYSLDYLPFRLWVGIWVATFCLVLVATEASVLVRYFTRFTEEGFCALISLI 450 460 470 480 490 500 750 760 770 780 pF1KB3 FIYETFYKLYKVFTEHPL----------LPFYPPEGALEGS-----------LAAGLEPN :::.. :. .. .:. : :: :. :.. . :: : CCDS58 FIYDAVGKMLNLTHTYPIQKPGSSAYGCLCQYPGPGGNESQWIRTRPKDRDDIDLGL-IN 510 520 530 540 550 560 790 800 810 820 830 pF1KB3 GSALPPTE-----GPP-SP--RNQPNTALLSLILMLGTFFIAFFLRKFRNSRFLGGKARR .: ::: : : : .: .. :. :..::.:.: .::.:. :. ..:::. . .:. CCDS58 ASLLPPPECTRQGGHPRGPGCHTVPDIAFFSLLLFLTSFFFAMALKCVKTSRFFPSVVRK 570 580 590 600 610 620 840 850 860 870 880 890 pF1KB3 IIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSARPFPPWM ..::. ..::. .: .. : :: :: .. : : :.:.. :.:. : : CCDS58 GLSDFSSVLAILLGCGLD-AFLGLATPKLMVPREFKPTLPG-RGWLVSPFGAN---PWWW 630 640 650 660 670 900 910 920 930 940 950 pF1KB3 MVAAAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCGLFGLPW ::::.::::. :::::. ::::.:... :: ::.::::::. .. : : . .:::: CCDS58 SVAAALPALLLSILIFMDQQITAVILNRMEYRLQKGAGFHLDLFCVAVLMLLTSALGLPW 680 690 700 710 720 730 960 970 980 990 1000 1010 pF1KB3 LTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMGAVLRRI ..::: :..:...: : :::..:.. .::::.::... :.: :: .. ::. : CCDS58 YVSATVISLAHMDSLRRESRACAPGERPNFLGIREQRLTGLVVFILTGASIFLAPVLKFI 740 750 760 770 780 790 1020 1030 1040 1050 1060 1070 pF1KB3 PLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFTCIQLGC :. ::.::::::::..::.::...:. :.::::::.:. . .: :.:::: :::.: CCDS58 PMPVLYGIFLYMGVAALSSIQFTNRVKLLLMPAKHQPDLLLLRHVPLTRVHLFTAIQLAC 800 810 820 830 840 850 1080 1090 1100 1110 1120 1130 pF1KB3 IALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDS--EDAEPNFDEDGQD ..:::..::: :.. ::..:: : .:. : :.:. .:: :: . : .. : : CCDS58 LGLLWIIKSTPAAIIFPLMLLGLVGVRKAL-ERVFSPQELLWLDELMPEEERSIPEKGLE 860 870 880 890 900 910 1140 pF1KB3 EYNELHMPV CCDS58 PEHSFSGSDSEDSELMYQPKAPEINISVN 920 930 940 >>CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090 aa) initn: 1999 init1: 789 opt: 1012 Z-score: 636.4 bits: 129.6 E(32554): 4e-29 Smith-Waterman score: 1986; 39.7% identity (67.2% similar) in 896 aa overlap (282-1134:164-1024) 260 270 280 290 300 310 pF1KB3 PSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPG-VRRH : .. .:... . ::.. :.. : . CCDS58 RWLKFEEDVEDGGDRWSKPYVATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDN 140 150 160 170 180 190 320 330 340 350 360 370 pF1KB3 LVKKPSRTQGGRGSPSVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG .. . . .. : .: ..:: .: : :. . : : : :. .. :..: : CCDS58 MIASGQLDESIR--ENVREALLKRHHHQNEKR---FTSRIPLVRSFADI-GKKHSDPHLL 200 210 220 230 240 380 390 400 410 420 pF1KB3 PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS--------LKLLEKIPED ... .:. . :. : ..: .. :. : : .: .....::: CCDS58 ERNGI--LASPQSAPGNL----DNSKSGEIKGNGSGGSRENSTVDFSKVDMNFMRKIPTG 250 260 270 280 290 300 430 440 450 460 470 480 pF1KB3 AEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELG :::. :::: : :::.: ::::: :::: .. :::::.::::..:::. . .:::.: CCDS58 AEASNVLVGEVDFLERPIIAFVRLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIG 310 320 330 340 350 360 490 500 510 520 530 540 pF1KB3 RSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQREL :::::::.:..::..::.: ::.::::.:.:::: :.::.: . ... : CCDS58 RSIATLMTDEIFHDVAYKAKDRNDLLSGIDEFLDQVTVLPPGEWD--------PSIRIEP 370 380 390 400 410 550 560 570 580 590 600 pF1KB3 LRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRR .. .:. :. . :. . :. . . .. .: :: : ::: .::::. :..:. CCDS58 PKSVPSQEKRKIPVFHNGSTPTLGE--TPKEAAHHAGPE---LQRTGRLFGGLILDIKRK 420 430 440 450 460 610 620 630 640 650 660 pF1KB3 YPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGV : . ::..::: ::.:..::.: : .::.::::::::: ::: ... : . .... :. CCDS58 APFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASLTGI 470 480 490 500 510 520 670 680 690 700 710 720 pF1KB3 LFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEG .::...::: ..: .::.::::. ..:::: .: ::. :. .::: . ..:::... CCDS58 AYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDA 530 540 550 560 570 580 730 740 750 760 pF1KB3 SFLVRYISPFTQEIFAFLISLIFIYETFYKLYKV-----FTEH---PLLPFY------PP : :: ::. ::.: :: :: .:::::.. ::. . :. : : : :: CCDS58 SSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPP 590 600 610 620 630 640 770 780 790 800 pF1KB3 EGALEGSLAAGLEPNGSA-------LPPTE-------------GPPSPRNQPNTALLSLI . . : .:: . : .: : .: : .: :.. . .: CCDS58 NPSNE-TLAQWKKDNITAHNISWRNLTVSECKKLRGVFLGSACGHHGPYI-PDVLFWCVI 650 660 670 680 690 700 810 820 830 840 850 860 pF1KB3 LMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPT :.. :::.. ::..:...:.. :.: :.::.. ..:..:: .:: .. . . :: :: CCDS58 LFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDY-LVGVPSPKLHVPE 710 720 730 740 750 760 870 880 890 900 910 920 pF1KB3 GLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRL . : :. :.:.: :::. : : .. ::.:::: :::::. ::::.:...: ..: CCDS58 KFEPTHPE-RGWIISPLGDN---PWWTLLIAAIPALLCTILIFMDQQITAVIINRKEHKL 770 780 790 800 810 820 930 940 950 960 970 980 pF1KB3 LKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEV ::.:.:::::..: . :.:...::::..:::: :..:::.: : :::..:.. . CCDS58 KKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQPKFLGI 830 840 850 860 870 880 990 1000 1010 1020 1030 1040 pF1KB3 REQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPA :::::::..: :.:::. : .::. ::. ::.:.::::::.::.:::: .:. :. ::: CCDS58 REQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPA 890 900 910 920 930 940 1050 1060 1070 1080 1090 1100 pF1KB3 KHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPR ::.:. :. : :..:.:: ::: :..::::.: .::...::...: : .:. :. CCDS58 KHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVRK-LMDL 950 960 970 980 990 1000 1110 1120 1130 1140 pF1KB3 LFQDRELQALDSEDAEPNFDEDGQDEYNELHMPV : :::. :: : :. . .:. CCDS58 CFTKRELSWLD--DLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPV 1010 1020 1030 1040 1050 >>CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095 aa) initn: 1999 init1: 789 opt: 1012 Z-score: 636.3 bits: 129.6 E(32554): 4e-29 Smith-Waterman score: 1986; 39.7% identity (67.2% similar) in 896 aa overlap (282-1134:169-1029) 260 270 280 290 300 310 pF1KB3 PSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPG-VRRH : .. .:... . ::.. :.. : . CCDS82 RWLKFEEDVEDGGDRWSKPYVATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDN 140 150 160 170 180 190 320 330 340 350 360 370 pF1KB3 LVKKPSRTQGGRGSPSVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG .. . . .. : .: ..:: .: : :. . : : : :. .. :..: : CCDS82 MIASGQLDESIR--ENVREALLKRHHHQNEKR---FTSRIPLVRSFADI-GKKHSDPHLL 200 210 220 230 240 250 380 390 400 410 420 pF1KB3 PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS--------LKLLEKIPED ... .:. . :. : ..: .. :. : : .: .....::: CCDS82 ERNGI--LASPQSAPGNL----DNSKSGEIKGNGSGGSRENSTVDFSKVDMNFMRKIPTG 260 270 280 290 300 430 440 450 460 470 480 pF1KB3 AEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELG :::. :::: : :::.: ::::: :::: .. :::::.::::..:::. . .:::.: CCDS82 AEASNVLVGEVDFLERPIIAFVRLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIG 310 320 330 340 350 360 490 500 510 520 530 540 pF1KB3 RSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQREL :::::::.:..::..::.: ::.::::.:.:::: :.::.: . ... : CCDS82 RSIATLMTDEIFHDVAYKAKDRNDLLSGIDEFLDQVTVLPPGEWD--------PSIRIEP 370 380 390 400 410 550 560 570 580 590 600 pF1KB3 LRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRR .. .:. :. . :. . :. . . .. .: :: : ::: .::::. :..:. CCDS82 PKSVPSQEKRKIPVFHNGSTPTLGE--TPKEAAHHAGPE---LQRTGRLFGGLILDIKRK 420 430 440 450 460 470 610 620 630 640 650 660 pF1KB3 YPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGV : . ::..::: ::.:..::.: : .::.::::::::: ::: ... : . .... :. CCDS82 APFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASLTGI 480 490 500 510 520 530 670 680 690 700 710 720 pF1KB3 LFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEG .::...::: ..: .::.::::. ..:::: .: ::. :. .::: . ..:::... CCDS82 AYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDA 540 550 560 570 580 590 730 740 750 760 pF1KB3 SFLVRYISPFTQEIFAFLISLIFIYETFYKLYKV-----FTEH---PLLPFY------PP : :: ::. ::.: :: :: .:::::.. ::. . :. : : : :: CCDS82 SSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPP 600 610 620 630 640 650 770 780 790 800 pF1KB3 EGALEGSLAAGLEPNGSA-------LPPTE-------------GPPSPRNQPNTALLSLI . . : .:: . : .: : .: : .: :.. . .: CCDS82 NPSNE-TLAQWKKDNITAHNISWRNLTVSECKKLRGVFLGSACGHHGPYI-PDVLFWCVI 660 670 680 690 700 710 810 820 830 840 850 860 pF1KB3 LMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPT :.. :::.. ::..:...:.. :.: :.::.. ..:..:: .:: .. . . :: :: CCDS82 LFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDY-LVGVPSPKLHVPE 720 730 740 750 760 770 870 880 890 900 910 920 pF1KB3 GLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRL . : :. :.:.: :::. : : .. ::.:::: :::::. ::::.:...: ..: CCDS82 KFEPTHPE-RGWIISPLGDN---PWWTLLIAAIPALLCTILIFMDQQITAVIINRKEHKL 780 790 800 810 820 930 940 950 960 970 980 pF1KB3 LKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEV ::.:.:::::..: . :.:...::::..:::: :..:::.: : :::..:.. . CCDS82 KKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQPKFLGI 830 840 850 860 870 880 990 1000 1010 1020 1030 1040 pF1KB3 REQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPA :::::::..: :.:::. : .::. ::. ::.:.::::::.::.:::: .:. :. ::: CCDS82 REQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPA 890 900 910 920 930 940 1050 1060 1070 1080 1090 1100 pF1KB3 KHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPR ::.:. :. : :..:.:: ::: :..::::.: .::...::...: : .:. :. CCDS82 KHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVRK-LMDL 950 960 970 980 990 1000 1110 1120 1130 1140 pF1KB3 LFQDRELQALDSEDAEPNFDEDGQDEYNELHMPV : :::. :: : :. . .:. CCDS82 CFTKRELSWLD--DLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPV 1010 1020 1030 1040 1050 1060 >>CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131 aa) initn: 1999 init1: 789 opt: 1012 Z-score: 636.2 bits: 129.6 E(32554): 4.1e-29 Smith-Waterman score: 1986; 39.7% identity (67.2% similar) in 896 aa overlap (282-1134:169-1029) 260 270 280 290 300 310 pF1KB3 PSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPG-VRRH : .. .:... . ::.. :.. : . CCDS58 RWLKFEEDVEDGGDRWSKPYVATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDN 140 150 160 170 180 190 320 330 340 350 360 370 pF1KB3 LVKKPSRTQGGRGSPSVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG .. . . .. : .: ..:: .: : :. . : : : :. .. :..: : CCDS58 MIASGQLDESIR--ENVREALLKRHHHQNEKR---FTSRIPLVRSFADI-GKKHSDPHLL 200 210 220 230 240 250 380 390 400 410 420 pF1KB3 PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS--------LKLLEKIPED ... .:. . :. : ..: .. :. : : .: .....::: CCDS58 ERNGI--LASPQSAPGNL----DNSKSGEIKGNGSGGSRENSTVDFSKVDMNFMRKIPTG 260 270 280 290 300 430 440 450 460 470 480 pF1KB3 AEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELG :::. :::: : :::.: ::::: :::: .. :::::.::::..:::. . .:::.: CCDS58 AEASNVLVGEVDFLERPIIAFVRLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIG 310 320 330 340 350 360 490 500 510 520 530 540 pF1KB3 RSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQREL :::::::.:..::..::.: ::.::::.:.:::: :.::.: . ... : CCDS58 RSIATLMTDEIFHDVAYKAKDRNDLLSGIDEFLDQVTVLPPGEWD--------PSIRIEP 370 380 390 400 410 550 560 570 580 590 600 pF1KB3 LRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRR .. .:. :. . :. . :. . . .. .: :: : ::: .::::. :..:. CCDS58 PKSVPSQEKRKIPVFHNGSTPTLGE--TPKEAAHHAGPE---LQRTGRLFGGLILDIKRK 420 430 440 450 460 470 610 620 630 640 650 660 pF1KB3 YPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGV : . ::..::: ::.:..::.: : .::.::::::::: ::: ... : . .... :. CCDS58 APFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASLTGI 480 490 500 510 520 530 670 680 690 700 710 720 pF1KB3 LFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEG .::...::: ..: .::.::::. ..:::: .: ::. :. .::: . ..:::... CCDS58 AYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDA 540 550 560 570 580 590 730 740 750 760 pF1KB3 SFLVRYISPFTQEIFAFLISLIFIYETFYKLYKV-----FTEH---PLLPFY------PP : :: ::. ::.: :: :: .:::::.. ::. . :. : : : :: CCDS58 SSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPP 600 610 620 630 640 650 770 780 790 800 pF1KB3 EGALEGSLAAGLEPNGSA-------LPPTE-------------GPPSPRNQPNTALLSLI . . : .:: . : .: : .: : .: :.. . .: CCDS58 NPSNE-TLAQWKKDNITAHNISWRNLTVSECKKLRGVFLGSACGHHGPYI-PDVLFWCVI 660 670 680 690 700 710 810 820 830 840 850 860 pF1KB3 LMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPT :.. :::.. ::..:...:.. :.: :.::.. ..:..:: .:: .. . . :: :: CCDS58 LFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDY-LVGVPSPKLHVPE 720 730 740 750 760 770 870 880 890 900 910 920 pF1KB3 GLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRL . : :. :.:.: :::. : : .. ::.:::: :::::. ::::.:...: ..: CCDS58 KFEPTHPE-RGWIISPLGDN---PWWTLLIAAIPALLCTILIFMDQQITAVIINRKEHKL 780 790 800 810 820 930 940 950 960 970 980 pF1KB3 LKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEV ::.:.:::::..: . :.:...::::..:::: :..:::.: : :::..:.. . CCDS58 KKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQPKFLGI 830 840 850 860 870 880 990 1000 1010 1020 1030 1040 pF1KB3 REQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPA :::::::..: :.:::. : .::. ::. ::.:.::::::.::.:::: .:. :. ::: CCDS58 REQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPA 890 900 910 920 930 940 1050 1060 1070 1080 1090 1100 pF1KB3 KHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPR ::.:. :. : :..:.:: ::: :..::::.: .::...::...: : .:. :. CCDS58 KHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVRK-LMDL 950 960 970 980 990 1000 1110 1120 1130 1140 pF1KB3 LFQDRELQALDSEDAEPNFDEDGQDEYNELHMPV : :::. :: : :. . .:. CCDS58 CFTKRELSWLD--DLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPV 1010 1020 1030 1040 1050 1060 1142 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:06:14 2016 done: Thu Nov 3 14:06:15 2016 Total Scan time: 4.800 Total Display time: 0.470 Function used was FASTA [36.3.4 Apr, 2011]