FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3864, 1142 aa
1>>>pF1KB3864 1142 - 1142 aa - 1142 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.8521+/-0.000948; mu= 2.2034+/- 0.057
mean_var=262.8834+/-53.480, 0's: 0 Z-trim(114.4): 45 B-trim: 184 in 1/51
Lambda= 0.079103
statistics sampled from 14905 (14946) to 14905 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.768), E-opt: 0.2 (0.459), width: 16
Scan time: 4.800
The best scores are: opt bits E(32554)
CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232) 5382 628.3 3.3e-179
CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259) 5382 628.3 3.3e-179
CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227) 3445 407.3 1.1e-112
CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232) 3445 407.3 1.1e-112
CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241) 3445 407.3 1.2e-112
CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 ( 911) 1539 189.7 2.7e-47
CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 945) 1107 140.4 1.9e-32
CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090) 1012 129.6 4e-29
CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095) 1012 129.6 4e-29
CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131) 1012 129.6 4.1e-29
CCDS82751.1 SLC4A7 gene_id:9497|Hs108|chr3 (1206) 1012 129.6 4.3e-29
CCDS82748.1 SLC4A7 gene_id:9497|Hs108|chr3 (1210) 1012 129.6 4.3e-29
CCDS33721.1 SLC4A7 gene_id:9497|Hs108|chr3 (1214) 1012 129.6 4.3e-29
CCDS82749.1 SLC4A7 gene_id:9497|Hs108|chr3 (1246) 1012 129.6 4.4e-29
CCDS82747.1 SLC4A7 gene_id:9497|Hs108|chr3 (1259) 1012 129.6 4.5e-29
CCDS3549.1 SLC4A4 gene_id:8671|Hs108|chr4 (1035) 985 126.5 3.2e-28
CCDS43236.1 SLC4A4 gene_id:8671|Hs108|chr4 (1079) 985 126.5 3.3e-28
CCDS47071.1 SLC4A4 gene_id:8671|Hs108|chr4 (1094) 985 126.5 3.4e-28
CCDS46438.1 SLC4A10 gene_id:57282|Hs108|chr2 (1088) 977 125.6 6.3e-28
CCDS54412.1 SLC4A10 gene_id:57282|Hs108|chr2 (1099) 977 125.6 6.4e-28
CCDS54411.1 SLC4A10 gene_id:57282|Hs108|chr2 (1118) 977 125.6 6.5e-28
CCDS73470.1 SLC4A8 gene_id:9498|Hs108|chr12 (1040) 961 123.7 2.2e-27
CCDS44890.1 SLC4A8 gene_id:9498|Hs108|chr12 (1093) 961 123.8 2.3e-27
CCDS1937.1 SLC4A5 gene_id:57835|Hs108|chr2 (1121) 952 122.7 4.7e-27
CCDS47278.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 959) 897 116.4 3.2e-25
CCDS58973.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 983) 897 116.4 3.3e-25
CCDS58974.1 SLC4A9 gene_id:83697|Hs108|chr5 ( 896) 797 105.0 8.3e-22
CCDS54446.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 875) 644 87.5 1.5e-16
CCDS13052.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 891) 644 87.5 1.5e-16
CCDS54445.1 SLC4A11 gene_id:83959|Hs108|chr20 ( 918) 644 87.5 1.5e-16
CCDS58233.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 638) 575 79.5 2.7e-14
CCDS58232.1 SLC4A8 gene_id:9498|Hs108|chr12 ( 747) 575 79.6 3.1e-14
CCDS1936.1 SLC4A5 gene_id:57835|Hs108|chr2 (1137) 562 78.2 1.2e-13
>>CCDS2445.1 SLC4A3 gene_id:6508|Hs108|chr2 (1232 aa)
initn: 6772 init1: 5380 opt: 5382 Z-score: 3330.9 bits: 628.3 E(32554): 3.3e-179
Smith-Waterman score: 6727; 87.8% identity (87.8% similar) in 1201 aa overlap (59-1142:59-1232)
30 40 50 60 70 80
pF1KB3 PDVEEEDDDLGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSAR
::::::::::::::::::::::::::::::
CCDS24 PDVEEEDDDLGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSAR
30 40 50 60 70 80
90 100 110 120 130 140
pF1KB3 LPPPHKLRRLPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 LPPPHKLRRLPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGES
90 100 110 120 130 140
150 160 170 180 190 200
pF1KB3 EAEPVEPPPSGTPQKAKFSIGSDEDDSPGLPGRAAVTKPLPSVGPHTDKSPQHSSRPCSE
:::::::: ::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 EAEPVEPPHSGTPQKAKFSIGSDEDDSPGLPGRAAVTKPLPSVGPHTDKSPQHSS-----
150 160 170 180 190 200
210 220 230 240 250 260
pF1KB3 LRDGDGTTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSAL
::::::::::::::::::::::::::::::::::::::
CCDS24 ----------------------SSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSAL
210 220 230 240
270 280 290 300 310 320
pF1KB3 GNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSRTQGGRGSPS--
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 GNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSRTQGGRGSPSGL
250 260 270 280 290 300
pF1KB3 ------------------------------------------------------------
CCDS24 APILRRKKKKKKLDRRPHEVFVELNELMLDRSQEPHWRETARWIKFEEDVEEETERWGKP
310 320 330 340 350 360
330
pF1KB3 -------------------------------------------------------VLRTL
:::::
CCDS24 HVASLSFRSLLELRRTIAHGAALLDLEQTTLPGIAHLVVETMIVSDQIRPEDRASVLRTL
370 380 390 400 410 420
340 350 360 370 380 390
pF1KB3 LLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 LLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPH
430 440 450 460 470 480
400 410 420 430 440 450
pF1KB3 DPDAKEKPLHMPGGDGHRGKSLKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 DPDAKEKPLHMPGGDGHRGKSLKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVL
490 500 510 520 530 540
460 470 480 490 500 510
pF1KB3 LESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 LESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAI
550 560 570 580 590 600
520 530 540 550 560 570
pF1KB3 SEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTAPGKELSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 SEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTAPGKELSL
610 620 630 640 650 660
580 590 600 610 620 630
pF1KB3 ELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 ELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALS
670 680 690 700 710 720
640 650 660 670 680 690
pF1KB3 PAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 PAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKF
730 740 750 760 770 780
700 710 720 730 740 750
pF1KB3 CRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 CRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFY
790 800 810 820 830 840
760 770 780 790 800 810
pF1KB3 KLYKVFTEHPLLPFYPPEGALEGSLAAGLEPNGSALPPTEGPPSPRNQPNTALLSLILML
::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::
CCDS24 KLYKVFTEHPLLPFYPPEGALEGSLDAGLEPNGSALPPTEGPPSPRNQPNTALLSLILML
850 860 870 880 890 900
820 830 840 850 860 870
pF1KB3 GTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 GTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLS
910 920 930 940 950 960
880 890 900 910 920 930
pF1KB3 VTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 VTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRLLKG
970 980 990 1000 1010 1020
940 950 960 970 980 990
pF1KB3 SGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 SGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQ
1030 1040 1050 1060 1070 1080
1000 1010 1020 1030 1040 1050
pF1KB3 RVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 RVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHH
1090 1100 1110 1120 1130 1140
1060 1070 1080 1090 1100 1110
pF1KB3 PEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 PEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQ
1150 1160 1170 1180 1190 1200
1120 1130 1140
pF1KB3 DRELQALDSEDAEPNFDEDGQDEYNELHMPV
:::::::::::::::::::::::::::::::
CCDS24 DRELQALDSEDAEPNFDEDGQDEYNELHMPV
1210 1220 1230
>>CCDS2446.1 SLC4A3 gene_id:6508|Hs108|chr2 (1259 aa)
initn: 5380 init1: 5380 opt: 5382 Z-score: 3330.8 bits: 628.3 E(32554): 3.3e-179
Smith-Waterman score: 6785; 89.9% identity (89.9% similar) in 1174 aa overlap (86-1142:86-1259)
60 70 80 90 100 110
pF1KB3 AWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKT
::::::::::::::::::::::::::::::
CCDS24 AWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKT
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 SAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPPSGTPQKAKFSIGSDEDDS
::::::::::::::::::::::::::::::::::::::::: ::::::::::::::::::
CCDS24 SAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPHSGTPQKAKFSIGSDEDDS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB3 PGLPGRAAVTKPLPSVGPHTDKSPQHSSRPCSELRDGDGTTDLALSSPRLLCCLPSSPSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 PGLPGRAAVTKPLPSVGPHTDKSPQHSSRPCSELRDGDGTTDLALSSPRLLCCLPSSPSP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB3 RARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 RARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDD
240 250 260 270 280 290
300 310 320
pF1KB3 MKSHRLEDNPGVRRHLVKKPSRTQGGRGSPS-----------------------------
:::::::::::::::::::::::::::::::
CCDS24 MKSHRLEDNPGVRRHLVKKPSRTQGGRGSPSGLAPILRRKKKKKKLDRRPHEVFVELNEL
300 310 320 330 340 350
pF1KB3 ------------------------------------------------------------
CCDS24 MLDRSQEPHWRETARWIKFEEDVEEETERWGKPHVASLSFRSLLELRRTIAHGAALLDLE
360 370 380 390 400 410
330 340 350
pF1KB3 ----------------------------VLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNS
::::::::::::::::::::::::::::::::
CCDS24 QTTLPGIAHLVVETMIVSDQIRPEDRASVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNS
420 430 440 450 460 470
360 370 380 390 400 410
pF1KB3 VLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKSLKLLEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 VLGNHHPTPSHGPDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKSLKLLEK
480 490 500 510 520 530
420 430 440 450 460 470
pF1KB3 IPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 IPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDY
540 550 560 570 580 590
480 490 500 510 520 530
pF1KB3 HELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 HELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAF
600 610 620 630 640 650
540 550 560 570 580 590
pF1KB3 QRELLRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 QRELLRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRD
660 670 680 690 700 710
600 610 620 630 640 650
pF1KB3 VRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 VRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTA
720 730 740 750 760 770
660 670 680 690 700 710
pF1KB3 VLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 VLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALV
780 790 800 810 820 830
720 730 740 750 760 770
pF1KB3 AAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPPEGALEGSLAA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::: :
CCDS24 AAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKLYKVFTEHPLLPFYPPEGALEGSLDA
840 850 860 870 880 890
780 790 800 810 820 830
pF1KB3 GLEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFLRKFRNSRFLGGKARRIIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 GLEPNGSALPPTEGPPSPRNQPNTALLSLILMLGTFFIAFFLRKFRNSRFLGGKARRIIG
900 910 920 930 940 950
840 850 860 870 880 890
pF1KB3 DFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 DFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVA
960 970 980 990 1000 1010
900 910 920 930 940 950
pF1KB3 AAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 AAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTA
1020 1030 1040 1050 1060 1070
960 970 980 990 1000 1010
pF1KB3 ATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMGAVLRRIPLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 ATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMGAVLRRIPLA
1080 1090 1100 1110 1120 1130
1020 1030 1040 1050 1060 1070
pF1KB3 VLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 VLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIAL
1140 1150 1160 1170 1180 1190
1080 1090 1100 1110 1120 1130
pF1KB3 LWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDSEDAEPNFDEDGQDEYNEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 LWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDSEDAEPNFDEDGQDEYNEL
1200 1210 1220 1230 1240 1250
1140
pF1KB3 HMPV
::::
CCDS24 HMPV
>--
initn: 610 init1: 610 opt: 610 Z-score: 387.6 bits: 83.7 E(32554): 2.9e-15
Smith-Waterman score: 610; 100.0% identity (100.0% similar) in 85 aa overlap (1-85:1-85)
10 20 30 40 50 60
pF1KB3 MANGVIPPPGGASPLPQVRVPLEEPPLSPDVEEEDDDLGKTLAVSRFGDLISKPPAWDPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS24 MANGVIPPPGGASPLPQVRVPLEEPPLSPDVEEEDDDLGKTLAVSRFGDLISKPPAWDPE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 KPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSAPPS
:::::::::::::::::::::::::
CCDS24 KPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRRLPPTSARHTRRKRKKEKTSAPPS
70 80 90 100 110 120
>>CCDS56521.1 SLC4A2 gene_id:6522|Hs108|chr7 (1227 aa)
initn: 3774 init1: 1663 opt: 3445 Z-score: 2136.2 bits: 407.3 E(32554): 1.1e-112
Smith-Waterman score: 3708; 53.6% identity (70.8% similar) in 1208 aa overlap (68-1142:54-1227)
40 50 60 70 80 90
pF1KB3 LGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRR
:.:::.::..::: :::::..::: . :.
CCDS56 LHRTLGVERFEEILQEAGSRGGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRK
30 40 50 60 70 80
100 110 120 130 140 150
pF1KB3 LPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPP
: .:. ::. .: :. :: : ::: ::.:.: :.:. ..: :
CCDS56 TPQGPGRKPRRR-----PGASPTGETPTI-EEG------EEDEDEASEAEGARALTQPSP
90 100 110 120 130
160 170 180 190 200 210
pF1KB3 SGTPQKAKFSIGSDEDDSPGLPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDG
.::....: . .:::: . :.. ..: : :: . .:. : .. ........
CCDS56 VSTPSSVQFFL--QEDDSADRKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEA
140 150 160 170 180
220 230 240 250 260 270
pF1KB3 TTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGP
. .:..: .. . . :: :..: ::.:.:: :: : .
CCDS56 EA-VAVASG-------TAGGDDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQAL
190 200 210 220 230
280 290 300 310 320
pF1KB3 EQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSR--TQGGR----------
.::::: ::: :..:::: :::::.:: ::::::::.: .. ::.::
CCDS56 LPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTPR
240 250 260 270 280 290
pF1KB3 -------------------------------------------------GSP--------
:.:
CCDS56 ARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFR
300 310 320 330 340 350
330
pF1KB3 ----------------------------------------------SVLRTLLLKHSHPN
.:::.::::::::.
CCDS56 SLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPS
360 370 380 390 400 410
340 350 360 370 380 390
pF1KB3 DDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEK
:.:: .: ::: :..:..:.::.:: ... : . : :. : : . . .:
CCDS56 DEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-REL
420 430 440 450 460 470
400 410 420 430 440 450
pF1KB3 PLHMPGGDGHRGKS---LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESV
: : . :.:: :::::::::.::::::::::: :: .:. ::::: ::: :..:
CCDS56 PPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAV
480 490 500 510 520 530
460 470 480 490 500 510
pF1KB3 LEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFL
:::::::::::..:::: .. ::::.::::.:::::: :::::: ::.:.:::.::. ::
CCDS56 LEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFL
540 550 560 570 580 590
520 530 540 550 560 570
pF1KB3 DGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLEL
: :.:.:::::.:..:::::: :::..:.::.: : .. : : .: : : :..
CCDS56 DCSVVLPPSEVQGEELLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQM
600 610 620 630 640
580 590 600 610 620 630
pF1KB3 GGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPA
. .. ::::: ::: ::::.:::::::::: ::.:::: ::.:::.::::::::::
CCDS56 VEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPA
650 660 670 680 690 700
640 650 660 670 680 690
pF1KB3 ITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCR
:::::::::::. :.::::::.:::. ::.: :::::::::.::::::::::::::.::
CCDS56 ITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCS
710 720 730 740 750 760
700 710 720 730 740 750
pF1KB3 AQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKL
.. ::::.::::.:.::: ..: .:: :::::::..: ::::::::::::::::::::::
CCDS56 SNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKL
770 780 790 800 810 820
760 770 780 790 800
pF1KB3 YKVFTEHPLLPFYPPEGA-LEGSLA---AG----LEPNGSALPPTEGPPSPRNQPNTALL
:.: :::: ... ..:. :: : :.. .: : .::.:::::::
CCDS56 VKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALL
830 840 850 860 870 880
810 820 830 840 850 860
pF1KB3 SLILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLT
::.:: ::::::::::::.::::. :. ::.:::::.::.::.:::::::: :::::::.
CCDS56 SLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLS
890 900 910 920 930 940
870 880 890 900 910 920
pF1KB3 VPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKA
::.:.:::.:.::.: : ::: ::: :::::. .::.::.::::::::::.::.:.:
CCDS56 VPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKE
950 960 970 980 990 1000
930 940 950 960 970 980
pF1KB3 RRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQI
: : :::::::::::: ..::.:.:::::::.:::::::::.:::::: :.::::::.:
CCDS56 RMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKI
1010 1020 1030 1040 1050 1060
990 1000 1010 1020 1030 1040
pF1KB3 QEVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLIL
:::.::::::.:.: :::::::.: .::.::::::::::::::::::.:::. .:: :.:
CCDS56 QEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLL
1070 1080 1090 1100 1110 1120
1050 1060 1070 1080 1090 1100
pF1KB3 MPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCL
:: ::::. :: ::.: :::::: .:: :.::::.: ::::::::::.:.:::::: .
CCDS56 MPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVV
1130 1140 1150 1160 1170 1180
1110 1120 1130 1140
pF1KB3 LPRLFQDRELQALDSEDAEPNFDE-DGQDEYNELHMPV
: :.: :::.. ::...::: ::: .: :::::. :::
CCDS56 LTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
1190 1200 1210 1220
>>CCDS56520.1 SLC4A2 gene_id:6522|Hs108|chr7 (1232 aa)
initn: 3774 init1: 1663 opt: 3445 Z-score: 2136.2 bits: 407.3 E(32554): 1.1e-112
Smith-Waterman score: 3708; 53.6% identity (70.8% similar) in 1208 aa overlap (68-1142:59-1232)
40 50 60 70 80 90
pF1KB3 LGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRR
:.:::.::..::: :::::..::: . :.
CCDS56 LHRTLGVERFEEILQEAGSRGGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRK
30 40 50 60 70 80
100 110 120 130 140 150
pF1KB3 LPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPP
: .:. ::. .: :. :: : ::: ::.:.: :.:. ..: :
CCDS56 TPQGPGRKPRRR-----PGASPTGETPTI-EEG------EEDEDEASEAEGARALTQPSP
90 100 110 120 130
160 170 180 190 200 210
pF1KB3 SGTPQKAKFSIGSDEDDSPGLPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDG
.::....: . .:::: . :.. ..: : :: . .:. : .. ........
CCDS56 VSTPSSVQFFL--QEDDSADRKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEA
140 150 160 170 180 190
220 230 240 250 260 270
pF1KB3 TTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGP
. .:..: .. . . :: :..: ::.:.:: :: : .
CCDS56 EA-VAVASG-------TAGGDDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQAL
200 210 220 230 240
280 290 300 310 320
pF1KB3 EQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSR--TQGGR----------
.::::: ::: :..:::: :::::.:: ::::::::.: .. ::.::
CCDS56 LPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTPR
250 260 270 280 290 300
pF1KB3 -------------------------------------------------GSP--------
:.:
CCDS56 ARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFR
310 320 330 340 350 360
330
pF1KB3 ----------------------------------------------SVLRTLLLKHSHPN
.:::.::::::::.
CCDS56 SLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPS
370 380 390 400 410 420
340 350 360 370 380 390
pF1KB3 DDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEK
:.:: .: ::: :..:..:.::.:: ... : . : :. : : . . .:
CCDS56 DEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-REL
430 440 450 460 470
400 410 420 430 440 450
pF1KB3 PLHMPGGDGHRGKS---LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESV
: : . :.:: :::::::::.::::::::::: :: .:. ::::: ::: :..:
CCDS56 PPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAV
480 490 500 510 520 530
460 470 480 490 500 510
pF1KB3 LEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFL
:::::::::::..:::: .. ::::.::::.:::::: :::::: ::.:.:::.::. ::
CCDS56 LEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFL
540 550 560 570 580 590
520 530 540 550 560 570
pF1KB3 DGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLEL
: :.:.:::::.:..:::::: :::..:.::.: : .. : : .: : : :..
CCDS56 DCSVVLPPSEVQGEELLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQM
600 610 620 630 640 650
580 590 600 610 620 630
pF1KB3 GGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPA
. .. ::::: ::: ::::.:::::::::: ::.:::: ::.:::.::::::::::
CCDS56 VEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPA
660 670 680 690 700 710
640 650 660 670 680 690
pF1KB3 ITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCR
:::::::::::. :.::::::.:::. ::.: :::::::::.::::::::::::::.::
CCDS56 ITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCS
720 730 740 750 760 770
700 710 720 730 740 750
pF1KB3 AQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKL
.. ::::.::::.:.::: ..: .:: :::::::..: ::::::::::::::::::::::
CCDS56 SNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKL
780 790 800 810 820 830
760 770 780 790 800
pF1KB3 YKVFTEHPLLPFYPPEGA-LEGSLA---AG----LEPNGSALPPTEGPPSPRNQPNTALL
:.: :::: ... ..:. :: : :.. .: : .::.:::::::
CCDS56 VKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALL
840 850 860 870 880 890
810 820 830 840 850 860
pF1KB3 SLILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLT
::.:: ::::::::::::.::::. :. ::.:::::.::.::.:::::::: :::::::.
CCDS56 SLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLS
900 910 920 930 940 950
870 880 890 900 910 920
pF1KB3 VPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKA
::.:.:::.:.::.: : ::: ::: :::::. .::.::.::::::::::.::.:.:
CCDS56 VPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKE
960 970 980 990 1000 1010
930 940 950 960 970 980
pF1KB3 RRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQI
: : :::::::::::: ..::.:.:::::::.:::::::::.:::::: :.::::::.:
CCDS56 RMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKI
1020 1030 1040 1050 1060 1070
990 1000 1010 1020 1030 1040
pF1KB3 QEVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLIL
:::.::::::.:.: :::::::.: .::.::::::::::::::::::.:::. .:: :.:
CCDS56 QEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLL
1080 1090 1100 1110 1120 1130
1050 1060 1070 1080 1090 1100
pF1KB3 MPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCL
:: ::::. :: ::.: :::::: .:: :.::::.: ::::::::::.:.:::::: .
CCDS56 MPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVV
1140 1150 1160 1170 1180 1190
1110 1120 1130 1140
pF1KB3 LPRLFQDRELQALDSEDAEPNFDE-DGQDEYNELHMPV
: :.: :::.. ::...::: ::: .: :::::. :::
CCDS56 LTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
1200 1210 1220 1230
>>CCDS5917.1 SLC4A2 gene_id:6522|Hs108|chr7 (1241 aa)
initn: 3774 init1: 1663 opt: 3445 Z-score: 2136.2 bits: 407.3 E(32554): 1.2e-112
Smith-Waterman score: 3708; 53.6% identity (70.8% similar) in 1208 aa overlap (68-1142:68-1241)
40 50 60 70 80 90
pF1KB3 LGKTLAVSRFGDLISKPPAWDPEKPSRSYSERDFEFHRHTSHHTHHPLSARLPPPHKLRR
:.:::.::..::: :::::..::: . :.
CCDS59 LHRTLGVERFEEILQEAGSRGGEEPGRSYGEEDFEYHRQSSHHIHHPLSTHLPPDARRRK
40 50 60 70 80 90
100 110 120 130 140 150
pF1KB3 LPPTSARHTRRKRKKEKTSAPPSEGTPPIQEEGGAGVDEEEEEEEEEEGESEAEPVEPPP
: .:. ::. .: :. :: : ::: ::.:.: :.:. ..: :
CCDS59 TPQGPGRKPRRR-----PGASPTGETPTI-EEG------EEDEDEASEAEGARALTQPSP
100 110 120 130 140
160 170 180 190 200 210
pF1KB3 SGTPQKAKFSIGSDEDDSPGLPG-RAAVTKPLPSVGPHTDKSPQHS--SRPCSELRDGDG
.::....: . .:::: . :.. ..: : :: . .:. : .. ........
CCDS59 VSTPSSVQFFL--QEDDSADRKAERTSPSSPAPL--PHQEATPRASKGAQAGTQVEEAEA
150 160 170 180 190 200
220 230 240 250 260 270
pF1KB3 TTDLALSSPRLLCCLPSSPSPRARASRLAGEKSRPWSPSASYDLRERLCPGSALGNPGGP
. .:..: .. . . :: :..: ::.:.:: :: : .
CCDS59 EA-VAVASG-------TAGGDDGGASGRPLPKAQP--GHRSYNLQERRRIGSMTGAEQAL
210 220 230 240 250
280 290 300 310 320
pF1KB3 EQQVPTDEAEAQMLGSADLDDMKSHRLEDNPGVRRHLVKKPSR--TQGGR----------
.::::: ::: :..:::: :::::.:: ::::::::.: .. ::.::
CCDS59 LPRVPTDEIEAQTLATADLDLMKSHRFEDVPGVRRHLVRKNAKGSTQSGREGREPGPTPR
260 270 280 290 300 310
pF1KB3 -------------------------------------------------GSP--------
:.:
CCDS59 ARPRAPHKPHEVFVELNELLLDKNQEPQWRETARWIKFEEDVEEETERWGKPHVASLSFR
320 330 340 350 360 370
330
pF1KB3 ----------------------------------------------SVLRTLLLKHSHPN
.:::.::::::::.
CCDS59 SLLELRRTLAHGAVLLDLDQQTLPGVAHQVVEQMVISDQIKAEDRANVLRALLLKHSHPS
380 390 400 410 420 430
340 350 360 370 380 390
pF1KB3 DDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG-PDGAVPTMADDLGEPAPLWPHDPDAKEK
:.:: .: ::: :..:..:.::.:: ... : . : :. : : . . .:
CCDS59 DEKDFSF-PRNISAGSLGSLLGHHHGQGAESDPHVTEPLMG---GVPETRLEVERE-REL
440 450 460 470 480
400 410 420 430 440 450
pF1KB3 PLHMPGGDGHRGKS---LKLLEKIPEDAEATVVLVGCVPFLEQPAAAFVRLNEAVLLESV
: : . :.:: :::::::::.::::::::::: :: .:. ::::: ::: :..:
CCDS59 PPPAPPAGITRSKSKHELKLLEKIPENAEATVVLVGCVEFLSRPTMAFVRLREAVELDAV
490 500 510 520 530 540
460 470 480 490 500 510
pF1KB3 LEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQDLLSAISEFL
:::::::::::..:::: .. ::::.::::.:::::: :::::: ::.:.:::.::. ::
CCDS59 LEVPVPVRFLFLLLGPSSANMDYHEIGRSISTLMSDKQFHEAAYLADEREDLLTAINAFL
550 560 570 580 590 600
520 530 540 550 560 570
pF1KB3 DGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRG--GYTAPGKELSLEL
: :.:.:::::.:..:::::: :::..:.::.: : .. : : .: : : :..
CCDS59 DCSVVLPPSEVQGEELLRSVAHFQRQMLKKREE--QGRLLPTGAGLEPKSAQDKAL-LQM
610 620 630 640 650 660
580 590 600 610 620 630
pF1KB3 GGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIYFAALSPA
. .. ::::: ::: ::::.:::::::::: ::.:::: ::.:::.::::::::::
CCDS59 VEAAGAAEDDPLRRTGRPFGGLIRDVRRRYPHYLSDFRDALDPQCLAAVIFIYFAALSPA
670 680 690 700 710 720
640 650 660 670 680 690
pF1KB3 ITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEEAFFKFCR
:::::::::::. :.::::::.:::. ::.: :::::::::.::::::::::::::.::
CCDS59 ITFGGLLGEKTQDLIGVSELIMSTALQGVVFCLLGAQPLLVIGFSGPLLVFEEAFFSFCS
730 740 750 760 770 780
700 710 720 730 740 750
pF1KB3 AQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFIYETFYKL
.. ::::.::::.:.::: ..: .:: :::::::..: ::::::::::::::::::::::
CCDS59 SNHLEYLVGRVWIGFWLVFLALLMVALEGSFLVRFVSRFTQEIFAFLISLIFIYETFYKL
790 800 810 820 830 840
760 770 780 790 800
pF1KB3 YKVFTEHPLLPFYPPEGA-LEGSLA---AG----LEPNGSALPPTEGPPSPRNQPNTALL
:.: :::: ... ..:. :: : :.. .: : .::.:::::::
CCDS59 VKIFQEHPLHGCSASNSSEVDGGENMTWAGARPTLGPGNRSLAGQSGQGKPRGQPNTALL
850 860 870 880 890 900
810 820 830 840 850 860
pF1KB3 SLILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLT
::.:: ::::::::::::.::::. :. ::.:::::.::.::.:::::::: :::::::.
CCDS59 SLVLMAGTFFIAFFLRKFKNSRFFPGRIRRVIGDFGVPIAILIMVLVDYSIEDTYTQKLS
910 920 930 940 950 960
870 880 890 900 910 920
pF1KB3 VPTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKA
::.:.:::.:.::.: : ::: ::: :::::. .::.::.::::::::::.::.:.:
CCDS59 VPSGFSVTAPEKRGWVINPLGEKSPFPVWMMVASLLPAILVFILIFMETQITTLIISKKE
970 980 990 1000 1010 1020
930 940 950 960 970 980
pF1KB3 RRLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQI
: : :::::::::::: ..::.:.:::::::.:::::::::.:::::: :.::::::.:
CCDS59 RMLQKGSGFHLDLLLIVAMGGICALFGLPWLAAATVRSVTHANALTVMSKAVAPGDKPKI
1030 1040 1050 1060 1070 1080
990 1000 1010 1020 1030 1040
pF1KB3 QEVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLIL
:::.::::::.:.: :::::::.: .::.::::::::::::::::::.:::. .:: :.:
CCDS59 QEVKEQRVTGLLVALLVGLSIVIGDLLRQIPLAVLFGIFLYMGVTSLNGIQFYERLHLLL
1090 1100 1110 1120 1130 1140
1050 1060 1070 1080 1090 1100
pF1KB3 MPAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCL
:: ::::. :: ::.: :::::: .:: :.::::.: ::::::::::.:.:::::: .
CCDS59 MPPKHHPDVTYVKKVRTLRMHLFTALQLLCLALLWAVMSTAASLAFPFILILTVPLRMVV
1150 1160 1170 1180 1190 1200
1110 1120 1130 1140
pF1KB3 LPRLFQDRELQALDSEDAEPNFDE-DGQDEYNELHMPV
: :.: :::.. ::...::: ::: .: :::::. :::
CCDS59 LTRIFTDREMKCLDANEAEPVFDEREGVDEYNEMPMPV
1210 1220 1230 1240
>>CCDS11481.1 SLC4A1 gene_id:6521|Hs108|chr17 (911 aa)
initn: 2718 init1: 1483 opt: 1539 Z-score: 962.5 bits: 189.7 E(32554): 2.7e-47
Smith-Waterman score: 2875; 58.1% identity (79.0% similar) in 787 aa overlap (359-1142:158-911)
330 340 350 360 370 380
pF1KB3 RTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHGPDGAVPTMADDLGEPA-P
.: . : .. :. :.. :.:. :
CCDS11 LAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRSGDPSQP
130 140 150 160 170 180
390 400 410 420 430 440
pF1KB3 LWPHDPDAKEKPLHMPGGDGHRGKSLK-LLEKIPEDAEATVVLVGCVPFLEQPAAAFVRL
: :. . . . . : : .:.: . .::::: :.:::.:::: . :::::. .::::
CCDS11 LLPQHSSLETQLFCEQGDGGTEGHSPSGILEKIPPDSEATLVLVGRADFLEQPVLGFVRL
190 200 210 220 230 240
450 460 470 480 490 500
pF1KB3 NEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDRQD
.::. ::.: :.:::.:::::.::: :: .:::. :::::...:. ::.:..: .
CCDS11 QEAAELEAV-ELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMSERVFRIDAYMAQSRGE
250 260 270 280 290 300
510 520 530 540 550 560
pF1KB3 LLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTAPG
:: .. ::: :.:.::... ... : :.. ::::::.: . .: . . :
CCDS11 LLHSLEGFLDCSLVLPPTDAPSEQALLSLVPVQRELLRRRYQSSPAKPDSSFYKG-----
310 320 330 340 350 360
570 580 590 600 610 620
pF1KB3 KELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLFIY
:.:.:. : :::: .::..:::::::.:::::.: ::. ::. : .:::.:::
CCDS11 ----LDLNGG---P-DDPLQQTGQLFGGLVRDIRRRYPYYLSDITDAFSPQVLAAVIFIY
370 380 390 400 410
630 640 650 660 670 680
pF1KB3 FAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVFEE
::::::::::::::::::.. ::::::..:::: :.::.:::::::::::::::::::::
CCDS11 FAALSPAITFGGLLGEKTRNQMGVSELLISTAVQGILFALLGAQPLLVVGFSGPLLVFEE
420 430 440 450 460 470
690 700 710 720 730 740
pF1KB3 AFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLIFI
:::.::... :::..::::.:.::...:. .:: :::::::.:: .:::::.::::::::
CCDS11 AFFSFCETNGLEYIVGRVWIGFWLILLVVLVVAFEGSFLVRFISRYTQEIFSFLISLIFI
480 490 500 510 520 530
750 760 770 780 790 800
pF1KB3 YETFYKLYKVFTEHPLLPFYPPEGALEGSLAAGLEPNGSALPPTEGPPSPRNQPNTALLS
:::: :: :.: .::: : . : .: .:: :::::::
CCDS11 YETFSKLIKIFQDHPLQKTY--------------NYNVLMVPKPQGP-----LPNTALLS
540 550 560 570
810 820 830 840 850 860
pF1KB3 LILMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTV
:.:: ::::.:..::::.:: .. :: ::.:::::.:::::.:::::. : :::::::.:
CCDS11 LVLMAGTFFFAMMLRKFKNSSYFPGKLRRVIGDFGVPISILIMVLVDFFIQDTYTQKLSV
580 590 600 610 620 630
870 880 890 900 910 920
pF1KB3 PTGLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKAR
: :..:.. . :.: : ::: :: ::: :.:.:::::.::::.:.:::.::::. :
CCDS11 PDGFKVSNSSARGWVIHPLGLRSEFPIWMMFASALPALLVFILIFLESQITTLIVSKPER
640 650 660 670 680 690
930 940 950 960 970 980
pF1KB3 RLLKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQ
...:::::::::::. ..::. .:::.:::.:.:::::::.:::::: : .:: :::
CCDS11 KMVKGSGFHLDLLLVVGMGGVAALFGMPWLSATTVRSVTHANALTVMGKASTPGAAAQIQ
700 710 720 730 740 750
990 1000 1010 1020 1030 1040
pF1KB3 EVREQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILM
::.:::..:.:.: ::::::.: .: :::::::::::::::::::::::: .:.::..
CCDS11 EVKEQRISGLLVAVLVGLSILMEPILSRIPLAVLFGIFLYMGVTSLSGIQLFDRILLLFK
760 770 780 790 800 810
1050 1060 1070 1080 1090 1100
pF1KB3 PAKHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLL
: :.::. ::: .:::::::::: ::. :.:.::::::: ::::.::.:.::::::. ::
CCDS11 PPKYHPDVPYVKRVKTWRMHLFTGIQIICLAVLWVVKSTPASLALPFVLILTVPLRRVLL
820 830 840 850 860 870
1110 1120 1130 1140
pF1KB3 PRLFQDRELQALDSEDAEPNFDED-GQDEYNELHMPV
: .:.. ::: ::..::. .:::. :.:::.:. :::
CCDS11 PLIFRNVELQCLDADDAKATFDEEEGRDEYDEVAMPV
880 890 900 910
>>CCDS58975.1 SLC4A9 gene_id:83697|Hs108|chr5 (945 aa)
initn: 1605 init1: 696 opt: 1107 Z-score: 695.8 bits: 140.4 E(32554): 1.9e-32
Smith-Waterman score: 1667; 41.0% identity (67.1% similar) in 748 aa overlap (415-1131:192-914)
390 400 410 420 430 440
pF1KB3 PAPLWPHDPDAKEKPLHMPGGDGHRGKSLKLLEKIPEDAEATVVLVGCVPFLEQPAAAFV
: .:.: ::: .::.: . :: :: .:::
CCDS58 TGTRPCWGSTHPRKASDNEEAPLREQCQNPLRQKLPPGAEAGTVLAGELGFLAQPLGAFV
170 180 190 200 210 220
450 460 470 480 490 500
pF1KB3 RLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELGRSIATLMSDKLFHEAAYQADDR
:: . :.: :. :: .: ::. ..::: . :::.::. :.:.:: :. .. .:..
CCDS58 RLRNPVVLGSLTEVSLPSRFFCLLLGPCMLGKGYHEMGRAAAVLLSDPQFQWSVRRASNL
230 240 250 260 270 280
510 520 530 540 550 560
pF1KB3 QDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQRELLRKRREREQTKVEMTTRGGYTA
.:::.:.. ::. :.::.. . . . . .:: .: ... . :.
CCDS58 HDLLAALDAFLEEVTVLPPGRWDPTARIPPPKCLPSQ--HKRLPSQQREIRGPAVPRLTS
290 300 310 320 330
570 580 590 600 610 620
pF1KB3 PGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRRYPHYPSDLRDALHSQCVAAVLF
: . : .:: : ::: :. : ::::. :::: :: .:::.
CCDS58 --AEDRHRHGPHAHSPE---LQRTG-----------RKVPWYPSDFLDALHLQCFSAVLY
340 350 360 370 380
630 640 650 660 670 680
pF1KB3 IYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGVLFSLLGAQPLLVVGFSGPLLVF
::.:... :::::::::. :.: .:: : ...::: :. : :...::: ... .::.:::
CCDS58 IYLATVTNAITFGGLLGDATDGAQGVLESFLGTAVAGAAFCLMAGQPLTILSSTGPVLVF
390 400 410 420 430 440
690 700 710 720 730 740
pF1KB3 EEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEGSFLVRYISPFTQEIFAFLISLI
:. .:.: : .:.:: :.:::.:...: :.:::.:.: ::::.. ::.: : :::::
CCDS58 ERLLFSFSRDYSLDYLPFRLWVGIWVATFCLVLVATEASVLVRYFTRFTEEGFCALISLI
450 460 470 480 490 500
750 760 770 780
pF1KB3 FIYETFYKLYKVFTEHPL----------LPFYPPEGALEGS-----------LAAGLEPN
:::.. :. .. .:. : :: :. :.. . :: :
CCDS58 FIYDAVGKMLNLTHTYPIQKPGSSAYGCLCQYPGPGGNESQWIRTRPKDRDDIDLGL-IN
510 520 530 540 550 560
790 800 810 820 830
pF1KB3 GSALPPTE-----GPP-SP--RNQPNTALLSLILMLGTFFIAFFLRKFRNSRFLGGKARR
.: ::: : : : .: .. :. :..::.:.: .::.:. :. ..:::. . .:.
CCDS58 ASLLPPPECTRQGGHPRGPGCHTVPDIAFFSLLLFLTSFFFAMALKCVKTSRFFPSVVRK
570 580 590 600 610 620
840 850 860 870 880 890
pF1KB3 IIGDFGIPISILVMVLVDYSITDTYTQKLTVPTGLSVTSPDKRSWFIPPLGSARPFPPWM
..::. ..::. .: .. : :: :: .. : : :.:.. :.:. : :
CCDS58 GLSDFSSVLAILLGCGLD-AFLGLATPKLMVPREFKPTLPG-RGWLVSPFGAN---PWWW
630 640 650 660 670
900 910 920 930 940 950
pF1KB3 MVAAAVPALLVLILIFMETQITALIVSQKARRLLKGSGFHLDLLLIGSLGGLCGLFGLPW
::::.::::. :::::. ::::.:... :: ::.::::::. .. : : . .::::
CCDS58 SVAAALPALLLSILIFMDQQITAVILNRMEYRLQKGAGFHLDLFCVAVLMLLTSALGLPW
680 690 700 710 720 730
960 970 980 990 1000 1010
pF1KB3 LTAATVRSVTHVNALTVMRTAIAPGDKPQIQEVREQRVTGVLIASLVGLSIVMGAVLRRI
..::: :..:...: : :::..:.. .::::.::... :.: :: .. ::. :
CCDS58 YVSATVISLAHMDSLRRESRACAPGERPNFLGIREQRLTGLVVFILTGASIFLAPVLKFI
740 750 760 770 780 790
1020 1030 1040 1050 1060 1070
pF1KB3 PLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPAKHHPEQPYVTKVKTWRMHLFTCIQLGC
:. ::.::::::::..::.::...:. :.::::::.:. . .: :.:::: :::.:
CCDS58 PMPVLYGIFLYMGVAALSSIQFTNRVKLLLMPAKHQPDLLLLRHVPLTRVHLFTAIQLAC
800 810 820 830 840 850
1080 1090 1100 1110 1120 1130
pF1KB3 IALLWVVKSTAASLAFPFLLLLTVPLRHCLLPRLFQDRELQALDS--EDAEPNFDEDGQD
..:::..::: :.. ::..:: : .:. : :.:. .:: :: . : .. : :
CCDS58 LGLLWIIKSTPAAIIFPLMLLGLVGVRKAL-ERVFSPQELLWLDELMPEEERSIPEKGLE
860 870 880 890 900 910
1140
pF1KB3 EYNELHMPV
CCDS58 PEHSFSGSDSEDSELMYQPKAPEINISVN
920 930 940
>>CCDS58819.1 SLC4A7 gene_id:9497|Hs108|chr3 (1090 aa)
initn: 1999 init1: 789 opt: 1012 Z-score: 636.4 bits: 129.6 E(32554): 4e-29
Smith-Waterman score: 1986; 39.7% identity (67.2% similar) in 896 aa overlap (282-1134:164-1024)
260 270 280 290 300 310
pF1KB3 PSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPG-VRRH
: .. .:... . ::.. :.. : .
CCDS58 RWLKFEEDVEDGGDRWSKPYVATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDN
140 150 160 170 180 190
320 330 340 350 360 370
pF1KB3 LVKKPSRTQGGRGSPSVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG
.. . . .. : .: ..:: .: : :. . : : : :. .. :..: :
CCDS58 MIASGQLDESIR--ENVREALLKRHHHQNEKR---FTSRIPLVRSFADI-GKKHSDPHLL
200 210 220 230 240
380 390 400 410 420
pF1KB3 PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS--------LKLLEKIPED
... .:. . :. : ..: .. :. : : .: .....:::
CCDS58 ERNGI--LASPQSAPGNL----DNSKSGEIKGNGSGGSRENSTVDFSKVDMNFMRKIPTG
250 260 270 280 290 300
430 440 450 460 470 480
pF1KB3 AEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELG
:::. :::: : :::.: ::::: :::: .. :::::.::::..:::. . .:::.:
CCDS58 AEASNVLVGEVDFLERPIIAFVRLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIG
310 320 330 340 350 360
490 500 510 520 530 540
pF1KB3 RSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQREL
:::::::.:..::..::.: ::.::::.:.:::: :.::.: . ... :
CCDS58 RSIATLMTDEIFHDVAYKAKDRNDLLSGIDEFLDQVTVLPPGEWD--------PSIRIEP
370 380 390 400 410
550 560 570 580 590 600
pF1KB3 LRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRR
.. .:. :. . :. . :. . . .. .: :: : ::: .::::. :..:.
CCDS58 PKSVPSQEKRKIPVFHNGSTPTLGE--TPKEAAHHAGPE---LQRTGRLFGGLILDIKRK
420 430 440 450 460
610 620 630 640 650 660
pF1KB3 YPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGV
: . ::..::: ::.:..::.: : .::.::::::::: ::: ... : . .... :.
CCDS58 APFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASLTGI
470 480 490 500 510 520
670 680 690 700 710 720
pF1KB3 LFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEG
.::...::: ..: .::.::::. ..:::: .: ::. :. .::: . ..:::...
CCDS58 AYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDA
530 540 550 560 570 580
730 740 750 760
pF1KB3 SFLVRYISPFTQEIFAFLISLIFIYETFYKLYKV-----FTEH---PLLPFY------PP
: :: ::. ::.: :: :: .:::::.. ::. . :. : : : ::
CCDS58 SSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPP
590 600 610 620 630 640
770 780 790 800
pF1KB3 EGALEGSLAAGLEPNGSA-------LPPTE-------------GPPSPRNQPNTALLSLI
. . : .:: . : .: : .: : .: :.. . .:
CCDS58 NPSNE-TLAQWKKDNITAHNISWRNLTVSECKKLRGVFLGSACGHHGPYI-PDVLFWCVI
650 660 670 680 690 700
810 820 830 840 850 860
pF1KB3 LMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPT
:.. :::.. ::..:...:.. :.: :.::.. ..:..:: .:: .. . . :: ::
CCDS58 LFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDY-LVGVPSPKLHVPE
710 720 730 740 750 760
870 880 890 900 910 920
pF1KB3 GLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRL
. : :. :.:.: :::. : : .. ::.:::: :::::. ::::.:...: ..:
CCDS58 KFEPTHPE-RGWIISPLGDN---PWWTLLIAAIPALLCTILIFMDQQITAVIINRKEHKL
770 780 790 800 810 820
930 940 950 960 970 980
pF1KB3 LKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEV
::.:.:::::..: . :.:...::::..:::: :..:::.: : :::..:.. .
CCDS58 KKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQPKFLGI
830 840 850 860 870 880
990 1000 1010 1020 1030 1040
pF1KB3 REQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPA
:::::::..: :.:::. : .::. ::. ::.:.::::::.::.:::: .:. :. :::
CCDS58 REQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPA
890 900 910 920 930 940
1050 1060 1070 1080 1090 1100
pF1KB3 KHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPR
::.:. :. : :..:.:: ::: :..::::.: .::...::...: : .:. :.
CCDS58 KHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVRK-LMDL
950 960 970 980 990 1000
1110 1120 1130 1140
pF1KB3 LFQDRELQALDSEDAEPNFDEDGQDEYNELHMPV
: :::. :: : :. . .:.
CCDS58 CFTKRELSWLD--DLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPV
1010 1020 1030 1040 1050
>>CCDS82750.1 SLC4A7 gene_id:9497|Hs108|chr3 (1095 aa)
initn: 1999 init1: 789 opt: 1012 Z-score: 636.3 bits: 129.6 E(32554): 4e-29
Smith-Waterman score: 1986; 39.7% identity (67.2% similar) in 896 aa overlap (282-1134:169-1029)
260 270 280 290 300 310
pF1KB3 PSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPG-VRRH
: .. .:... . ::.. :.. : .
CCDS82 RWLKFEEDVEDGGDRWSKPYVATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDN
140 150 160 170 180 190
320 330 340 350 360 370
pF1KB3 LVKKPSRTQGGRGSPSVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG
.. . . .. : .: ..:: .: : :. . : : : :. .. :..: :
CCDS82 MIASGQLDESIR--ENVREALLKRHHHQNEKR---FTSRIPLVRSFADI-GKKHSDPHLL
200 210 220 230 240 250
380 390 400 410 420
pF1KB3 PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS--------LKLLEKIPED
... .:. . :. : ..: .. :. : : .: .....:::
CCDS82 ERNGI--LASPQSAPGNL----DNSKSGEIKGNGSGGSRENSTVDFSKVDMNFMRKIPTG
260 270 280 290 300
430 440 450 460 470 480
pF1KB3 AEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELG
:::. :::: : :::.: ::::: :::: .. :::::.::::..:::. . .:::.:
CCDS82 AEASNVLVGEVDFLERPIIAFVRLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIG
310 320 330 340 350 360
490 500 510 520 530 540
pF1KB3 RSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQREL
:::::::.:..::..::.: ::.::::.:.:::: :.::.: . ... :
CCDS82 RSIATLMTDEIFHDVAYKAKDRNDLLSGIDEFLDQVTVLPPGEWD--------PSIRIEP
370 380 390 400 410
550 560 570 580 590 600
pF1KB3 LRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRR
.. .:. :. . :. . :. . . .. .: :: : ::: .::::. :..:.
CCDS82 PKSVPSQEKRKIPVFHNGSTPTLGE--TPKEAAHHAGPE---LQRTGRLFGGLILDIKRK
420 430 440 450 460 470
610 620 630 640 650 660
pF1KB3 YPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGV
: . ::..::: ::.:..::.: : .::.::::::::: ::: ... : . .... :.
CCDS82 APFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASLTGI
480 490 500 510 520 530
670 680 690 700 710 720
pF1KB3 LFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEG
.::...::: ..: .::.::::. ..:::: .: ::. :. .::: . ..:::...
CCDS82 AYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDA
540 550 560 570 580 590
730 740 750 760
pF1KB3 SFLVRYISPFTQEIFAFLISLIFIYETFYKLYKV-----FTEH---PLLPFY------PP
: :: ::. ::.: :: :: .:::::.. ::. . :. : : : ::
CCDS82 SSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPP
600 610 620 630 640 650
770 780 790 800
pF1KB3 EGALEGSLAAGLEPNGSA-------LPPTE-------------GPPSPRNQPNTALLSLI
. . : .:: . : .: : .: : .: :.. . .:
CCDS82 NPSNE-TLAQWKKDNITAHNISWRNLTVSECKKLRGVFLGSACGHHGPYI-PDVLFWCVI
660 670 680 690 700 710
810 820 830 840 850 860
pF1KB3 LMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPT
:.. :::.. ::..:...:.. :.: :.::.. ..:..:: .:: .. . . :: ::
CCDS82 LFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDY-LVGVPSPKLHVPE
720 730 740 750 760 770
870 880 890 900 910 920
pF1KB3 GLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRL
. : :. :.:.: :::. : : .. ::.:::: :::::. ::::.:...: ..:
CCDS82 KFEPTHPE-RGWIISPLGDN---PWWTLLIAAIPALLCTILIFMDQQITAVIINRKEHKL
780 790 800 810 820
930 940 950 960 970 980
pF1KB3 LKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEV
::.:.:::::..: . :.:...::::..:::: :..:::.: : :::..:.. .
CCDS82 KKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQPKFLGI
830 840 850 860 870 880
990 1000 1010 1020 1030 1040
pF1KB3 REQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPA
:::::::..: :.:::. : .::. ::. ::.:.::::::.::.:::: .:. :. :::
CCDS82 REQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPA
890 900 910 920 930 940
1050 1060 1070 1080 1090 1100
pF1KB3 KHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPR
::.:. :. : :..:.:: ::: :..::::.: .::...::...: : .:. :.
CCDS82 KHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVRK-LMDL
950 960 970 980 990 1000
1110 1120 1130 1140
pF1KB3 LFQDRELQALDSEDAEPNFDEDGQDEYNELHMPV
: :::. :: : :. . .:.
CCDS82 CFTKRELSWLD--DLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPV
1010 1020 1030 1040 1050 1060
>>CCDS58820.1 SLC4A7 gene_id:9497|Hs108|chr3 (1131 aa)
initn: 1999 init1: 789 opt: 1012 Z-score: 636.2 bits: 129.6 E(32554): 4.1e-29
Smith-Waterman score: 1986; 39.7% identity (67.2% similar) in 896 aa overlap (282-1134:169-1029)
260 270 280 290 300 310
pF1KB3 PSASYDLRERLCPGSALGNPGGPEQQVPTDEAEAQMLGSADLDDMKSHRLEDNPG-VRRH
: .. .:... . ::.. :.. : .
CCDS58 RWLKFEEDVEDGGDRWSKPYVATLSLHSLFELRSCILNGTVMLDMRASTLDEIADMVLDN
140 150 160 170 180 190
320 330 340 350 360 370
pF1KB3 LVKKPSRTQGGRGSPSVLRTLLLKHSHPNDDKDSGFFPRNPSSSSMNSVLGNHHPTPSHG
.. . . .. : .: ..:: .: : :. . : : : :. .. :..: :
CCDS58 MIASGQLDESIR--ENVREALLKRHHHQNEKR---FTSRIPLVRSFADI-GKKHSDPHLL
200 210 220 230 240 250
380 390 400 410 420
pF1KB3 PDGAVPTMADDLGEPAPLWPHDPDAKEKPLHMPGGDGHRGKS--------LKLLEKIPED
... .:. . :. : ..: .. :. : : .: .....:::
CCDS58 ERNGI--LASPQSAPGNL----DNSKSGEIKGNGSGGSRENSTVDFSKVDMNFMRKIPTG
260 270 280 290 300
430 440 450 460 470 480
pF1KB3 AEATVVLVGCVPFLEQPAAAFVRLNEAVLLESVLEVPVPVRFLFVMLGPSHTSTDYHELG
:::. :::: : :::.: ::::: :::: .. :::::.::::..:::. . .:::.:
CCDS58 AEASNVLVGEVDFLERPIIAFVRLAPAVLLTGLTEVPVPTRFLFLLLGPAGKAPQYHEIG
310 320 330 340 350 360
490 500 510 520 530 540
pF1KB3 RSIATLMSDKLFHEAAYQADDRQDLLSAISEFLDGSIVIPPSEVEGRDLLRSVAAFQREL
:::::::.:..::..::.: ::.::::.:.:::: :.::.: . ... :
CCDS58 RSIATLMTDEIFHDVAYKAKDRNDLLSGIDEFLDQVTVLPPGEWD--------PSIRIEP
370 380 390 400 410
550 560 570 580 590 600
pF1KB3 LRKRREREQTKVEMTTRGGYTAPGKELSLELGGSEATPEDDPLLRTGSVFGGLVRDVRRR
.. .:. :. . :. . :. . . .. .: :: : ::: .::::. :..:.
CCDS58 PKSVPSQEKRKIPVFHNGSTPTLGE--TPKEAAHHAGPE---LQRTGRLFGGLILDIKRK
420 430 440 450 460 470
610 620 630 640 650 660
pF1KB3 YPHYPSDLRDALHSQCVAAVLFIYFAALSPAITFGGLLGEKTEGLMGVSELIVSTAVLGV
: . ::..::: ::.:..::.: : .::.::::::::: ::: ... : . .... :.
CCDS58 APFFLSDFKDALSLQCLASILFLYCACMSPVITFGGLLGEATEGRISAIESLFGASLTGI
480 490 500 510 520 530
670 680 690 700 710 720
pF1KB3 LFSLLGAQPLLVVGFSGPLLVFEEAFFKFCRAQDLEYLTGRVWVGLWLVVFVLALVAAEG
.::...::: ..: .::.::::. ..:::: .: ::. :. .::: . ..:::...
CCDS58 AYSLFAGQPLTILGSTGPVLVFEKILYKFCRDYQLSYLSLRTSIGLWTSFLCIVLVATDA
540 550 560 570 580 590
730 740 750 760
pF1KB3 SFLVRYISPFTQEIFAFLISLIFIYETFYKLYKV-----FTEH---PLLPFY------PP
: :: ::. ::.: :: :: .:::::.. ::. . :. : : : ::
CCDS58 SSLVCYITRFTEEAFAALICIIFIYEALEKLFDLGETYAFNMHNNLDKLTSYSCVCTEPP
600 610 620 630 640 650
770 780 790 800
pF1KB3 EGALEGSLAAGLEPNGSA-------LPPTE-------------GPPSPRNQPNTALLSLI
. . : .:: . : .: : .: : .: :.. . .:
CCDS58 NPSNE-TLAQWKKDNITAHNISWRNLTVSECKKLRGVFLGSACGHHGPYI-PDVLFWCVI
660 670 680 690 700 710
810 820 830 840 850 860
pF1KB3 LMLGTFFIAFFLRKFRNSRFLGGKARRIIGDFGIPISILVMVLVDYSITDTYTQKLTVPT
:.. :::.. ::..:...:.. :.: :.::.. ..:..:: .:: .. . . :: ::
CCDS58 LFFTTFFLSSFLKQFKTKRYFPTKVRSTISDFAVFLTIVIMVTIDY-LVGVPSPKLHVPE
720 730 740 750 760 770
870 880 890 900 910 920
pF1KB3 GLSVTSPDKRSWFIPPLGSARPFPPWMMVAAAVPALLVLILIFMETQITALIVSQKARRL
. : :. :.:.: :::. : : .. ::.:::: :::::. ::::.:...: ..:
CCDS58 KFEPTHPE-RGWIISPLGDN---PWWTLLIAAIPALLCTILIFMDQQITAVIINRKEHKL
780 790 800 810 820
930 940 950 960 970 980
pF1KB3 LKGSGFHLDLLLIGSLGGLCGLFGLPWLTAATVRSVTHVNALTVMRTAIAPGDKPQIQEV
::.:.:::::..: . :.:...::::..:::: :..:::.: : :::..:.. .
CCDS58 KKGAGYHLDLLMVGVMLGVCSVMGLPWFVAATVLSISHVNSLKVESECSAPGEQPKFLGI
830 840 850 860 870 880
990 1000 1010 1020 1030 1040
pF1KB3 REQRVTGVLIASLVGLSIVMGAVLRRIPLAVLFGIFLYMGVTSLSGIQLSQRLLLILMPA
:::::::..: :.:::. : .::. ::. ::.:.::::::.::.:::: .:. :. :::
CCDS58 REQRVTGLMIFILMGLSVFMTSVLKFIPMPVLYGVFLYMGVSSLKGIQLFDRIKLFGMPA
890 900 910 920 930 940
1050 1060 1070 1080 1090 1100
pF1KB3 KHHPEQPYVTKVKTWRMHLFTCIQLGCIALLWVVKSTAASLAFPFLLLLTVPLRHCLLPR
::.:. :. : :..:.:: ::: :..::::.: .::...::...: : .:. :.
CCDS58 KHQPDLIYLRYVPLWKVHIFTVIQLTCLVLLWVIKVSAAAVVFPMMVLALVFVRK-LMDL
950 960 970 980 990 1000
1110 1120 1130 1140
pF1KB3 LFQDRELQALDSEDAEPNFDEDGQDEYNELHMPV
: :::. :: : :. . .:.
CCDS58 CFTKRELSWLD--DLMPESKKKKEDDKKKKEKEEAERMLQDDDDTVHLPFEGGSLLQIPV
1010 1020 1030 1040 1050 1060
1142 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:06:14 2016 done: Thu Nov 3 14:06:15 2016
Total Scan time: 4.800 Total Display time: 0.470
Function used was FASTA [36.3.4 Apr, 2011]