FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4919, 1833 aa 1>>>pF1KB4919 1833 - 1833 aa - 1833 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.2114+/-0.000519; mu= -4.6332+/- 0.033 mean_var=648.7321+/-159.567, 0's: 0 Z-trim(121.7): 26 B-trim: 2226 in 1/55 Lambda= 0.050355 statistics sampled from 38775 (38801) to 38775 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.744), E-opt: 0.2 (0.455), width: 16 Scan time: 18.940 The best scores are: opt bits E(85289) XP_016866294 (OMIM: 143054,616977) PREDICTED: tran (2446) 12457 922.4 0 NP_006725 (OMIM: 143054,616977) transcription fact (2446) 12457 922.4 0 NP_001121186 (OMIM: 606649) transcription factor H (2405) 1530 128.6 7.2e-28 XP_016857483 (OMIM: 606649) PREDICTED: transcripti (2405) 1530 128.6 7.2e-28 XP_011540186 (OMIM: 606649) PREDICTED: transcripti (2406) 1528 128.5 8e-28 XP_016857481 (OMIM: 606649) PREDICTED: transcripti (2406) 1528 128.5 8e-28 NP_078779 (OMIM: 606649) transcription factor HIVE (2406) 1528 128.5 8e-28 XP_016857482 (OMIM: 606649) PREDICTED: transcripti (2406) 1528 128.5 8e-28 XP_011512857 (OMIM: 194540) PREDICTED: zinc finger (2707) 934 85.4 8.4e-15 XP_011512855 (OMIM: 194540) PREDICTED: zinc finger (2718) 934 85.4 8.4e-15 XP_011512853 (OMIM: 194540) PREDICTED: zinc finger (2718) 934 85.4 8.4e-15 NP_002105 (OMIM: 194540) zinc finger protein 40 [H (2718) 934 85.4 8.4e-15 XP_011512854 (OMIM: 194540) PREDICTED: zinc finger (2718) 934 85.4 8.4e-15 XP_011512849 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_016866291 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_011512852 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_016866290 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_016866289 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_011512850 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_011512851 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_011512848 (OMIM: 194540) PREDICTED: zinc finger (2727) 934 85.4 8.4e-15 XP_011540187 (OMIM: 606649) PREDICTED: transcripti (1805) 877 81.0 1.1e-13 XP_011540189 (OMIM: 606649) PREDICTED: transcripti (1737) 875 80.9 1.2e-13 XP_011540188 (OMIM: 606649) PREDICTED: transcripti (1769) 875 80.9 1.3e-13 XP_016866292 (OMIM: 194540) PREDICTED: zinc finger (2693) 722 70.0 3.6e-10 >>XP_016866294 (OMIM: 143054,616977) PREDICTED: transcri (2446 aa) initn: 12457 init1: 12457 opt: 12457 Z-score: 4911.4 bits: 922.4 E(85289): 0 Smith-Waterman score: 12457; 99.9% identity (99.9% similar) in 1833 aa overlap (1-1833:614-2446) 10 20 30 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRK :::::::::::::::::::::::::::::: XP_016 IPPQRMLRRQAAFELPSVQEGHVEVEHHGRMLKGISSSSLKEKKLSPGDRVGYDYDVCRK 590 600 610 620 630 640 40 50 60 70 80 90 pF1KB4 PYKKWEDSETPKQNYRDISCLSSLKHGGEYFMDPVVPLQGVPSMFGTTCENRKRRKEKSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PYKKWEDSETPKQNYRDISCLSSLKHGGEYFMDPVVPLQGVPSMFGTTCENRKRRKEKSV 650 660 670 680 690 700 100 110 120 130 140 150 pF1KB4 GDEEDTPMICSSIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDPCRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 GDEEDTPMICSSIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDPCRP 710 720 730 740 750 760 160 170 180 190 200 210 pF1KB4 QLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESAELV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 QLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESAELV 770 780 790 800 810 820 220 230 240 250 260 270 pF1KB4 ACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRLVRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 ACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRLVRQ 830 840 850 860 870 880 280 290 300 310 320 330 pF1KB4 HNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKKRLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 HNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKKRLR 890 900 910 920 930 940 340 350 360 370 380 390 pF1KB4 LADMEHSSGESSFESTGTGLSRSPSQESNLSHSSSFSMSFEREETSKLSALPKQDEFGKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 LADMEHSSGESSFESTGTGLSRSPSQESNLSHSSSFSMSFEREETSKLSALPKQDEFGKH 950 960 970 980 990 1000 400 410 420 430 440 450 pF1KB4 SEFLTVPAGSYSLSVPGHHHQKEMRRCSSEQMPCPHPAEVPEVRSKSFDYGNLSHAPVSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 SEFLTVPAGSYSLSVPGHHHQKEMRRCSSEQMPCPHPAEVPEVRSKSFDYGNLSHAPVSG 1010 1020 1030 1040 1050 1060 460 470 480 490 500 510 pF1KB4 AAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 AAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGP 1070 1080 1090 1100 1110 1120 520 530 540 550 560 570 pF1KB4 PAVLPPLQQEDPGKQVAGPCPPLSSGPLHLAQPQIMHMDSQESLRNPLIQPTSYMTSKHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PAVLPPLQQEDPGKQVAGPCPPLSSGPLHLAQPQIMHMDSQESLRNPLIQPTSYMTSKHL 1130 1140 1150 1160 1170 1180 580 590 600 610 620 630 pF1KB4 PEQPHLFPHQETIPFSPIQNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PEQPHLFPHQETIPFSPIQNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYG 1190 1200 1210 1220 1230 1240 640 650 660 670 680 690 pF1KB4 KPSFQTEIHSSYPLEHVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 KPSFQTEIHSSYPLEHVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSS 1250 1260 1270 1280 1290 1300 700 710 720 730 740 750 pF1KB4 KSTETPSEQVLQEDFASANAGSLQSLPGTVVPVRIQTHVPSYGSVMYTSISQILGQNSPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 KSTETPSEQVLQEDFASANAGSLQSLPGTVVPVRIQTHVPSYGSVMYTSISQILGQNSPA 1310 1320 1330 1340 1350 1360 760 770 780 790 800 810 pF1KB4 IVICKVDENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 IVICKVDENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL 1370 1380 1390 1400 1410 1420 820 830 840 850 860 870 pF1KB4 CLPSTSDSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQIVEELSAVELTNSDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 CLPSTSDSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQIVEELSAVELTNSDI 1430 1440 1450 1460 1470 1480 880 890 900 910 920 930 pF1KB4 KKDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFPPSKEM :::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::: XP_016 KKDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFLPSKEM 1490 1500 1510 1520 1530 1540 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR 1550 1560 1570 1580 1590 1600 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA 1610 1620 1630 1640 1650 1660 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA 1670 1680 1690 1700 1710 1720 1120 1130 1140 1150 1160 1170 pF1KB4 WKQFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 WKQFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGYK 1730 1740 1750 1760 1770 1780 1180 1190 1200 1210 1220 1230 pF1KB4 SNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 SNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNLT 1790 1800 1810 1820 1830 1840 1240 1250 1260 1270 1280 1290 pF1KB4 KHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 KHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEES 1850 1860 1870 1880 1890 1900 1300 1310 1320 1330 1340 1350 pF1KB4 DGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPHGVPSDSSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 DGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPHGVPSDSSL 1910 1920 1930 1940 1950 1960 1360 1370 1380 1390 1400 1410 pF1KB4 GHSSLISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDRLDIPSCMD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 GHSSLISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDRLDIPSCMD 1970 1980 1990 2000 2010 2020 1420 1430 1440 1450 1460 1470 pF1KB4 EECMLPSEPSSSPRDFSPSSHHSSPGYDSSPCRDNSPKRYLIPKGDLSPRRHLSPRRDLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 EECMLPSEPSSSPRDFSPSSHHSSPGYDSSPCRDNSPKRYLIPKGDLSPRRHLSPRRDLS 2030 2040 2050 2060 2070 2080 1480 1490 1500 1510 1520 1530 pF1KB4 PMRHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRRERRYMTTIRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PMRHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRRERRYMTTIRA 2090 2100 2110 2120 2130 2140 1540 1550 1560 1570 1580 1590 pF1KB4 PSPRRALYHNPPLSMGQYLQAEPIVLGPPNLRRGLPQVPYFSLYGDQEGAYEHPGSSLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PSPRRALYHNPPLSMGQYLQAEPIVLGPPNLRRGLPQVPYFSLYGDQEGAYEHPGSSLFP 2150 2160 2170 2180 2190 2200 1600 1610 1620 1630 1640 1650 pF1KB4 EGPNDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 EGPNDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEK 2210 2220 2230 2240 2250 2260 1660 1670 1680 1690 1700 1710 pF1KB4 KGASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQSTSEDSLNATEREQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 KGASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQSTSEDSLNATEREQE 2270 2280 2290 2300 2310 2320 1720 1730 1740 1750 1760 1770 pF1KB4 ENIQTCTKAIASLRIATEEAALLGPDQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 ENIQTCTKAIASLRIATEEAALLGPDQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTS 2330 2340 2350 2360 2370 2380 1780 1790 1800 1810 1820 1830 pF1KB4 ATHPDLHDGEKDNFGTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 ATHPDLHDGEKDNFGTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKS 2390 2400 2410 2420 2430 2440 pF1KB4 QLH ::: XP_016 QLH >>NP_006725 (OMIM: 143054,616977) transcription factor H (2446 aa) initn: 12457 init1: 12457 opt: 12457 Z-score: 4911.4 bits: 922.4 E(85289): 0 Smith-Waterman score: 12457; 99.9% identity (99.9% similar) in 1833 aa overlap (1-1833:614-2446) 10 20 30 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRK :::::::::::::::::::::::::::::: NP_006 IPPQRMLRRQAAFELPSVQEGHVEVEHHGRMLKGISSSSLKEKKLSPGDRVGYDYDVCRK 590 600 610 620 630 640 40 50 60 70 80 90 pF1KB4 PYKKWEDSETPKQNYRDISCLSSLKHGGEYFMDPVVPLQGVPSMFGTTCENRKRRKEKSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 PYKKWEDSETPKQNYRDISCLSSLKHGGEYFMDPVVPLQGVPSMFGTTCENRKRRKEKSV 650 660 670 680 690 700 100 110 120 130 140 150 pF1KB4 GDEEDTPMICSSIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDPCRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 GDEEDTPMICSSIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDPCRP 710 720 730 740 750 760 160 170 180 190 200 210 pF1KB4 QLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESAELV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 QLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESAELV 770 780 790 800 810 820 220 230 240 250 260 270 pF1KB4 ACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRLVRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 ACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRLVRQ 830 840 850 860 870 880 280 290 300 310 320 330 pF1KB4 HNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKKRLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 HNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKKRLR 890 900 910 920 930 940 340 350 360 370 380 390 pF1KB4 LADMEHSSGESSFESTGTGLSRSPSQESNLSHSSSFSMSFEREETSKLSALPKQDEFGKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 LADMEHSSGESSFESTGTGLSRSPSQESNLSHSSSFSMSFEREETSKLSALPKQDEFGKH 950 960 970 980 990 1000 400 410 420 430 440 450 pF1KB4 SEFLTVPAGSYSLSVPGHHHQKEMRRCSSEQMPCPHPAEVPEVRSKSFDYGNLSHAPVSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 SEFLTVPAGSYSLSVPGHHHQKEMRRCSSEQMPCPHPAEVPEVRSKSFDYGNLSHAPVSG 1010 1020 1030 1040 1050 1060 460 470 480 490 500 510 pF1KB4 AAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 AAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGP 1070 1080 1090 1100 1110 1120 520 530 540 550 560 570 pF1KB4 PAVLPPLQQEDPGKQVAGPCPPLSSGPLHLAQPQIMHMDSQESLRNPLIQPTSYMTSKHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 PAVLPPLQQEDPGKQVAGPCPPLSSGPLHLAQPQIMHMDSQESLRNPLIQPTSYMTSKHL 1130 1140 1150 1160 1170 1180 580 590 600 610 620 630 pF1KB4 PEQPHLFPHQETIPFSPIQNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 PEQPHLFPHQETIPFSPIQNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYG 1190 1200 1210 1220 1230 1240 640 650 660 670 680 690 pF1KB4 KPSFQTEIHSSYPLEHVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 KPSFQTEIHSSYPLEHVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSS 1250 1260 1270 1280 1290 1300 700 710 720 730 740 750 pF1KB4 KSTETPSEQVLQEDFASANAGSLQSLPGTVVPVRIQTHVPSYGSVMYTSISQILGQNSPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 KSTETPSEQVLQEDFASANAGSLQSLPGTVVPVRIQTHVPSYGSVMYTSISQILGQNSPA 1310 1320 1330 1340 1350 1360 760 770 780 790 800 810 pF1KB4 IVICKVDENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 IVICKVDENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL 1370 1380 1390 1400 1410 1420 820 830 840 850 860 870 pF1KB4 CLPSTSDSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQIVEELSAVELTNSDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 CLPSTSDSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQIVEELSAVELTNSDI 1430 1440 1450 1460 1470 1480 880 890 900 910 920 930 pF1KB4 KKDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFPPSKEM :::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::: NP_006 KKDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFLPSKEM 1490 1500 1510 1520 1530 1540 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR 1550 1560 1570 1580 1590 1600 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA 1610 1620 1630 1640 1650 1660 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA 1670 1680 1690 1700 1710 1720 1120 1130 1140 1150 1160 1170 pF1KB4 WKQFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 WKQFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGYK 1730 1740 1750 1760 1770 1780 1180 1190 1200 1210 1220 1230 pF1KB4 SNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 SNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNLT 1790 1800 1810 1820 1830 1840 1240 1250 1260 1270 1280 1290 pF1KB4 KHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 KHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEES 1850 1860 1870 1880 1890 1900 1300 1310 1320 1330 1340 1350 pF1KB4 DGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPHGVPSDSSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 DGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPHGVPSDSSL 1910 1920 1930 1940 1950 1960 1360 1370 1380 1390 1400 1410 pF1KB4 GHSSLISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDRLDIPSCMD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 GHSSLISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDRLDIPSCMD 1970 1980 1990 2000 2010 2020 1420 1430 1440 1450 1460 1470 pF1KB4 EECMLPSEPSSSPRDFSPSSHHSSPGYDSSPCRDNSPKRYLIPKGDLSPRRHLSPRRDLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 EECMLPSEPSSSPRDFSPSSHHSSPGYDSSPCRDNSPKRYLIPKGDLSPRRHLSPRRDLS 2030 2040 2050 2060 2070 2080 1480 1490 1500 1510 1520 1530 pF1KB4 PMRHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRRERRYMTTIRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 PMRHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRRERRYMTTIRA 2090 2100 2110 2120 2130 2140 1540 1550 1560 1570 1580 1590 pF1KB4 PSPRRALYHNPPLSMGQYLQAEPIVLGPPNLRRGLPQVPYFSLYGDQEGAYEHPGSSLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 PSPRRALYHNPPLSMGQYLQAEPIVLGPPNLRRGLPQVPYFSLYGDQEGAYEHPGSSLFP 2150 2160 2170 2180 2190 2200 1600 1610 1620 1630 1640 1650 pF1KB4 EGPNDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 EGPNDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEK 2210 2220 2230 2240 2250 2260 1660 1670 1680 1690 1700 1710 pF1KB4 KGASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQSTSEDSLNATEREQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 KGASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQSTSEDSLNATEREQE 2270 2280 2290 2300 2310 2320 1720 1730 1740 1750 1760 1770 pF1KB4 ENIQTCTKAIASLRIATEEAALLGPDQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 ENIQTCTKAIASLRIATEEAALLGPDQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTS 2330 2340 2350 2360 2370 2380 1780 1790 1800 1810 1820 1830 pF1KB4 ATHPDLHDGEKDNFGTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_006 ATHPDLHDGEKDNFGTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKS 2390 2400 2410 2420 2430 2440 pF1KB4 QLH ::: NP_006 QLH >>NP_001121186 (OMIM: 606649) transcription factor HIVEP (2405 aa) initn: 1696 init1: 614 opt: 1530 Z-score: 621.3 bits: 128.6 E(85289): 7.2e-28 Smith-Waterman score: 2681; 36.2% identity (56.4% similar) in 1874 aa overlap (11-1774:631-2347) 10 20 30 40 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSET : :: : :. ..: ::: .. :. NP_001 YSSEEPGPSSKDTASKPSDEVEPKESELTKKTKKGLKTKGVIYECNICGARYKKRDNYEA 610 620 630 640 650 660 50 60 70 80 pF1KB4 PKQNY-------RDISCLSSLKHGGEYFMDPVVPL-QGVPSMFGTTCEN---RKRRKEKS :. : . :: . . .: . : : . .::: : :::::::: NP_001 HKKYYCSELQIAKPISAGTHTSPEAEKSQIEHEPWSQMMHYKLGTTLELTPLRKRRKEKS 670 680 690 700 710 720 90 100 110 120 130 140 pF1KB4 VGDEEDTPMICS--SIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDP .::::. : . : : ..: : :: .: . :...: . .: : :.: NP_001 LGDEEEPPAFESTKSQFGSP-G--PSDAARNLPL-ESTKSPAEPSKSVPSLEGPTG-FQP 730 740 750 760 770 150 160 170 180 190 200 pF1KB4 CRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESA :. ::: : ..: :. .. :::::::.: ::.:.: NP_001 RTPK--PGSGSESGKE---------------RRTTSKEISVIQHTSS------FEKSDSL 780 790 800 810 210 220 230 240 250 260 pF1KB4 ELVACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRL : :: : :. ... : :: :: : .:.: ::.: NP_001 E--------QPSGLEGEDKPLAQFP-SPPPAPHGRSAHS----------------LQPKL 820 830 840 270 280 290 300 310 320 pF1KB4 VRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKK ::: ::::::: ::::::.:. : : ::::: .:::::::::.::.:::::::::::: NP_001 VRQPNIQVPEILVTEEPDRPDTEPEPPPKEPEK-TEEFQWPQRSQTLAQLPAEKLPPKKK 850 860 870 880 890 900 330 340 350 360 370 380 pF1KB4 RLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS-SSFSMSFEREETSKLSA-LPKQD :::::.: .:::::::::. . ::::::::::.: : :: : ::::.. .: : :..: NP_001 RLRLAEMAQSSGESSFESS-VPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSD 910 920 930 940 950 960 390 400 410 420 430 440 pF1KB4 EFGKHSEFLTVPAGSYSLSVPGHH-HQKEMRRCSSEQMP-CPHPAEVPEVRSKSFDYGNL : : :.. :.::.:: : .:::: .::: : : :.. :.::::::::.: NP_001 MRPK-------PLGTHMLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSL 970 980 990 1000 1010 450 460 470 480 490 pF1KB4 S----HAPVSGAAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMD--QSVKQEQLEH : ::. : . :.: ::.:::::::::.: :: :. ::. : .. : NP_001 SLTGPSAPAPVAPPARVAPP-ERRKCFLVRQASLSRPPE-SELEVAPKGRQESEEPQPSS 1020 1030 1040 1050 1060 1070 500 510 520 530 pF1KB4 LHAGLRSGW---------HHGPPAVLPPLQQEDP-GKQVAGPCP------PLSSGPLH-- . . .:. : :::. : :.. : : : :... ::: NP_001 SKPSAKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQTPLHEK 1080 1090 1100 1110 1120 1130 540 550 560 570 580 590 pF1KB4 --LAQP----QIMHMDSQESLRNPLIQPTSYMTSK-HLP-EQPHLFPHQETIPFSPIQNA : : ...:. ..: ..: . :. :.: : .: : : : :.: . NP_001 PYLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPT 1140 1150 1160 1170 1180 1190 600 610 620 630 640 pF1KB4 LF---QFQYPTVCMVH---LPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLE .. :.. : . : : .: .::: . .: :. : .: . .: ..:.. :. NP_001 VLHPGQLHLPQL-MPHPANIPFRQPP---SFLPMPY---PTSSALSSGFFLPLQSQFALQ 1200 1210 1220 1230 1240 650 660 670 680 690 700 pF1KB4 HVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTETPSEQVLQEDF : .. . : . : .:..:: :.. .. :: . :. . NP_001 L----PGDVESHLPQIKTSLAPLATGSAGLSPST---EYSSDIRLPPVAPPASSSAP--- 1250 1260 1270 1280 1290 710 720 730 740 750 pF1KB4 ASANAGSLQSLPGT----VVPVRIQTHVPSYGSVMYTSISQIL---GQNSPAIV-ICKVD .:: .: . : : :::::.::..:::::.:::..:::: .:.: : : . : . NP_001 TSAPPLALPACPDTMVSLVVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFE 1300 1310 1320 1330 1340 1350 760 770 780 790 800 810 pF1KB4 ENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL-CLPSTS : .. : : .: .. .: . . . ... : ..: ::: .:. . : NP_001 EPPSKGTTVCGADVHEVGPGPSGLSEEQSRAFPTPYLRVPVTLPERKGTSLSSESILSLE 1360 1370 1380 1390 1400 1410 820 830 840 850 860 870 pF1KB4 DSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYG-----QIVEELSAVELTNSDIK : .: :::::.::::.:::: :::.::::::::. ..:. :.: ::... NP_001 GSSSTAGGSKRVLSPAGSLELTMETQQQKRVKEEEASKADEKLELVKPCSVV-LTSTE-- 1420 1430 1440 1450 1460 1470 880 890 900 910 920 930 pF1KB4 KDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVS-PSSREPFPPSKEM : .::.: .: :: . . . :.: :: .::.... : . :. . :..: NP_001 -DGKRPEKSHLGNQGQGRRELEMLSSLSS-----DPSDTKEIPPLPHPALSHGTAPGSEA 1480 1490 1500 1510 1520 1530 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR : .. : :. : . . : . : : . :..: :: :: : : . .: NP_001 L--KEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LP-----LSETS---SR 1540 1550 1560 1570 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA : :.. :. : ...::::::.:::.::::.::: :::..:.: NP_001 P-------AKSQEGT------------DSKKVLQFPSLHTTTNVSWCYLNYIKPNHIQHA 1580 1590 1600 1610 1620 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA .:::::.:::: ::: :..::..:.:::::::.. : ::.:. .: .:.:. ::. NP_001 DRRSSVYAGWCISLYNPNLPGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSS 1630 1640 1650 1660 1670 1680 1120 1130 1140 1150 1160 pF1KB4 WK-QFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGY : ..:... . : . . .. :. .:. .:. . : .:.. :: ::::::::: NP_001 RKPRMTEVHLPS--LVSPEGQKDLARVEKEEERRGEPEEDAP-ASQRGEPARIKIFEGGY 1690 1700 1710 1720 1730 1170 1180 1190 1200 1210 1220 pF1KB4 KSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNL ::::.::::::::::::.:::::::::::::::::::::::::::::: :.::::::::: NP_001 KSNEEYVYVRGRGRGKYVCEECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNL 1740 1750 1760 1770 1780 1790 1230 1240 1250 1260 1270 1280 pF1KB4 TKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEE ::::::::: ::: : :: ... :.::. . .:: . .: . : .::::: :. NP_001 TKHMKSKAHSKKCQETGV----LEELEAEEGTS-DDLFQDSEGREGSEAVEEHQFSDLED 1800 1810 1820 1830 1840 1850 1290 1300 1310 1320 1330 1340 pF1KB4 SDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPP---RFSSLPVNVGAVPHGVP- :: .:.. :.:::::. ..: .:. . :.. : :: : .: :. .: : .: NP_001 SD---SDSDLDEDEDEDEEESQDELS-RPSSEAPPPGPPHALRADSSPI-LGPQPPDAPA 1860 1870 1880 1890 1900 1350 1360 1370 1380 1390 pF1KB4 --SDSSLGHSSLISYLVTLPSIRVT-QLM--------TPSDSCEDTQMTEYQRLFQSKST .... : : . .: : .. : : .: : : . . : NP_001 SGTEATRGSSVSEAERLTASSCSMSSQSMPGLPWLGPAPLGSVEKDTGSALSYKPVSPRR 1910 1920 1930 1940 1950 1960 1400 1410 1420 1430 1440 pF1KB4 DSEPDKDRLDIPSCMDEECMLPSEPSSSPRDFSPS-----SHHSSPGYDSSPCRDNSPKR :.:. . : .. . .. :::. ::. : : :: .: : . NP_001 PWSPSKEAGSRPPLARKHSLTKND--SSPQRCSPAREPQASAPSPPGLHVDPGRGMGA-- 1970 1980 1990 2000 2010 2020 1450 1460 1470 1480 1490 1500 pF1KB4 YLIPKGDLSPRRHLSPRRDLSPM-RHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGK .: : ::: .::: : :. :.:.:: .. . : . :: :: : :::. NP_001 --LPCG--SPRLQLSPLT-LCPLGRELAPRAHVLSKLEGTTDPGLPRY--SPTRRWSPGQ 2030 2040 2050 2060 2070 1510 1520 1530 1540 1550 1560 pF1KB4 DITARRDLSPRRERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGPPNLRRGLPQV . :. : . .. .:. : :.: :.. . : : : .: :.. NP_001 AESPPRSAPPGK-----WALAGPGSPSAGEHGPGLGLDPRVLFPPAPL-PHKLLSRSPET 2080 2090 2100 2110 2120 2130 1570 1580 1590 1600 1610 pF1KB4 ---PY--FSLYGDQEGAYEHPGSSLFPEGPNDY-----------VFSHLPLHSQQQVRAP :. : . . :: :: . .:. .:::::::::. .::: NP_001 CASPWKAESRSPSCSPGPAHPLSSRPFSALHDFHGHILARTEENIFSHLPLHSQHLTRAP 2140 2150 2160 2170 2180 2190 1620 1630 1640 1650 1660 1670 pF1KB4 IPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEKKGASGESFSKDPYVLSKQHEKR :..:.::::::.. : : .: :.:: . :: . :.: . ... .... . NP_001 CPLIPIGGIQMVQARPGAHPTLLPGPTAAW-VSGF--SGGGSDLTGARE----AQERGRW 2200 2210 2220 2230 2240 1680 1690 1700 1710 1720 1730 pF1KB4 GPHALQSSG-PPSTPSSPRLLMKQSTSEDSLNATEREQEENIQTCTKAIASLRIATEEAA .: .:.. : . : : .. . : . :: . . . .: . NP_001 SPTESSSASVSPVAKVSKFTLSSELEGGDYPKERERTGGGPGRPPDWTPHGTGAPAEPTP 2250 2260 2270 2280 2290 2300 1740 1750 1760 1770 1780 1790 pF1KB4 LLGP-DQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTSATHPDLHDGEKDNFGTSQTP .: : . .: :. .. : : : : .: ::: : NP_001 THSPCTPPDTLPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPPLDRSSSVGCLAEASAR 2310 2320 2330 2340 2350 2360 1800 1810 1820 1830 pF1KB4 LAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKSQLH NP_001 FPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2370 2380 2390 2400 >>XP_016857483 (OMIM: 606649) PREDICTED: transcription f (2405 aa) initn: 1696 init1: 614 opt: 1530 Z-score: 621.3 bits: 128.6 E(85289): 7.2e-28 Smith-Waterman score: 2681; 36.2% identity (56.4% similar) in 1874 aa overlap (11-1774:631-2347) 10 20 30 40 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSET : :: : :. ..: ::: .. :. XP_016 YSSEEPGPSSKDTASKPSDEVEPKESELTKKTKKGLKTKGVIYECNICGARYKKRDNYEA 610 620 630 640 650 660 50 60 70 80 pF1KB4 PKQNY-------RDISCLSSLKHGGEYFMDPVVPL-QGVPSMFGTTCEN---RKRRKEKS :. : . :: . . .: . : : . .::: : :::::::: XP_016 HKKYYCSELQIAKPISAGTHTSPEAEKSQIEHEPWSQMMHYKLGTTLELTPLRKRRKEKS 670 680 690 700 710 720 90 100 110 120 130 140 pF1KB4 VGDEEDTPMICS--SIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDP .::::. : . : : ..: : :: .: . :...: . .: : :.: XP_016 LGDEEEPPAFESTKSQFGSP-G--PSDAARNLPL-ESTKSPAEPSKSVPSLEGPTG-FQP 730 740 750 760 770 150 160 170 180 190 200 pF1KB4 CRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESA :. ::: : ..: :. .. :::::::.: ::.:.: XP_016 RTPK--PGSGSESGKE---------------RRTTSKEISVIQHTSS------FEKSDSL 780 790 800 810 210 220 230 240 250 260 pF1KB4 ELVACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRL : :: : :. ... : :: :: : .:.: ::.: XP_016 E--------QPSGLEGEDKPLAQFP-SPPPAPHGRSAHS----------------LQPKL 820 830 840 270 280 290 300 310 320 pF1KB4 VRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKK ::: ::::::: ::::::.:. : : ::::: .:::::::::.::.:::::::::::: XP_016 VRQPNIQVPEILVTEEPDRPDTEPEPPPKEPEK-TEEFQWPQRSQTLAQLPAEKLPPKKK 850 860 870 880 890 900 330 340 350 360 370 380 pF1KB4 RLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS-SSFSMSFEREETSKLSA-LPKQD :::::.: .:::::::::. . ::::::::::.: : :: : ::::.. .: : :..: XP_016 RLRLAEMAQSSGESSFESS-VPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSD 910 920 930 940 950 960 390 400 410 420 430 440 pF1KB4 EFGKHSEFLTVPAGSYSLSVPGHH-HQKEMRRCSSEQMP-CPHPAEVPEVRSKSFDYGNL : : :.. :.::.:: : .:::: .::: : : :.. :.::::::::.: XP_016 MRPK-------PLGTHMLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSL 970 980 990 1000 1010 450 460 470 480 490 pF1KB4 S----HAPVSGAAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMD--QSVKQEQLEH : ::. : . :.: ::.:::::::::.: :: :. ::. : .. : XP_016 SLTGPSAPAPVAPPARVAPP-ERRKCFLVRQASLSRPPE-SELEVAPKGRQESEEPQPSS 1020 1030 1040 1050 1060 1070 500 510 520 530 pF1KB4 LHAGLRSGW---------HHGPPAVLPPLQQEDP-GKQVAGPCP------PLSSGPLH-- . . .:. : :::. : :.. : : : :... ::: XP_016 SKPSAKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQTPLHEK 1080 1090 1100 1110 1120 1130 540 550 560 570 580 590 pF1KB4 --LAQP----QIMHMDSQESLRNPLIQPTSYMTSK-HLP-EQPHLFPHQETIPFSPIQNA : : ...:. ..: ..: . :. :.: : .: : : : :.: . XP_016 PYLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPT 1140 1150 1160 1170 1180 1190 600 610 620 630 640 pF1KB4 LF---QFQYPTVCMVH---LPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLE .. :.. : . : : .: .::: . .: :. : .: . .: ..:.. :. XP_016 VLHPGQLHLPQL-MPHPANIPFRQPP---SFLPMPY---PTSSALSSGFFLPLQSQFALQ 1200 1210 1220 1230 1240 650 660 670 680 690 700 pF1KB4 HVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTETPSEQVLQEDF : .. . : . : .:..:: :.. .. :: . :. . XP_016 L----PGDVESHLPQIKTSLAPLATGSAGLSPST---EYSSDIRLPPVAPPASSSAP--- 1250 1260 1270 1280 1290 710 720 730 740 750 pF1KB4 ASANAGSLQSLPGT----VVPVRIQTHVPSYGSVMYTSISQIL---GQNSPAIV-ICKVD .:: .: . : : :::::.::..:::::.:::..:::: .:.: : : . : . XP_016 TSAPPLALPACPDTMVSLVVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFE 1300 1310 1320 1330 1340 1350 760 770 780 790 800 810 pF1KB4 ENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL-CLPSTS : .. : : .: .. .: . . . ... : ..: ::: .:. . : XP_016 EPPSKGTTVCGADVHEVGPGPSGLSEEQSRAFPTPYLRVPVTLPERKGTSLSSESILSLE 1360 1370 1380 1390 1400 1410 820 830 840 850 860 870 pF1KB4 DSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYG-----QIVEELSAVELTNSDIK : .: :::::.::::.:::: :::.::::::::. ..:. :.: ::... XP_016 GSSSTAGGSKRVLSPAGSLELTMETQQQKRVKEEEASKADEKLELVKPCSVV-LTSTE-- 1420 1430 1440 1450 1460 1470 880 890 900 910 920 930 pF1KB4 KDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVS-PSSREPFPPSKEM : .::.: .: :: . . . :.: :: .::.... : . :. . :..: XP_016 -DGKRPEKSHLGNQGQGRRELEMLSSLSS-----DPSDTKEIPPLPHPALSHGTAPGSEA 1480 1490 1500 1510 1520 1530 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR : .. : :. : . . : . : : . :..: :: :: : : . .: XP_016 L--KEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LP-----LSETS---SR 1540 1550 1560 1570 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA : :.. :. : ...::::::.:::.::::.::: :::..:.: XP_016 P-------AKSQEGT------------DSKKVLQFPSLHTTTNVSWCYLNYIKPNHIQHA 1580 1590 1600 1610 1620 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA .:::::.:::: ::: :..::..:.:::::::.. : ::.:. .: .:.:. ::. XP_016 DRRSSVYAGWCISLYNPNLPGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSS 1630 1640 1650 1660 1670 1680 1120 1130 1140 1150 1160 pF1KB4 WK-QFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGY : ..:... . : . . .. :. .:. .:. . : .:.. :: ::::::::: XP_016 RKPRMTEVHLPS--LVSPEGQKDLARVEKEEERRGEPEEDAP-ASQRGEPARIKIFEGGY 1690 1700 1710 1720 1730 1170 1180 1190 1200 1210 1220 pF1KB4 KSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNL ::::.::::::::::::.:::::::::::::::::::::::::::::: :.::::::::: XP_016 KSNEEYVYVRGRGRGKYVCEECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNL 1740 1750 1760 1770 1780 1790 1230 1240 1250 1260 1270 1280 pF1KB4 TKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEE ::::::::: ::: : :: ... :.::. . .:: . .: . : .::::: :. XP_016 TKHMKSKAHSKKCQETGV----LEELEAEEGTS-DDLFQDSEGREGSEAVEEHQFSDLED 1800 1810 1820 1830 1840 1850 1290 1300 1310 1320 1330 1340 pF1KB4 SDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPP---RFSSLPVNVGAVPHGVP- :: .:.. :.:::::. ..: .:. . :.. : :: : .: :. .: : .: XP_016 SD---SDSDLDEDEDEDEEESQDELS-RPSSEAPPPGPPHALRADSSPI-LGPQPPDAPA 1860 1870 1880 1890 1900 1350 1360 1370 1380 1390 pF1KB4 --SDSSLGHSSLISYLVTLPSIRVT-QLM--------TPSDSCEDTQMTEYQRLFQSKST .... : : . .: : .. : : .: : : . . : XP_016 SGTEATRGSSVSEAERLTASSCSMSSQSMPGLPWLGPAPLGSVEKDTGSALSYKPVSPRR 1910 1920 1930 1940 1950 1960 1400 1410 1420 1430 1440 pF1KB4 DSEPDKDRLDIPSCMDEECMLPSEPSSSPRDFSPS-----SHHSSPGYDSSPCRDNSPKR :.:. . : .. . .. :::. ::. : : :: .: : . XP_016 PWSPSKEAGSRPPLARKHSLTKND--SSPQRCSPAREPQASAPSPPGLHVDPGRGMGA-- 1970 1980 1990 2000 2010 2020 1450 1460 1470 1480 1490 1500 pF1KB4 YLIPKGDLSPRRHLSPRRDLSPM-RHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGK .: : ::: .::: : :. :.:.:: .. . : . :: :: : :::. XP_016 --LPCG--SPRLQLSPLT-LCPLGRELAPRAHVLSKLEGTTDPGLPRY--SPTRRWSPGQ 2030 2040 2050 2060 2070 1510 1520 1530 1540 1550 1560 pF1KB4 DITARRDLSPRRERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGPPNLRRGLPQV . :. : . .. .:. : :.: :.. . : : : .: :.. XP_016 AESPPRSAPPGK-----WALAGPGSPSAGEHGPGLGLDPRVLFPPAPL-PHKLLSRSPET 2080 2090 2100 2110 2120 2130 1570 1580 1590 1600 1610 pF1KB4 ---PY--FSLYGDQEGAYEHPGSSLFPEGPNDY-----------VFSHLPLHSQQQVRAP :. : . . :: :: . .:. .:::::::::. .::: XP_016 CASPWKAESRSPSCSPGPAHPLSSRPFSALHDFHGHILARTEENIFSHLPLHSQHLTRAP 2140 2150 2160 2170 2180 2190 1620 1630 1640 1650 1660 1670 pF1KB4 IPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEKKGASGESFSKDPYVLSKQHEKR :..:.::::::.. : : .: :.:: . :: . :.: . ... .... . XP_016 CPLIPIGGIQMVQARPGAHPTLLPGPTAAW-VSGF--SGGGSDLTGARE----AQERGRW 2200 2210 2220 2230 2240 1680 1690 1700 1710 1720 1730 pF1KB4 GPHALQSSG-PPSTPSSPRLLMKQSTSEDSLNATEREQEENIQTCTKAIASLRIATEEAA .: .:.. : . : : .. . : . :: . . . .: . XP_016 SPTESSSASVSPVAKVSKFTLSSELEGGDYPKERERTGGGPGRPPDWTPHGTGAPAEPTP 2250 2260 2270 2280 2290 2300 1740 1750 1760 1770 1780 1790 pF1KB4 LLGP-DQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTSATHPDLHDGEKDNFGTSQTP .: : . .: :. .. : : : : .: ::: : XP_016 THSPCTPPDTLPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPPLDRSSSVGCLAEASAR 2310 2320 2330 2340 2350 2360 1800 1810 1820 1830 pF1KB4 LAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKSQLH XP_016 FPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2370 2380 2390 2400 >>XP_011540186 (OMIM: 606649) PREDICTED: transcription f (2406 aa) initn: 1696 init1: 614 opt: 1528 Z-score: 620.5 bits: 128.5 E(85289): 8e-28 Smith-Waterman score: 2686; 36.2% identity (56.2% similar) in 1880 aa overlap (11-1774:631-2348) 10 20 30 40 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSET : :: : :. ..: ::: .. :. XP_011 YSSEEPGPSSKDTASKPSDEVEPKESELTKKTKKGLKTKGVIYECNICGARYKKRDNYEA 610 620 630 640 650 660 50 60 70 80 pF1KB4 PKQNY-------RDISCLSSLKHGGEYFMDPVVPL-QGVPSMFGTTCEN---RKRRKEKS :. : . :: . . .: . : : . .::: : :::::::: XP_011 HKKYYCSELQIAKPISAGTHTSPEAEKSQIEHEPWSQMMHYKLGTTLELTPLRKRRKEKS 670 680 690 700 710 720 90 100 110 120 130 140 pF1KB4 VGDEEDTPMICS--SIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDP .::::. : . : : ..: : :: .: . :...: . .: : :.: XP_011 LGDEEEPPAFESTKSQFGSP-G--PSDAARNLPL-ESTKSPAEPSKSVPSLEGPTG-FQP 730 740 750 760 770 150 160 170 180 190 200 pF1KB4 CRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESA :. ::: : ..: :. .. :::::::.: ::.:.: XP_011 RTPK--PGSGSESGKE---------------RRTTSKEISVIQHTSS------FEKSDSL 780 790 800 810 210 220 230 240 250 260 pF1KB4 ELVACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRL : :: : :. ... : :: :: : .:.: ::.: XP_011 E--------QPSGLEGEDKPLAQFP-SPPPAPHGRSAHS----------------LQPKL 820 830 840 270 280 290 300 310 320 pF1KB4 VRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKK ::: ::::::: ::::::.:. : : ::::: .:::::::::.::.:::::::::::: XP_011 VRQPNIQVPEILVTEEPDRPDTEPEPPPKEPEK-TEEFQWPQRSQTLAQLPAEKLPPKKK 850 860 870 880 890 900 330 340 350 360 370 380 pF1KB4 RLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS-SSFSMSFEREETSKLSA-LPKQD :::::.: .:::::::::. . ::::::::::.: : :: : ::::.. .: : :..: XP_011 RLRLAEMAQSSGESSFESS-VPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSD 910 920 930 940 950 960 390 400 410 420 430 440 pF1KB4 EFGKHSEFLTVPAGSYSLSVPGHH-HQKEMRRCSSEQMP-CPHPAEVPEVRSKSFDYGNL : : :.. :.::.:: : .:::: .::: : : :.. :.::::::::.: XP_011 MRPK-------PLGTHMLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSL 970 980 990 1000 1010 450 460 470 480 490 pF1KB4 S----HAPVSGAAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMD--QSVKQEQLEH : ::. : . :.: ::.:::::::::.: :: :. ::. : .. : XP_011 SLTGPSAPAPVAPPARVAPP-ERRKCFLVRQASLSRPPE-SELEVAPKGRQESEEPQPSS 1020 1030 1040 1050 1060 1070 500 510 520 530 pF1KB4 LHAGLRSGW---------HHGPPAVLPPLQQEDP-GKQVAGPCP------PLSSGPLH-- . . .:. : :::. : :.. : : : :... ::: XP_011 SKPSAKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQTPLHEK 1080 1090 1100 1110 1120 1130 540 550 560 570 580 590 pF1KB4 --LAQP----QIMHMDSQESLRNPLIQPTSYMTSK-HLP-EQPHLFPHQETIPFSPIQNA : : ...:. ..: ..: . :. :.: : .: : : : :.: . XP_011 PYLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPT 1140 1150 1160 1170 1180 1190 600 610 620 630 640 pF1KB4 LF---QFQYPTVCMVH---LPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLE .. :.. : . : : .: .::: . .: :. : .: . .: ..:.. :. XP_011 VLHPGQLHLPQL-MPHPANIPFRQPP---SFLPMPY---PTSSALSSGFFLPLQSQFALQ 1200 1210 1220 1230 1240 650 660 670 680 690 700 pF1KB4 HVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTETPSEQVLQEDF : .. . : . : .:..:: :.. .. :: . :. . XP_011 L----PGDVESHLPQIKTSLAPLATGSAGLSPST---EYSSDIRLPPVAPPASSSAP--- 1250 1260 1270 1280 1290 710 720 730 740 750 pF1KB4 ASANAGSLQSLPGT----VVPVRIQTHVPSYGSVMYTSISQIL---GQNSPAIV-ICKVD .:: .: . : : :::::.::..:::::.:::..:::: .:.: : : . : . XP_011 TSAPPLALPACPDTMVSLVVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFE 1300 1310 1320 1330 1340 1350 760 770 780 790 800 810 pF1KB4 ENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL-CLPSTS : .. : : .: .. .: . . . ... : ..: ::: .:. . : XP_011 EPPSKGTTVCGADVHEVGPGPSGLSEEQSRAFPTPYLRVPVTLPERKGTSLSSESILSLE 1360 1370 1380 1390 1400 1410 820 830 840 850 860 870 pF1KB4 DSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYG-----QIVEELSAVELTNSDIK : .: :::::.::::.:::: :::.::::::::. ..:. :.: ::... XP_011 GSSSTAGGSKRVLSPAGSLELTMETQQQKRVKEEEASKADEKLELVKPCSVV-LTSTE-- 1420 1430 1440 1450 1460 1470 880 890 900 910 920 930 pF1KB4 KDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVS-PSSREPFPPSKEM : .::.: .: :: . . . :.: :: .::.... : . :. . :..: XP_011 -DGKRPEKSHLGNQGQGRRELEMLSSLSS-----DPSDTKEIPPLPHPALSHGTAPGSEA 1480 1490 1500 1510 1520 1530 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR : .. : :. : . . : . : : . :..: :: :: : : . .: XP_011 L--KEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LP-----LSETS---SR 1540 1550 1560 1570 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA : :.. :. : ...::::::.:::.::::.::: :::..:.: XP_011 P-------AKSQEGT------------DSKKVLQFPSLHTTTNVSWCYLNYIKPNHIQHA 1580 1590 1600 1610 1620 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA .:::::.:::: ::: :..::..:.:::::::.. : ::.:. .: .:.:. ::. XP_011 DRRSSVYAGWCISLYNPNLPGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSS 1630 1640 1650 1660 1670 1680 1120 1130 1140 1150 1160 pF1KB4 WK-QFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGY : ..:... . : . . .. :. .:. .:. . : .:.. :: ::::::::: XP_011 RKPRMTEVHLPS--LVSPEGQKDLARVEKEEERRGEPEEDAP-ASQRGEPARIKIFEGGY 1690 1700 1710 1720 1730 1170 1180 1190 1200 1210 1220 pF1KB4 KSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNL ::::.::::::::::::.:::::::::::::::::::::::::::::: :.::::::::: XP_011 KSNEEYVYVRGRGRGKYVCEECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNL 1740 1750 1760 1770 1780 1790 1230 1240 1250 1260 1270 1280 pF1KB4 TKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEE ::::::::: ::: : :: ... :.::. . .:: . .: . : .::::: :. XP_011 TKHMKSKAHSKKCQETGV----LEELEAEEGTS-DDLFQDSEGREGSEAVEEHQFSDLED 1800 1810 1820 1830 1840 1850 1290 1300 1310 1320 1330 1340 pF1KB4 SDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPP---RFSSLPVNVGAVPHGVP- :: .:.. :.:::::. ..: .:. . :.. : :: : .: :. .: : .: XP_011 SD---SDSDLDEDEDEDEEESQDELS-RPSSEAPPPGPPHALRADSSPI-LGPQPPDAPA 1860 1870 1880 1890 1900 1350 1360 1370 1380 1390 pF1KB4 --SDSSLGHSSLISYLVTLPSIRVT-QLM--------TPSDSCEDTQMTEYQRLFQSKST .... : : . .: : .. : : .: : : . . : XP_011 SGTEATRGSSVSEAERLTASSCSMSSQSMPGLPWLGPAPLGSVEKDTGSALSYKPVSPRR 1910 1920 1930 1940 1950 1960 1400 1410 1420 1430 1440 pF1KB4 DSEPDKDRLDIPSCMDEECMLPSEPSSSPRDFSPS-----SHHSSPGYDSSPCRDNSPKR :.:. . : .. . .. :::. ::. : : :: .: : . XP_011 PWSPSKEAGSRPPLARKHSLTKND--SSPQRCSPAREPQASAPSPPGLHVDPGRGMGA-- 1970 1980 1990 2000 2010 2020 1450 1460 1470 1480 1490 1500 pF1KB4 YLIPKGDLSPRRHLSPRRDLSPM-RHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGK .: : ::: .::: : :. :.:.:: .. . : . :: :: : :::. XP_011 --LPCG--SPRLQLSPLT-LCPLGRELAPRAHVLSKLEGTTDPGLPRY--SPTRRWSPGQ 2030 2040 2050 2060 2070 1510 1520 1530 1540 1550 1560 pF1KB4 DITARRDLSPRRERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGPPNL--RRGLP . :. : . .. .:. : :.: :.. .: :: :: .. : XP_011 AESPPRSAPPGK-----WALAGPGSPSAGEHGPGLGL------DPRVLFPPAPLPHKLLS 2080 2090 2100 2110 2120 1570 1580 1590 1600 pF1KB4 QVPYFSLYGDQEGAYEHPGSSLFPEGP---------NDY-----------VFSHLPLHSQ . : :.. . :. : : : .:. .::::::::: XP_011 RSPETCASPWQKAESRSPSCSPGPAHPLSSRPFSALHDFHGHILARTEENIFSHLPLHSQ 2130 2140 2150 2160 2170 2180 1610 1620 1630 1640 1650 1660 pF1KB4 QQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEKKGASGESFSKDPYVLS . .::: :..:.::::::.. : : .: :.:: . :: . :.: . ... . XP_011 HLTRAPCPLIPIGGIQMVQARPGAHPTLLPGPTAAW-VSGF--SGGGSDLTGARE----A 2190 2200 2210 2220 2230 1670 1680 1690 1700 1710 1720 pF1KB4 KQHEKRGPHALQSSG-PPSTPSSPRLLMKQSTSEDSLNATEREQEENIQTCTKAIASLRI ... . .: .:.. : . : : .. . : . :: . . . XP_011 QERGRWSPTESSSASVSPVAKVSKFTLSSELEGGDYPKERERTGGGPGRPPDWTPHGTGA 2240 2250 2260 2270 2280 2290 1730 1740 1750 1760 1770 1780 pF1KB4 ATEEAALLGP-DQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTSATHPDLHDGEKDNF .: . .: : . .: :. .. : : : : .: ::: : XP_011 PAEPTPTHSPCTPPDTLPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPPLDRSSSVGCL 2300 2310 2320 2330 2340 2350 1790 1800 1810 1820 1830 pF1KB4 GTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKSQLH XP_011 AEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2360 2370 2380 2390 2400 >>XP_016857481 (OMIM: 606649) PREDICTED: transcription f (2406 aa) initn: 1696 init1: 614 opt: 1528 Z-score: 620.5 bits: 128.5 E(85289): 8e-28 Smith-Waterman score: 2686; 36.2% identity (56.2% similar) in 1880 aa overlap (11-1774:631-2348) 10 20 30 40 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSET : :: : :. ..: ::: .. :. XP_016 YSSEEPGPSSKDTASKPSDEVEPKESELTKKTKKGLKTKGVIYECNICGARYKKRDNYEA 610 620 630 640 650 660 50 60 70 80 pF1KB4 PKQNY-------RDISCLSSLKHGGEYFMDPVVPL-QGVPSMFGTTCEN---RKRRKEKS :. : . :: . . .: . : : . .::: : :::::::: XP_016 HKKYYCSELQIAKPISAGTHTSPEAEKSQIEHEPWSQMMHYKLGTTLELTPLRKRRKEKS 670 680 690 700 710 720 90 100 110 120 130 140 pF1KB4 VGDEEDTPMICS--SIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDP .::::. : . : : ..: : :: .: . :...: . .: : :.: XP_016 LGDEEEPPAFESTKSQFGSP-G--PSDAARNLPL-ESTKSPAEPSKSVPSLEGPTG-FQP 730 740 750 760 770 150 160 170 180 190 200 pF1KB4 CRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESA :. ::: : ..: :. .. :::::::.: ::.:.: XP_016 RTPK--PGSGSESGKE---------------RRTTSKEISVIQHTSS------FEKSDSL 780 790 800 810 210 220 230 240 250 260 pF1KB4 ELVACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRL : :: : :. ... : :: :: : .:.: ::.: XP_016 E--------QPSGLEGEDKPLAQFP-SPPPAPHGRSAHS----------------LQPKL 820 830 840 270 280 290 300 310 320 pF1KB4 VRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKK ::: ::::::: ::::::.:. : : ::::: .:::::::::.::.:::::::::::: XP_016 VRQPNIQVPEILVTEEPDRPDTEPEPPPKEPEK-TEEFQWPQRSQTLAQLPAEKLPPKKK 850 860 870 880 890 900 330 340 350 360 370 380 pF1KB4 RLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS-SSFSMSFEREETSKLSA-LPKQD :::::.: .:::::::::. . ::::::::::.: : :: : ::::.. .: : :..: XP_016 RLRLAEMAQSSGESSFESS-VPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSD 910 920 930 940 950 960 390 400 410 420 430 440 pF1KB4 EFGKHSEFLTVPAGSYSLSVPGHH-HQKEMRRCSSEQMP-CPHPAEVPEVRSKSFDYGNL : : :.. :.::.:: : .:::: .::: : : :.. :.::::::::.: XP_016 MRPK-------PLGTHMLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSL 970 980 990 1000 1010 450 460 470 480 490 pF1KB4 S----HAPVSGAAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMD--QSVKQEQLEH : ::. : . :.: ::.:::::::::.: :: :. ::. : .. : XP_016 SLTGPSAPAPVAPPARVAPP-ERRKCFLVRQASLSRPPE-SELEVAPKGRQESEEPQPSS 1020 1030 1040 1050 1060 1070 500 510 520 530 pF1KB4 LHAGLRSGW---------HHGPPAVLPPLQQEDP-GKQVAGPCP------PLSSGPLH-- . . .:. : :::. : :.. : : : :... ::: XP_016 SKPSAKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQTPLHEK 1080 1090 1100 1110 1120 1130 540 550 560 570 580 590 pF1KB4 --LAQP----QIMHMDSQESLRNPLIQPTSYMTSK-HLP-EQPHLFPHQETIPFSPIQNA : : ...:. ..: ..: . :. :.: : .: : : : :.: . XP_016 PYLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPT 1140 1150 1160 1170 1180 1190 600 610 620 630 640 pF1KB4 LF---QFQYPTVCMVH---LPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLE .. :.. : . : : .: .::: . .: :. : .: . .: ..:.. :. XP_016 VLHPGQLHLPQL-MPHPANIPFRQPP---SFLPMPY---PTSSALSSGFFLPLQSQFALQ 1200 1210 1220 1230 1240 650 660 670 680 690 700 pF1KB4 HVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTETPSEQVLQEDF : .. . : . : .:..:: :.. .. :: . :. . XP_016 L----PGDVESHLPQIKTSLAPLATGSAGLSPST---EYSSDIRLPPVAPPASSSAP--- 1250 1260 1270 1280 1290 710 720 730 740 750 pF1KB4 ASANAGSLQSLPGT----VVPVRIQTHVPSYGSVMYTSISQIL---GQNSPAIV-ICKVD .:: .: . : : :::::.::..:::::.:::..:::: .:.: : : . : . XP_016 TSAPPLALPACPDTMVSLVVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFE 1300 1310 1320 1330 1340 1350 760 770 780 790 800 810 pF1KB4 ENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL-CLPSTS : .. : : .: .. .: . . . ... : ..: ::: .:. . : XP_016 EPPSKGTTVCGADVHEVGPGPSGLSEEQSRAFPTPYLRVPVTLPERKGTSLSSESILSLE 1360 1370 1380 1390 1400 1410 820 830 840 850 860 870 pF1KB4 DSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYG-----QIVEELSAVELTNSDIK : .: :::::.::::.:::: :::.::::::::. ..:. :.: ::... XP_016 GSSSTAGGSKRVLSPAGSLELTMETQQQKRVKEEEASKADEKLELVKPCSVV-LTSTE-- 1420 1430 1440 1450 1460 1470 880 890 900 910 920 930 pF1KB4 KDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVS-PSSREPFPPSKEM : .::.: .: :: . . . :.: :: .::.... : . :. . :..: XP_016 -DGKRPEKSHLGNQGQGRRELEMLSSLSS-----DPSDTKEIPPLPHPALSHGTAPGSEA 1480 1490 1500 1510 1520 1530 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR : .. : :. : . . : . : : . :..: :: :: : : . .: XP_016 L--KEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LP-----LSETS---SR 1540 1550 1560 1570 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA : :.. :. : ...::::::.:::.::::.::: :::..:.: XP_016 P-------AKSQEGT------------DSKKVLQFPSLHTTTNVSWCYLNYIKPNHIQHA 1580 1590 1600 1610 1620 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA .:::::.:::: ::: :..::..:.:::::::.. : ::.:. .: .:.:. ::. XP_016 DRRSSVYAGWCISLYNPNLPGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSS 1630 1640 1650 1660 1670 1680 1120 1130 1140 1150 1160 pF1KB4 WK-QFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGY : ..:... . : . . .. :. .:. .:. . : .:.. :: ::::::::: XP_016 RKPRMTEVHLPS--LVSPEGQKDLARVEKEEERRGEPEEDAP-ASQRGEPARIKIFEGGY 1690 1700 1710 1720 1730 1170 1180 1190 1200 1210 1220 pF1KB4 KSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNL ::::.::::::::::::.:::::::::::::::::::::::::::::: :.::::::::: XP_016 KSNEEYVYVRGRGRGKYVCEECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNL 1740 1750 1760 1770 1780 1790 1230 1240 1250 1260 1270 1280 pF1KB4 TKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEE ::::::::: ::: : :: ... :.::. . .:: . .: . : .::::: :. XP_016 TKHMKSKAHSKKCQETGV----LEELEAEEGTS-DDLFQDSEGREGSEAVEEHQFSDLED 1800 1810 1820 1830 1840 1850 1290 1300 1310 1320 1330 1340 pF1KB4 SDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPP---RFSSLPVNVGAVPHGVP- :: .:.. :.:::::. ..: .:. . :.. : :: : .: :. .: : .: XP_016 SD---SDSDLDEDEDEDEEESQDELS-RPSSEAPPPGPPHALRADSSPI-LGPQPPDAPA 1860 1870 1880 1890 1900 1350 1360 1370 1380 1390 pF1KB4 --SDSSLGHSSLISYLVTLPSIRVT-QLM--------TPSDSCEDTQMTEYQRLFQSKST .... : : . .: : .. : : .: : : . . : XP_016 SGTEATRGSSVSEAERLTASSCSMSSQSMPGLPWLGPAPLGSVEKDTGSALSYKPVSPRR 1910 1920 1930 1940 1950 1960 1400 1410 1420 1430 1440 pF1KB4 DSEPDKDRLDIPSCMDEECMLPSEPSSSPRDFSPS-----SHHSSPGYDSSPCRDNSPKR :.:. . : .. . .. :::. ::. : : :: .: : . XP_016 PWSPSKEAGSRPPLARKHSLTKND--SSPQRCSPAREPQASAPSPPGLHVDPGRGMGA-- 1970 1980 1990 2000 2010 2020 1450 1460 1470 1480 1490 1500 pF1KB4 YLIPKGDLSPRRHLSPRRDLSPM-RHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGK .: : ::: .::: : :. :.:.:: .. . : . :: :: : :::. XP_016 --LPCG--SPRLQLSPLT-LCPLGRELAPRAHVLSKLEGTTDPGLPRY--SPTRRWSPGQ 2030 2040 2050 2060 2070 1510 1520 1530 1540 1550 1560 pF1KB4 DITARRDLSPRRERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGPPNL--RRGLP . :. : . .. .:. : :.: :.. .: :: :: .. : XP_016 AESPPRSAPPGK-----WALAGPGSPSAGEHGPGLGL------DPRVLFPPAPLPHKLLS 2080 2090 2100 2110 2120 1570 1580 1590 1600 pF1KB4 QVPYFSLYGDQEGAYEHPGSSLFPEGP---------NDY-----------VFSHLPLHSQ . : :.. . :. : : : .:. .::::::::: XP_016 RSPETCASPWQKAESRSPSCSPGPAHPLSSRPFSALHDFHGHILARTEENIFSHLPLHSQ 2130 2140 2150 2160 2170 2180 1610 1620 1630 1640 1650 1660 pF1KB4 QQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEKKGASGESFSKDPYVLS . .::: :..:.::::::.. : : .: :.:: . :: . :.: . ... . XP_016 HLTRAPCPLIPIGGIQMVQARPGAHPTLLPGPTAAW-VSGF--SGGGSDLTGARE----A 2190 2200 2210 2220 2230 1670 1680 1690 1700 1710 1720 pF1KB4 KQHEKRGPHALQSSG-PPSTPSSPRLLMKQSTSEDSLNATEREQEENIQTCTKAIASLRI ... . .: .:.. : . : : .. . : . :: . . . XP_016 QERGRWSPTESSSASVSPVAKVSKFTLSSELEGGDYPKERERTGGGPGRPPDWTPHGTGA 2240 2250 2260 2270 2280 2290 1730 1740 1750 1760 1770 1780 pF1KB4 ATEEAALLGP-DQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTSATHPDLHDGEKDNF .: . .: : . .: :. .. : : : : .: ::: : XP_016 PAEPTPTHSPCTPPDTLPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPPLDRSSSVGCL 2300 2310 2320 2330 2340 2350 1790 1800 1810 1820 1830 pF1KB4 GTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKSQLH XP_016 AEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2360 2370 2380 2390 2400 >>NP_078779 (OMIM: 606649) transcription factor HIVEP3 i (2406 aa) initn: 1696 init1: 614 opt: 1528 Z-score: 620.5 bits: 128.5 E(85289): 8e-28 Smith-Waterman score: 2686; 36.2% identity (56.2% similar) in 1880 aa overlap (11-1774:631-2348) 10 20 30 40 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSET : :: : :. ..: ::: .. :. NP_078 YSSEEPGPSSKDTASKPSDEVEPKESELTKKTKKGLKTKGVIYECNICGARYKKRDNYEA 610 620 630 640 650 660 50 60 70 80 pF1KB4 PKQNY-------RDISCLSSLKHGGEYFMDPVVPL-QGVPSMFGTTCEN---RKRRKEKS :. : . :: . . .: . : : . .::: : :::::::: NP_078 HKKYYCSELQIAKPISAGTHTSPEAEKSQIEHEPWSQMMHYKLGTTLELTPLRKRRKEKS 670 680 690 700 710 720 90 100 110 120 130 140 pF1KB4 VGDEEDTPMICS--SIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDP .::::. : . : : ..: : :: .: . :...: . .: : :.: NP_078 LGDEEEPPAFESTKSQFGSP-G--PSDAARNLPL-ESTKSPAEPSKSVPSLEGPTG-FQP 730 740 750 760 770 150 160 170 180 190 200 pF1KB4 CRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESA :. ::: : ..: :. .. :::::::.: ::.:.: NP_078 RTPK--PGSGSESGKE---------------RRTTSKEISVIQHTSS------FEKSDSL 780 790 800 810 210 220 230 240 250 260 pF1KB4 ELVACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRL : :: : :. ... : :: :: : .:.: ::.: NP_078 E--------QPSGLEGEDKPLAQFP-SPPPAPHGRSAHS----------------LQPKL 820 830 840 270 280 290 300 310 320 pF1KB4 VRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKK ::: ::::::: ::::::.:. : : ::::: .:::::::::.::.:::::::::::: NP_078 VRQPNIQVPEILVTEEPDRPDTEPEPPPKEPEK-TEEFQWPQRSQTLAQLPAEKLPPKKK 850 860 870 880 890 900 330 340 350 360 370 380 pF1KB4 RLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS-SSFSMSFEREETSKLSA-LPKQD :::::.: .:::::::::. . ::::::::::.: : :: : ::::.. .: : :..: NP_078 RLRLAEMAQSSGESSFESS-VPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSD 910 920 930 940 950 960 390 400 410 420 430 440 pF1KB4 EFGKHSEFLTVPAGSYSLSVPGHH-HQKEMRRCSSEQMP-CPHPAEVPEVRSKSFDYGNL : : :.. :.::.:: : .:::: .::: : : :.. :.::::::::.: NP_078 MRPK-------PLGTHMLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSL 970 980 990 1000 1010 450 460 470 480 490 pF1KB4 S----HAPVSGAAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMD--QSVKQEQLEH : ::. : . :.: ::.:::::::::.: :: :. ::. : .. : NP_078 SLTGPSAPAPVAPPARVAPP-ERRKCFLVRQASLSRPPE-SELEVAPKGRQESEEPQPSS 1020 1030 1040 1050 1060 1070 500 510 520 530 pF1KB4 LHAGLRSGW---------HHGPPAVLPPLQQEDP-GKQVAGPCP------PLSSGPLH-- . . .:. : :::. : :.. : : : :... ::: NP_078 SKPSAKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQTPLHEK 1080 1090 1100 1110 1120 1130 540 550 560 570 580 590 pF1KB4 --LAQP----QIMHMDSQESLRNPLIQPTSYMTSK-HLP-EQPHLFPHQETIPFSPIQNA : : ...:. ..: ..: . :. :.: : .: : : : :.: . NP_078 PYLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPT 1140 1150 1160 1170 1180 1190 600 610 620 630 640 pF1KB4 LF---QFQYPTVCMVH---LPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLE .. :.. : . : : .: .::: . .: :. : .: . .: ..:.. :. NP_078 VLHPGQLHLPQL-MPHPANIPFRQPP---SFLPMPY---PTSSALSSGFFLPLQSQFALQ 1200 1210 1220 1230 1240 650 660 670 680 690 700 pF1KB4 HVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTETPSEQVLQEDF : .. . : . : .:..:: :.. .. :: . :. . NP_078 L----PGDVESHLPQIKTSLAPLATGSAGLSPST---EYSSDIRLPPVAPPASSSAP--- 1250 1260 1270 1280 1290 710 720 730 740 750 pF1KB4 ASANAGSLQSLPGT----VVPVRIQTHVPSYGSVMYTSISQIL---GQNSPAIV-ICKVD .:: .: . : : :::::.::..:::::.:::..:::: .:.: : : . : . NP_078 TSAPPLALPACPDTMVSLVVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFE 1300 1310 1320 1330 1340 1350 760 770 780 790 800 810 pF1KB4 ENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL-CLPSTS : .. : : .: .. .: . . . ... : ..: ::: .:. . : NP_078 EPPSKGTTVCGADVHEVGPGPSGLSEEQSRAFPTPYLRVPVTLPERKGTSLSSESILSLE 1360 1370 1380 1390 1400 1410 820 830 840 850 860 870 pF1KB4 DSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYG-----QIVEELSAVELTNSDIK : .: :::::.::::.:::: :::.::::::::. ..:. :.: ::... NP_078 GSSSTAGGSKRVLSPAGSLELTMETQQQKRVKEEEASKADEKLELVKPCSVV-LTSTE-- 1420 1430 1440 1450 1460 1470 880 890 900 910 920 930 pF1KB4 KDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVS-PSSREPFPPSKEM : .::.: .: :: . . . :.: :: .::.... : . :. . :..: NP_078 -DGKRPEKSHLGNQGQGRRELEMLSSLSS-----DPSDTKEIPPLPHPALSHGTAPGSEA 1480 1490 1500 1510 1520 1530 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR : .. : :. : . . : . : : . :..: :: :: : : . .: NP_078 L--KEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LP-----LSETS---SR 1540 1550 1560 1570 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA : :.. :. : ...::::::.:::.::::.::: :::..:.: NP_078 P-------AKSQEGT------------DSKKVLQFPSLHTTTNVSWCYLNYIKPNHIQHA 1580 1590 1600 1610 1620 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA .:::::.:::: ::: :..::..:.:::::::.. : ::.:. .: .:.:. ::. NP_078 DRRSSVYAGWCISLYNPNLPGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSS 1630 1640 1650 1660 1670 1680 1120 1130 1140 1150 1160 pF1KB4 WK-QFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGY : ..:... . : . . .. :. .:. .:. . : .:.. :: ::::::::: NP_078 RKPRMTEVHLPS--LVSPEGQKDLARVEKEEERRGEPEEDAP-ASQRGEPARIKIFEGGY 1690 1700 1710 1720 1730 1170 1180 1190 1200 1210 1220 pF1KB4 KSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNL ::::.::::::::::::.:::::::::::::::::::::::::::::: :.::::::::: NP_078 KSNEEYVYVRGRGRGKYVCEECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNL 1740 1750 1760 1770 1780 1790 1230 1240 1250 1260 1270 1280 pF1KB4 TKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEE ::::::::: ::: : :: ... :.::. . .:: . .: . : .::::: :. NP_078 TKHMKSKAHSKKCQETGV----LEELEAEEGTS-DDLFQDSEGREGSEAVEEHQFSDLED 1800 1810 1820 1830 1840 1850 1290 1300 1310 1320 1330 1340 pF1KB4 SDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPP---RFSSLPVNVGAVPHGVP- :: .:.. :.:::::. ..: .:. . :.. : :: : .: :. .: : .: NP_078 SD---SDSDLDEDEDEDEEESQDELS-RPSSEAPPPGPPHALRADSSPI-LGPQPPDAPA 1860 1870 1880 1890 1900 1350 1360 1370 1380 1390 pF1KB4 --SDSSLGHSSLISYLVTLPSIRVT-QLM--------TPSDSCEDTQMTEYQRLFQSKST .... : : . .: : .. : : .: : : . . : NP_078 SGTEATRGSSVSEAERLTASSCSMSSQSMPGLPWLGPAPLGSVEKDTGSALSYKPVSPRR 1910 1920 1930 1940 1950 1960 1400 1410 1420 1430 1440 pF1KB4 DSEPDKDRLDIPSCMDEECMLPSEPSSSPRDFSPS-----SHHSSPGYDSSPCRDNSPKR :.:. . : .. . .. :::. ::. : : :: .: : . NP_078 PWSPSKEAGSRPPLARKHSLTKND--SSPQRCSPAREPQASAPSPPGLHVDPGRGMGA-- 1970 1980 1990 2000 2010 2020 1450 1460 1470 1480 1490 1500 pF1KB4 YLIPKGDLSPRRHLSPRRDLSPM-RHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGK .: : ::: .::: : :. :.:.:: .. . : . :: :: : :::. NP_078 --LPCG--SPRLQLSPLT-LCPLGRELAPRAHVLSKLEGTTDPGLPRY--SPTRRWSPGQ 2030 2040 2050 2060 2070 1510 1520 1530 1540 1550 1560 pF1KB4 DITARRDLSPRRERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGPPNL--RRGLP . :. : . .. .:. : :.: :.. .: :: :: .. : NP_078 AESPPRSAPPGK-----WALAGPGSPSAGEHGPGLGL------DPRVLFPPAPLPHKLLS 2080 2090 2100 2110 2120 1570 1580 1590 1600 pF1KB4 QVPYFSLYGDQEGAYEHPGSSLFPEGP---------NDY-----------VFSHLPLHSQ . : :.. . :. : : : .:. .::::::::: NP_078 RSPETCASPWQKAESRSPSCSPGPAHPLSSRPFSALHDFHGHILARTEENIFSHLPLHSQ 2130 2140 2150 2160 2170 2180 1610 1620 1630 1640 1650 1660 pF1KB4 QQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEKKGASGESFSKDPYVLS . .::: :..:.::::::.. : : .: :.:: . :: . :.: . ... . NP_078 HLTRAPCPLIPIGGIQMVQARPGAHPTLLPGPTAAW-VSGF--SGGGSDLTGARE----A 2190 2200 2210 2220 2230 1670 1680 1690 1700 1710 1720 pF1KB4 KQHEKRGPHALQSSG-PPSTPSSPRLLMKQSTSEDSLNATEREQEENIQTCTKAIASLRI ... . .: .:.. : . : : .. . : . :: . . . NP_078 QERGRWSPTESSSASVSPVAKVSKFTLSSELEGGDYPKERERTGGGPGRPPDWTPHGTGA 2240 2250 2260 2270 2280 2290 1730 1740 1750 1760 1770 1780 pF1KB4 ATEEAALLGP-DQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTSATHPDLHDGEKDNF .: . .: : . .: :. .. : : : : .: ::: : NP_078 PAEPTPTHSPCTPPDTLPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPPLDRSSSVGCL 2300 2310 2320 2330 2340 2350 1790 1800 1810 1820 1830 pF1KB4 GTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKSQLH NP_078 AEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2360 2370 2380 2390 2400 >>XP_016857482 (OMIM: 606649) PREDICTED: transcription f (2406 aa) initn: 1696 init1: 614 opt: 1528 Z-score: 620.5 bits: 128.5 E(85289): 8e-28 Smith-Waterman score: 2686; 36.2% identity (56.2% similar) in 1880 aa overlap (11-1774:631-2348) 10 20 30 40 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSET : :: : :. ..: ::: .. :. XP_016 YSSEEPGPSSKDTASKPSDEVEPKESELTKKTKKGLKTKGVIYECNICGARYKKRDNYEA 610 620 630 640 650 660 50 60 70 80 pF1KB4 PKQNY-------RDISCLSSLKHGGEYFMDPVVPL-QGVPSMFGTTCEN---RKRRKEKS :. : . :: . . .: . : : . .::: : :::::::: XP_016 HKKYYCSELQIAKPISAGTHTSPEAEKSQIEHEPWSQMMHYKLGTTLELTPLRKRRKEKS 670 680 690 700 710 720 90 100 110 120 130 140 pF1KB4 VGDEEDTPMICS--SIVSTPVGIMASDYDPKLQMQEGVRSGFAMAGHENLSHGHTERFDP .::::. : . : : ..: : :: .: . :...: . .: : :.: XP_016 LGDEEEPPAFESTKSQFGSP-G--PSDAARNLPL-ESTKSPAEPSKSVPSLEGPTG-FQP 730 740 750 760 770 150 160 170 180 190 200 pF1KB4 CRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLSRPNSFERSESA :. ::: : ..: :. .. :::::::.: ::.:.: XP_016 RTPK--PGSGSESGKE---------------RRTTSKEISVIQHTSS------FEKSDSL 780 790 800 810 210 220 230 240 250 260 pF1KB4 ELVACTQDKAPSPSETCDSEISEAPVSPEWAPPGDGAESGGKPSPSQQVQQQSYHTQPRL : :: : :. ... : :: :: : .:.: ::.: XP_016 E--------QPSGLEGEDKPLAQFP-SPPPAPHGRSAHS----------------LQPKL 820 830 840 270 280 290 300 310 320 pF1KB4 VRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKK ::: ::::::: ::::::.:. : : ::::: .:::::::::.::.:::::::::::: XP_016 VRQPNIQVPEILVTEEPDRPDTEPEPPPKEPEK-TEEFQWPQRSQTLAQLPAEKLPPKKK 850 860 870 880 890 900 330 340 350 360 370 380 pF1KB4 RLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS-SSFSMSFEREETSKLSA-LPKQD :::::.: .:::::::::. . ::::::::::.: : :: : ::::.. .: : :..: XP_016 RLRLAEMAQSSGESSFESS-VPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSD 910 920 930 940 950 960 390 400 410 420 430 440 pF1KB4 EFGKHSEFLTVPAGSYSLSVPGHH-HQKEMRRCSSEQMP-CPHPAEVPEVRSKSFDYGNL : : :.. :.::.:: : .:::: .::: : : :.. :.::::::::.: XP_016 MRPK-------PLGTHMLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSL 970 980 990 1000 1010 450 460 470 480 490 pF1KB4 S----HAPVSGAAASTVSPSRERKKCFLVRQASFSGSPEISQGEVGMD--QSVKQEQLEH : ::. : . :.: ::.:::::::::.: :: :. ::. : .. : XP_016 SLTGPSAPAPVAPPARVAPP-ERRKCFLVRQASLSRPPE-SELEVAPKGRQESEEPQPSS 1020 1030 1040 1050 1060 1070 500 510 520 530 pF1KB4 LHAGLRSGW---------HHGPPAVLPPLQQEDP-GKQVAGPCP------PLSSGPLH-- . . .:. : :::. : :.. : : : :... ::: XP_016 SKPSAKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQTPLHEK 1080 1090 1100 1110 1120 1130 540 550 560 570 580 590 pF1KB4 --LAQP----QIMHMDSQESLRNPLIQPTSYMTSK-HLP-EQPHLFPHQETIPFSPIQNA : : ...:. ..: ..: . :. :.: : .: : : : :.: . XP_016 PYLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPT 1140 1150 1160 1170 1180 1190 600 610 620 630 640 pF1KB4 LF---QFQYPTVCMVH---LPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLE .. :.. : . : : .: .::: . .: :. : .: . .: ..:.. :. XP_016 VLHPGQLHLPQL-MPHPANIPFRQPP---SFLPMPY---PTSSALSSGFFLPLQSQFALQ 1200 1210 1220 1230 1240 650 660 670 680 690 700 pF1KB4 HVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTETPSEQVLQEDF : .. . : . : .:..:: :.. .. :: . :. . XP_016 L----PGDVESHLPQIKTSLAPLATGSAGLSPST---EYSSDIRLPPVAPPASSSAP--- 1250 1260 1270 1280 1290 710 720 730 740 750 pF1KB4 ASANAGSLQSLPGT----VVPVRIQTHVPSYGSVMYTSISQIL---GQNSPAIV-ICKVD .:: .: . : : :::::.::..:::::.:::..:::: .:.: : : . : . XP_016 TSAPPLALPACPDTMVSLVVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFE 1300 1310 1320 1330 1340 1350 760 770 780 790 800 810 pF1KB4 ENMTQRTLVTNAAMQGIGFNIAQVLGQHAGLEKYPIWKAPQTLPLGLESSIPL-CLPSTS : .. : : .: .. .: . . . ... : ..: ::: .:. . : XP_016 EPPSKGTTVCGADVHEVGPGPSGLSEEQSRAFPTPYLRVPVTLPERKGTSLSSESILSLE 1360 1370 1380 1390 1400 1410 820 830 840 850 860 870 pF1KB4 DSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYG-----QIVEELSAVELTNSDIK : .: :::::.::::.:::: :::.::::::::. ..:. :.: ::... XP_016 GSSSTAGGSKRVLSPAGSLELTMETQQQKRVKEEEASKADEKLELVKPCSVV-LTSTE-- 1420 1430 1440 1450 1460 1470 880 890 900 910 920 930 pF1KB4 KDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVS-PSSREPFPPSKEM : .::.: .: :: . . . :.: :: .::.... : . :. . :..: XP_016 -DGKRPEKSHLGNQGQGRRELEMLSSLSS-----DPSDTKEIPPLPHPALSHGTAPGSEA 1480 1490 1500 1510 1520 1530 940 950 960 970 980 990 pF1KB4 LSGSRAPLPGQKSSGPSESKESSDELDIDETASDMSMSPQSSSLPAGDGQLEEEGKGHKR : .. : :. : . . : . : : . :..: :: :: : : . .: XP_016 L--KEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LP-----LSETS---SR 1540 1550 1560 1570 1000 1010 1020 1030 1040 1050 pF1KB4 PVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQA : :.. :. : ...::::::.:::.::::.::: :::..:.: XP_016 P-------AKSQEGT------------DSKKVLQFPSLHTTTNVSWCYLNYIKPNHIQHA 1580 1590 1600 1610 1620 1060 1070 1080 1090 1100 1110 pF1KB4 TFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSA .:::::.:::: ::: :..::..:.:::::::.. : ::.:. .: .:.:. ::. XP_016 DRRSSVYAGWCISLYNPNLPGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSS 1630 1640 1650 1660 1670 1680 1120 1130 1140 1150 1160 pF1KB4 WK-QFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGY : ..:... . : . . .. :. .:. .:. . : .:.. :: ::::::::: XP_016 RKPRMTEVHLPS--LVSPEGQKDLARVEKEEERRGEPEEDAP-ASQRGEPARIKIFEGGY 1690 1700 1710 1720 1730 1170 1180 1190 1200 1210 1220 pF1KB4 KSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNL ::::.::::::::::::.:::::::::::::::::::::::::::::: :.::::::::: XP_016 KSNEEYVYVRGRGRGKYVCEECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNL 1740 1750 1760 1770 1780 1790 1230 1240 1250 1260 1270 1280 pF1KB4 TKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEE ::::::::: ::: : :: ... :.::. . .:: . .: . : .::::: :. XP_016 TKHMKSKAHSKKCQETGV----LEELEAEEGTS-DDLFQDSEGREGSEAVEEHQFSDLED 1800 1810 1820 1830 1840 1850 1290 1300 1310 1320 1330 1340 pF1KB4 SDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPP---RFSSLPVNVGAVPHGVP- :: .:.. :.:::::. ..: .:. . :.. : :: : .: :. .: : .: XP_016 SD---SDSDLDEDEDEDEEESQDELS-RPSSEAPPPGPPHALRADSSPI-LGPQPPDAPA 1860 1870 1880 1890 1900 1350 1360 1370 1380 1390 pF1KB4 --SDSSLGHSSLISYLVTLPSIRVT-QLM--------TPSDSCEDTQMTEYQRLFQSKST .... : : . .: : .. : : .: : : . . : XP_016 SGTEATRGSSVSEAERLTASSCSMSSQSMPGLPWLGPAPLGSVEKDTGSALSYKPVSPRR 1910 1920 1930 1940 1950 1960 1400 1410 1420 1430 1440 pF1KB4 DSEPDKDRLDIPSCMDEECMLPSEPSSSPRDFSPS-----SHHSSPGYDSSPCRDNSPKR :.:. . : .. . .. :::. ::. : : :: .: : . XP_016 PWSPSKEAGSRPPLARKHSLTKND--SSPQRCSPAREPQASAPSPPGLHVDPGRGMGA-- 1970 1980 1990 2000 2010 2020 1450 1460 1470 1480 1490 1500 pF1KB4 YLIPKGDLSPRRHLSPRRDLSPM-RHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGK .: : ::: .::: : :. :.:.:: .. . : . :: :: : :::. XP_016 --LPCG--SPRLQLSPLT-LCPLGRELAPRAHVLSKLEGTTDPGLPRY--SPTRRWSPGQ 2030 2040 2050 2060 2070 1510 1520 1530 1540 1550 1560 pF1KB4 DITARRDLSPRRERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGPPNL--RRGLP . :. : . .. .:. : :.: :.. .: :: :: .. : XP_016 AESPPRSAPPGK-----WALAGPGSPSAGEHGPGLGL------DPRVLFPPAPLPHKLLS 2080 2090 2100 2110 2120 1570 1580 1590 1600 pF1KB4 QVPYFSLYGDQEGAYEHPGSSLFPEGP---------NDY-----------VFSHLPLHSQ . : :.. . :. : : : .:. .::::::::: XP_016 RSPETCASPWQKAESRSPSCSPGPAHPLSSRPFSALHDFHGHILARTEENIFSHLPLHSQ 2130 2140 2150 2160 2170 2180 1610 1620 1630 1640 1650 1660 pF1KB4 QQVRAPIPMVPVGGIQMVHSMPPALSSLHPSPTLPLPMEGFEEKKGASGESFSKDPYVLS . .::: :..:.::::::.. : : .: :.:: . :: . :.: . ... . XP_016 HLTRAPCPLIPIGGIQMVQARPGAHPTLLPGPTAAW-VSGF--SGGGSDLTGARE----A 2190 2200 2210 2220 2230 1670 1680 1690 1700 1710 1720 pF1KB4 KQHEKRGPHALQSSG-PPSTPSSPRLLMKQSTSEDSLNATEREQEENIQTCTKAIASLRI ... . .: .:.. : . : : .. . : . :: . . . XP_016 QERGRWSPTESSSASVSPVAKVSKFTLSSELEGGDYPKERERTGGGPGRPPDWTPHGTGA 2240 2250 2260 2270 2280 2290 1730 1740 1750 1760 1770 1780 pF1KB4 ATEEAALLGP-DQPARVQEPHQNPLGSAHVSIRHFSRPEPGQPCTSATHPDLHDGEKDNF .: . .: : . .: :. .. : : : : .: ::: : XP_016 PAEPTPTHSPCTPPDTLPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPPLDRSSSVGCL 2300 2310 2320 2330 2340 2350 1790 1800 1810 1820 1830 pF1KB4 GTSQTPLAHSTFYSKSCVDDKQLDFHSSKELSSSTEESKDPSSEKSQLH XP_016 AEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2360 2370 2380 2390 2400 >>XP_011512857 (OMIM: 194540) PREDICTED: zinc finger pro (2707 aa) initn: 761 init1: 629 opt: 934 Z-score: 386.8 bits: 85.4 E(85289): 8.4e-15 Smith-Waterman score: 2059; 33.5% identity (56.4% similar) in 1703 aa overlap (10-1644:935-2415) 10 20 30 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSE ...:: : . .. ..::. :.: :. : XP_011 GQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFECETCRNRYRKLENFE 910 920 930 940 950 960 40 50 60 70 80 pF1KB4 TPKQNY-------RDISCLSSLKH----GGEYFMDPVV---PLQGVPSMFGTTCENRKRR . :. : . . .: :: ..: . . : ... : . :::: XP_011 NHKKFYCSELHGPKTKVAMREPEHSPVPGG---LQPQILHYRVAGSSGIWEQTPQIRKRR 970 980 990 1000 1010 1020 90 100 110 120 130 pF1KB4 KEKSVGDEEDTPMICSSIV-STPVGIM---ASDYDPKLQMQE-GVRSGFAMAGHENL--- : :::::.:. . :. .. :.. : .:.: .. .:: :.:. XP_011 KMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD---QQHKNIQLQ 1030 1040 1050 1060 1070 140 150 160 170 180 190 pF1KB4 -SHGHTERFDPCRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLS :: : : : . . : . :.. :. .::. .: . :. ::::::::::: XP_011 NSHIHLVARGP--EQTMDPKLSTIMEQQISSAAQDKI-EL---QRHGTGISVIQHTNSLS 1080 1090 1100 1110 1120 1130 200 210 220 230 240 pF1KB4 RPNSFERSESAELVACTQDKAPSPSETCDSEISEAPVSPEWAPPG-DGAESG-------- :::::.. : : .. .. . . . : .. .: : . :. ::.. XP_011 RPNSFDKPEPFERASPVSFQELNRTGKSGS-LKVIGISQEESHPSRDGSHPHQLALSDAL 1140 1150 1160 1170 1180 1190 250 260 270 280 290 300 pF1KB4 -GKPSPSQQVQQQSYHT--QP-RLVRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVE :. . :.. . . :. :: ::::::::::::: ::::::. . ::: .. :: : XP_011 RGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDR---DLEAQCHDQEKS-E 1200 1210 1220 1230 1240 310 320 330 340 350 360 pF1KB4 EFQWPQRSETLSQLPAEKLPPKKKRLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS .:.:::::::::.::.:::::::::::::..:::: ::::.:: :::: :.::.:::. XP_011 KFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDST---LSRSLSRESSLSHT 1250 1260 1270 1280 1290 1300 370 380 390 400 410 420 pF1KB4 SSFSMSFEREETSKLSALPKQDEFGKHSEFLTVPAGSYSLSVPGHHHQKEMRRCSSEQMP :::: :.. :..:: : :: : : ...::: .::: .:.::: : .:::: .:::. XP_011 SSFSASLDIEDVSKTEASPKID-FLNKAEFLMIPAGLNTLNVPGCH--REMRRTASEQIN 1310 1320 1330 1340 1350 1360 430 440 450 460 pF1KB4 CPHPA-EVPEVRSKSFDYGNLSH---APVSGAAASTVSPSR----------ERKKCFLVR : . . :: ..:::::: :... .:.. . :::: ::.. ::: XP_011 CTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPS-SPSRVGVTGHVPLLERRRGPLVR 1370 1380 1390 1400 1410 1420 470 480 490 500 510 520 pF1KB4 QASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGPPAVLPPLQQEDPGKQVAGP : :.. .:. . : : .. : ..: ..:: . : . XP_011 QISLNIAPDSHLSPV-HPTSFQNTALPSVNAVP----YQGPQLTSTSLAE---------- 1430 1440 1450 1460 530 540 550 560 570 580 pF1KB4 CPPLSSGPLHLAQPQIMHMDSQESLRNPL-IQPTSYMTSKHLPEQPHLFPHQETIPFSPI .:.. :: .: :. .... : . . :.. . . .: .: : : ... .: . XP_011 ---FSANTLH-SQTQVKDLQAETSNSSSTNVFPVQQLCDINLLNQIHAPPSHQSTQLS-L 1470 1480 1490 1500 1510 1520 590 600 610 620 630 640 pF1KB4 QNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLEHVA : . : . : : ... . : . : : . :: :: :.. . XP_011 QVST-QGSKPDKNSVLSGSSKS---EDCFAPKYQLHCQVFTSGPSC-----SSNPVHSLP 1530 1540 1550 1560 1570 650 660 670 680 690 700 pF1KB4 EHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLP-KFPSDQSSKSTETPSEQVLQEDFAS ... . :. : : ..:. :: :. ...:.. : : . ..: XP_011 NQVISDPVGTDH-------CVTSAT-------LPTKLIDSMSNSHPLLPPEL---RPLGS 1580 1590 1600 1610 710 720 730 740 750 760 pF1KB4 ANAGSLQSLPGT-VVPVRIQTHVPSYGSVMYTSISQIL-GQNSPAIVICKVDENMTQRTL ..:..:.. ..:.:.:. ::.: . ::. ::: :. : ::....... . XP_011 ----QVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPISE 1620 1630 1640 1650 1660 1670 770 780 790 800 810 pF1KB4 VTNAA--MQGIGFNIA------QVLGQHAGLEKYPIWKAPQTLPLGLESSIPLCLPSTSD :.. .: : . : . : ... : . ..::. . :. :. . XP_011 EQNSVPTLQK-GHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES 1680 1690 1700 1710 1720 820 830 840 850 860 870 pF1KB4 SVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQI-VEELSAVELTNSDIKKDLSR :.. ::::::::.::.. :: :.:::.:.:. : . . .. .: .: .. . :. XP_011 SAS----SKRMLSPANSLDIAME-KHQKRAKDEN--GAVCATDVRPLEALSSRVN-EASK 1730 1740 1750 1760 1770 1780 880 890 900 910 920 930 pF1KB4 PQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFPPSKEMLSGSRA .:: :::: :..:: ::.. .. :: .: :.. .:. .. : :. : . XP_011 QKKPILVRQVCTTEPLDGVMLEKDVFS--QPEISNE--AVNLTNVLPADNSSTGCSKFVV 1790 1800 1810 1820 1830 940 950 960 970 980 990 pF1KB4 PLPGQKSSGPSESKESSDELDIDETASDM-SMSPQSSSLPAGDGQLEEEGKGHKRPVGML : .. . :. .:: : . .: : . . : : :.. :... : : : XP_011 IEPISELQ-EFENIKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQ-GDK 1840 1850 1860 1870 1880 1890 1000 1010 1020 1030 1040 1050 pF1KB4 VRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQATFKSS : . . : ..: : .. : :: : ::::.:::. .::.: : .. : :.: XP_011 VNIQEQSQQPV--TSLSLFNIKDTQQ-LAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTS 1900 1910 1920 1930 1940 1950 1060 1070 1080 1090 1100 1110 pF1KB4 VYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSAWKQFT .:..: .:. :::: :: ::..:::: :::. .: : . . :. :: :: . XP_011 AYTDWTVSASNPNPLGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWK--S 1960 1970 1980 1990 2000 2010 1120 1130 1140 1150 1160 1170 pF1KB4 QMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGYKSNEDY ... : .:.. . .: :. .. . . ::. . ..:: :::::.:::::::.: XP_011 SLSKRA---LGNQ-KSTVVEFSNKDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEY 2020 2030 2040 2050 2060 1180 1190 1200 1210 1220 1230 pF1KB4 VYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNLTKHMKS ::::::::::::::::::::::::::::::::::::::: : :::.::::::::::::: XP_011 VYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKS 2070 2080 2090 2100 2110 2120 1240 1250 1260 1270 1280 1290 pF1KB4 KAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEESDGEDG ::: :::..::::. .:. .:::.. ::. .: . . : ::::: : XP_011 KAHSKKCVDLGVSVGLIDEQDTEESD---------EKQRFSYERSGY---DLEESDGPDE 2130 2140 2150 2160 2170 1300 1310 1320 1330 1340 1350 pF1KB4 DDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPHGVPSDSSLGHSSL :::...:.::: ....:. .:. : .: : :. .:: ::: XP_011 DDNENEDDDED-----------SQAESV------LSATP-SVTASPQHLPSRSSL----- 2180 2190 2200 2210 1360 1370 1380 1390 1400 1410 pF1KB4 ISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDRLDI-PSCMDEECM . : .. ::...:. :.. :: : .:. : . . XP_011 ---------------QDPVSTDEDVRITD---CFSGVHTD--P----MDVLPRALLTRMT 2220 2230 2240 1420 1430 1440 1450 1460 1470 pF1KB4 LPSEPSSSPRDFSPSSHHSSPGYDSSPCRDNSPKRYLIPKGDLSPRRHLSPRRDLSPMRH . : .: :.. .. ::: .. : . ::. : : : :: ...: XP_011 VLSTAQS---DYNRKT--LSPG--KARQRAARDENDTIPSVDTS-R---SPCHQMSVDY- 2250 2260 2270 2280 2290 1480 1490 1500 1510 1520 1530 pF1KB4 LSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRRERRYMTTIRAPSPR :..: :: :. :: .. . :: ...: : : XP_011 --PESEEILRSSMA------------------GKAVAITQ--SP-------SSVRLP-PA 2300 2310 2320 1540 1550 1560 1570 1580 1590 pF1KB4 RALYHNPPLSMGQYLQAEPIVLGP-PNLRRGLPQVPYFSLYGDQEGAYEHPGSSLFPEGP : :.: . :. : : .: :. :: .: :: .: .: XP_011 -AAEHSPQTAAGM-----PSVASPHPD-----PQ-----EQKQQITLQPTPG---LP-SP 2330 2340 2350 2360 1600 1610 1620 1630 1640 1650 pF1KB4 NDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPAL--SSLHPSPTLPLPMEGFEEKK . ..::::::::::: :.: ::::::: : .: .: :.. : . :. . XP_011 HTHLFSHLPLHSQQQSRTPYNMVPVGGI---HVVPAGLTYSTFVPLQAGPVQLTIPAVSV 2370 2380 2390 2400 2410 2420 1660 1670 1680 1690 1700 1710 pF1KB4 GASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQSTSEDSLNATEREQEE XP_011 VHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSM 2430 2440 2450 2460 2470 2480 >>XP_011512855 (OMIM: 194540) PREDICTED: zinc finger pro (2718 aa) initn: 761 init1: 629 opt: 934 Z-score: 386.8 bits: 85.4 E(85289): 8.4e-15 Smith-Waterman score: 2059; 33.5% identity (56.4% similar) in 1703 aa overlap (10-1644:946-2426) 10 20 30 pF1KB4 MLKGISSSSLKEKKLSPGDRVGYDYDVCRKPYKKWEDSE ...:: : . .. ..::. :.: :. : XP_011 GQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFECETCRNRYRKLENFE 920 930 940 950 960 970 40 50 60 70 80 pF1KB4 TPKQNY-------RDISCLSSLKH----GGEYFMDPVV---PLQGVPSMFGTTCENRKRR . :. : . . .: :: ..: . . : ... : . :::: XP_011 NHKKFYCSELHGPKTKVAMREPEHSPVPGG---LQPQILHYRVAGSSGIWEQTPQIRKRR 980 990 1000 1010 1020 1030 90 100 110 120 130 pF1KB4 KEKSVGDEEDTPMICSSIV-STPVGIM---ASDYDPKLQMQE-GVRSGFAMAGHENL--- : :::::.:. . :. .. :.. : .:.: .. .:: :.:. XP_011 KMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD---QQHKNIQLQ 1040 1050 1060 1070 1080 140 150 160 170 180 190 pF1KB4 -SHGHTERFDPCRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPGNVISVIQHTNSLS :: : : : . . : . :.. :. .::. .: . :. ::::::::::: XP_011 NSHIHLVARGP--EQTMDPKLSTIMEQQISSAAQDKI-EL---QRHGTGISVIQHTNSLS 1090 1100 1110 1120 1130 1140 200 210 220 230 240 pF1KB4 RPNSFERSESAELVACTQDKAPSPSETCDSEISEAPVSPEWAPPG-DGAESG-------- :::::.. : : .. .. . . . : .. .: : . :. ::.. XP_011 RPNSFDKPEPFERASPVSFQELNRTGKSGS-LKVIGISQEESHPSRDGSHPHQLALSDAL 1150 1160 1170 1180 1190 1200 250 260 270 280 290 300 pF1KB4 -GKPSPSQQVQQQSYHT--QP-RLVRQHNIQVPEIRVTEEPDKPEKEKEAQSKEPEKPVE :. . :.. . . :. :: ::::::::::::: ::::::. . ::: .. :: : XP_011 RGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDR---DLEAQCHDQEKS-E 1210 1220 1230 1240 1250 310 320 330 340 350 360 pF1KB4 EFQWPQRSETLSQLPAEKLPPKKKRLRLADMEHSSGESSFESTGTGLSRSPSQESNLSHS .:.:::::::::.::.:::::::::::::..:::: ::::.:: :::: :.::.:::. XP_011 KFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDST---LSRSLSRESSLSHT 1260 1270 1280 1290 1300 1310 370 380 390 400 410 420 pF1KB4 SSFSMSFEREETSKLSALPKQDEFGKHSEFLTVPAGSYSLSVPGHHHQKEMRRCSSEQMP :::: :.. :..:: : :: : : ...::: .::: .:.::: : .:::: .:::. XP_011 SSFSASLDIEDVSKTEASPKID-FLNKAEFLMIPAGLNTLNVPGCH--REMRRTASEQIN 1320 1330 1340 1350 1360 1370 430 440 450 460 pF1KB4 CPHPA-EVPEVRSKSFDYGNLSH---APVSGAAASTVSPSR----------ERKKCFLVR : . . :: ..:::::: :... .:.. . :::: ::.. ::: XP_011 CTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPS-SPSRVGVTGHVPLLERRRGPLVR 1380 1390 1400 1410 1420 1430 470 480 490 500 510 520 pF1KB4 QASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGPPAVLPPLQQEDPGKQVAGP : :.. .:. . : : .. : ..: ..:: . : . XP_011 QISLNIAPDSHLSPV-HPTSFQNTALPSVNAVP----YQGPQLTSTSLAE---------- 1440 1450 1460 1470 530 540 550 560 570 580 pF1KB4 CPPLSSGPLHLAQPQIMHMDSQESLRNPL-IQPTSYMTSKHLPEQPHLFPHQETIPFSPI .:.. :: .: :. .... : . . :.. . . .: .: : : ... .: . XP_011 ---FSANTLH-SQTQVKDLQAETSNSSSTNVFPVQQLCDINLLNQIHAPPSHQSTQLS-L 1480 1490 1500 1510 1520 1530 590 600 610 620 630 640 pF1KB4 QNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQTEIHSSYPLEHVA : . : . : : ... . : . : : . :: :: :.. . XP_011 QVST-QGSKPDKNSVLSGSSKS---EDCFAPKYQLHCQVFTSGPSC-----SSNPVHSLP 1540 1550 1560 1570 1580 650 660 670 680 690 700 pF1KB4 EHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLP-KFPSDQSSKSTETPSEQVLQEDFAS ... . :. : : ..:. :: :. ...:.. : : . ..: XP_011 NQVISDPVGTDH-------CVTSAT-------LPTKLIDSMSNSHPLLPPEL---RPLGS 1590 1600 1610 1620 710 720 730 740 750 760 pF1KB4 ANAGSLQSLPGT-VVPVRIQTHVPSYGSVMYTSISQIL-GQNSPAIVICKVDENMTQRTL ..:..:.. ..:.:.:. ::.: . ::. ::: :. : ::....... . XP_011 ----QVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPISE 1630 1640 1650 1660 1670 1680 770 780 790 800 810 pF1KB4 VTNAA--MQGIGFNIA------QVLGQHAGLEKYPIWKAPQTLPLGLESSIPLCLPSTSD :.. .: : . : . : ... : . ..::. . :. :. . XP_011 EQNSVPTLQK-GHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES 1690 1700 1710 1720 1730 1740 820 830 840 850 860 870 pF1KB4 SVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQI-VEELSAVELTNSDIKKDLSR :.. ::::::::.::.. :: :.:::.:.:. : . . .. .: .: .. . :. XP_011 SAS----SKRMLSPANSLDIAME-KHQKRAKDEN--GAVCATDVRPLEALSSRVN-EASK 1750 1760 1770 1780 1790 880 890 900 910 920 930 pF1KB4 PQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFPPSKEMLSGSRA .:: :::: :..:: ::.. .. :: .: :.. .:. .. : :. : . XP_011 QKKPILVRQVCTTEPLDGVMLEKDVFS--QPEISNE--AVNLTNVLPADNSSTGCSKFVV 1800 1810 1820 1830 1840 940 950 960 970 980 990 pF1KB4 PLPGQKSSGPSESKESSDELDIDETASDM-SMSPQSSSLPAGDGQLEEEGKGHKRPVGML : .. . :. .:: : . .: : . . : : :.. :... : : : XP_011 IEPISELQ-EFENIKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQ-GDK 1850 1860 1870 1880 1890 1900 1000 1010 1020 1030 1040 1050 pF1KB4 VRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYTKPNYVQQATFKSS : . . : ..: : .. : :: : ::::.:::. .::.: : .. : :.: XP_011 VNIQEQSQQPV--TSLSLFNIKDTQQ-LAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTS 1910 1920 1930 1940 1950 1960 1060 1070 1080 1090 1100 1110 pF1KB4 VYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGTGKLTSSSAWKQFT .:..: .:. :::: :: ::..:::: :::. .: : . . :. :: :: . XP_011 AYTDWTVSASNPNPLGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWK--S 1970 1980 1990 2000 2010 2020 1120 1130 1140 1150 1160 1170 pF1KB4 QMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRIKIFEGGYKSNEDY ... : .:.. . .: :. .. . . ::. . ..:: :::::.:::::::.: XP_011 SLSKRA---LGNQ-KSTVVEFSNKDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEY 2030 2040 2050 2060 2070 1180 1190 1200 1210 1220 1230 pF1KB4 VYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFAFKTKGNLTKHMKS ::::::::::::::::::::::::::::::::::::::: : :::.::::::::::::: XP_011 VYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKS 2080 2090 2100 2110 2120 2130 1240 1250 1260 1270 1280 1290 pF1KB4 KAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDHQFSDAEESDGEDG ::: :::..::::. .:. .:::.. ::. .: . . : ::::: : XP_011 KAHSKKCVDLGVSVGLIDEQDTEESD---------EKQRFSYERSGY---DLEESDGPDE 2140 2150 2160 2170 2180 1300 1310 1320 1330 1340 1350 pF1KB4 DDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPHGVPSDSSLGHSSL :::...:.::: ....:. .:. : .: : :. .:: ::: XP_011 DDNENEDDDED-----------SQAESV------LSATP-SVTASPQHLPSRSSL----- 2190 2200 2210 2220 1360 1370 1380 1390 1400 1410 pF1KB4 ISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDRLDI-PSCMDEECM . : .. ::...:. :.. :: : .:. : . . XP_011 ---------------QDPVSTDEDVRITD---CFSGVHTD--P----MDVLPRALLTRMT 2230 2240 2250 1420 1430 1440 1450 1460 1470 pF1KB4 LPSEPSSSPRDFSPSSHHSSPGYDSSPCRDNSPKRYLIPKGDLSPRRHLSPRRDLSPMRH . : .: :.. .. ::: .. : . ::. : : : :: ...: XP_011 VLSTAQS---DYNRKT--LSPG--KARQRAARDENDTIPSVDTS-R---SPCHQMSVDY- 2260 2270 2280 2290 2300 1480 1490 1500 1510 1520 1530 pF1KB4 LSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRRERRYMTTIRAPSPR :..: :: :. :: .. . :: ...: : : XP_011 --PESEEILRSSMA------------------GKAVAITQ--SP-------SSVRLP-PA 2310 2320 2330 1540 1550 1560 1570 1580 1590 pF1KB4 RALYHNPPLSMGQYLQAEPIVLGP-PNLRRGLPQVPYFSLYGDQEGAYEHPGSSLFPEGP : :.: . :. : : .: :. :: .: :: .: .: XP_011 -AAEHSPQTAAGM-----PSVASPHPD-----PQ-----EQKQQITLQPTPG---LP-SP 2340 2350 2360 2370 1600 1610 1620 1630 1640 1650 pF1KB4 NDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPAL--SSLHPSPTLPLPMEGFEEKK . ..::::::::::: :.: ::::::: : .: .: :.. : . :. . XP_011 HTHLFSHLPLHSQQQSRTPYNMVPVGGI---HVVPAGLTYSTFVPLQAGPVQLTIPAVSV 2380 2390 2400 2410 2420 2430 1660 1670 1680 1690 1700 1710 pF1KB4 GASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQSTSEDSLNATEREQEE XP_011 VHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSM 2440 2450 2460 2470 2480 2490 1833 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 22:57:08 2016 done: Wed Nov 2 22:57:10 2016 Total Scan time: 18.940 Total Display time: 1.090 Function used was FASTA [36.3.4 Apr, 2011]