FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0298, 2718 aa
1>>>pF1KE0298 2718 - 2718 aa - 2718 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 15.1988+/-0.0017; mu= -19.9777+/- 0.099
mean_var=784.8906+/-206.708, 0's: 0 Z-trim(110.0): 9 B-trim: 614 in 1/51
Lambda= 0.045779
statistics sampled from 11298 (11303) to 11298 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.663), E-opt: 0.2 (0.347), width: 16
Scan time: 8.760
The best scores are: opt bits E(32554)
CCDS43426.1 HIVEP1 gene_id:3096|Hs108|chr6 (2718) 17896 1200.5 0
CCDS44124.1 HIVEP3 gene_id:59269|Hs108|chr1 (2405) 1059 88.4 5e-16
CCDS463.1 HIVEP3 gene_id:59269|Hs108|chr1 (2406) 1059 88.4 5e-16
CCDS43510.1 HIVEP2 gene_id:3097|Hs108|chr6 (2446) 934 80.2 1.6e-13
>>CCDS43426.1 HIVEP1 gene_id:3096|Hs108|chr6 (2718 aa)
initn: 17896 init1: 17896 opt: 17896 Z-score: 6410.3 bits: 1200.5 E(32554): 0
Smith-Waterman score: 17896; 99.9% identity (100.0% similar) in 2718 aa overlap (1-2718:1-2718)
10 20 30 40 50 60
pF1KE0 MPRTKQIHPRNLRDKIEEAQKELNGAEVSKKEILQAGVKGTSESLKGVKRKKIVAENHLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MPRTKQIHPRNLRDKIEEAQKELNGAEVSKKEILQAGVKGTSESLKGVKRKKIVAENHLK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 KIPKSPLRNPLQAKHKQNTEESSFAVLHSASESHKKQNYIPVKNGKQFTKQNGETPGIIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KIPKSPLRNPLQAKHKQNTEESSFAVLHSASESHKKQNYIPVKNGKQFTKQNGETPGIIA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 EASKSEESVSPKKPLFLQQPSELRRWRSEGADPAKFSDLDEQCDSSSLSSKTRTDNSECI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EASKSEESVSPKKPLFLQQPSELRRWRSEGADPAKFSDLDEQCDSSSLSSKTRTDNSECI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 SSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQKGSPCAIKTEKLRPNKTARSPPKLKNSS
:::::: :::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SSHCGTTSPSYTNTAFDVLLKAMEPELSTLSQKGSPCAIKTEKLRPNKTARSPPKLKNSS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 MDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQHEHFVPKSNQHNQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQHEHFVPKSNQHNQQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 LPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTPQNQQMDSASPLSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTPQNQQMDSASPLSI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 SPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 LLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHESP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHESP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 KALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAETLLKSSFTPSSPEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAETLLKSSFTPSSPEN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 VIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTN
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 VQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 KLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAALVTASTPS
:::::::::::::::::::::::::::::::::::::::::::::::::::::::.::::
CCDS43 KLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAALVTTSTPS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE0 ALPTGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ALPTGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSI
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE0 DSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSN
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE0 SMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE0 AIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE0 CETCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGGLQPQILHYRVAGSSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CETCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGGLQPQILHYRVAGSSG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE0 IWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE0 QQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSAAQDKIELQRHGTGISVIQHTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSAAQDKIELQRHGTGISVIQHTN
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE0 SLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGISQEESHPSRDGSHPHQLALSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGISQEESHPSRDGSHPHQLALSD
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE0 ALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDRDLEAQCHDQEKSEKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDRDLEAQCHDQEKSEKF
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE0 SWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDSTLSRSLSRESSLSHTSSFSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDSTLSRSLSRESSLSHTSSFSA
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE0 SLDIEDVSKTEASPKIDFLNKAEFLMIPAGLNTLNVPGCHREMRRTASEQINCTQTSMEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLDIEDVSKTEASPKIDFLNKAEFLMIPAGLNTLNVPGCHREMRRTASEQINCTQTSMEV
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE0 SDLRSKSFDCGSITPPQTTPLTELQPPSSPSRVGVTGHVPLLERRRGPLVRQISLNIAPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SDLRSKSFDCGSITPPQTTPLTELQPPSSPSRVGVTGHVPLLERRRGPLVRQISLNIAPD
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE0 SHLSPVHPTSFQNTALPSVNAVPYQGPQLTSTSLAEFSANTLHSQTQVKDLQAETSNSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SHLSPVHPTSFQNTALPSVNAVPYQGPQLTSTSLAEFSANTLHSQTQVKDLQAETSNSSS
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE0 TNVFPVQQLCDINLLNQIHAPPSHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCFAPKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TNVFPVQQLCDINLLNQIHAPPSHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCFAPKY
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE0 QLHCQVFTSGPSCSSNPVHSLPNQVISDPVGTDHCVTSATLPTKLIDSISNSHPLLPPEL
::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::
CCDS43 QLHCQVFTSGPSCSSNPVHSLPNQVISDPVGTDHCVTSATLPTKLIDSMSNSHPLLPPEL
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE0 RPLGSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RPLGSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPIS
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE0 EEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE0 SASSKRMLSPANSLDIAMEKHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SASSKRMLSPANSLDIAMEKHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVR
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE0 QVCTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QVCTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFEN
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE0 IKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQGDKVNIQEQSQQPVTSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQGDKVNIQEQSQQPVTSL
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE0 SLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNPLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNPLGL
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE0 PTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVEFSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVEFSN
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE0 KDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKP
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE0 SMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTE
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE0 ESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESVLSATPSVTASPQHLPSRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESVLSATPSVTASPQHLPSRS
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE0 SLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRMTVLSTAQSDYNRKTLSPGKARQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRMTVLSTAQSDYNRKTLSPGKARQR
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE0 AARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSMAGKAVAITQSPSSVRLPPAAAEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSMAGKAVAITQSPSSVRLPPAAAEH
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE0 SPQTAAGMPSVASPHPDPQEQKQQITLQPTPGLPSPHTHLFSHLPLHSQQQSRTPYNMVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SPQTAAGMPSVASPHPDPQEQKQQITLQPTPGLPSPHTHLFSHLPLHSQQQSRTPYNMVP
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE0 VGGIHVVPAGLTYSTFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VGGIHVVPAGLTYSTFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAEL
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE0 SSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAV
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KE0 GLQVLTANPSSQSSPAPQAHIPGLQILNIALPTLIPSVSQVAVDAQGAPEMPASQSKACE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GLQVLTANPSSQSSPAPQAHIPGLQILNIALPTLIPSVSQVAVDAQGAPEMPASQSKACE
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620 2630 2640
pF1KE0 TQPKQTSVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TQPKQTSVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAAS
2590 2600 2610 2620 2630 2640
2650 2660 2670 2680 2690 2700
pF1KE0 ANHVKPKPELTSIQGQPASTSQPLLKAHSEVFTKPSGQQTLSPDRQVPRPTALPRRQPTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ANHVKPKPELTSIQGQPASTSQPLLKAHSEVFTKPSGQQTLSPDRQVPRPTALPRRQPTV
2650 2660 2670 2680 2690 2700
2710
pF1KE0 HFSDVSSDDDEDRLVIAT
::::::::::::::::::
CCDS43 HFSDVSSDDDEDRLVIAT
2710
>>CCDS44124.1 HIVEP3 gene_id:59269|Hs108|chr1 (2405 aa)
initn: 1987 init1: 601 opt: 1059 Z-score: 401.1 bits: 88.4 E(32554): 5e-16
Smith-Waterman score: 2640; 31.0% identity (53.5% similar) in 2676 aa overlap (203-2707:1-2353)
180 190 200 210 220
pF1KE0 RTDNSECISSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQK---GSPCA--IKTEKLRPN
:.:: :. . : ::: : : .. .
CCDS44 MDPEQSVKGTKKAEGSPRKRLTKGEAIQ-T
10 20
230 240 250 260 270 280
pF1KE0 KTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQH
... : : ... . .. .:::.: . : ... .. .:. : .
CCDS44 SVSSSVPYPGSGTAATQESPAQELLAPQPFPGPSSVLREGSQEKTGQQQKPPKRPPIEAS
30 40 50 60 70 80
290 300 310 320 330 340
pF1KE0 EHFVPKSNQHNQQLPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTP
: . . :: : .: . . :.. . : . : ....:. . :
CCDS44 VH-ISQLPQH----PLTPAFMSPGKPEHLLEGSTWQLVDPMRPGPSGSFVAPG----LHP
90 100 110 120 130 140
350 360 370 380 390 400
pF1KE0 QNQQMDSASPLSISPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYI
:.: . : . . : : . : . . ..:. .. ... :..::.: ::::
CCDS44 QSQLLPSHASI-IPPEDLPGVPKVFVPRPSQVSLKPTEEAHK------KERKPQKPGKYI
150 160 170 180 190
410 420 430 440 450 460
pF1KE0 CEYCNRACAKPSVLLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQ
:.::.: ::::::: :::::::::::::: ::::::::::::::.::::: :: ::.
CCDS44 CQYCSRPCAKPSVLQKHIRSHTGERPYPCGPCGFSFKTKSNLYKHRKSHAHRIKAGLA--
200 210 220 230 240 250
470 480 490 500 510 520
pF1KE0 PDAGGLFLSHESPKALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAET
:: . :..: .. . : :: . . ... .: .:... : .
CCDS44 SGMGGEMY----PHGLEMERIPGEEFEEPTEGESTDSEEETSATSGHPAELSPR--PKQP
260 270 280 290 300
530 540 550 560 570 580
pF1KE0 LLKSSFTPSSPENVIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPEL
::.:.. :. .. . ..:. .:.. . : : . .: . .. :::
CCDS44 LLSSGLYSSGSHSSSHERCSLSQSSTAQSLEDPPPFV---------EPSSEHPLSHKPED
310 320 330 340 350
590 600 610 620 630 640
pF1KE0 SSAQKQKDLQVTNVQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQ
. . ::: :. .:.
CCDS44 THTIKQK---------LALRLSE-------------------------------------
360 370
650 660 670 680 690 700
pF1KE0 RQQATDYSQEQQGKLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPST-EQDSGRS
:... : :: .::: : :::.::::::::::.: ::::. :. ::
CCDS44 RKKVID---EQA--FLSPGSKGSTESGYFSRSESAEQQVSPPNTNAKSYAEIIFGKCGRI
380 390 400 410 420
710 720 730 740 750 760
pF1KE0 NGPSAALVTASTPSALP--TGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQL
. .: :...:: :: : .: :.: . : :...:. :.:::. :::.:: ...
CCDS44 GQRTAMLTATSTQPLLPLSTEDKPSLVP--LSVP-RTQVIEH-ITKLITINEAVVDTSEI
430 440 450 460 470 480
770 780 790 800 810 820
pF1KE0 DSVKPRRTSLSRRGSIDSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVF
:::::::.:::::.:..:::: .... :. :: :. : : :.: .
CCDS44 DSVKPRRSSLSRRSSMESPKSSLYRE-------PL----SSHSEKTK-P----EQS-LLS
490 500 510 520
830 840 850 860 870 880
pF1KE0 LLSVPSL-DCLPITRSNSMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGP
: :: .:. ::.:::... . : : ::.::: ::::.: : . .
CCDS44 LQHPPSTAPPVPLLRSHSMPSAACT-----ISTPHHPFRGSYSFDDHI----TDSEALSH
530 540 550 560 570
890 900 910 920 930 940
pF1KE0 NAPVPQSGHPRTLVRQAAIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQG
.. : : ::: : :: ::: ..: : : :.. .. . . . :..
CCDS44 SSHVFTS-HPRMLKRQPAIELPLGGEYSSEEPGPS---SKDTASKPSDEVEPKESELTK-
580 590 600 610 620 630
950 960 970 980 990
pF1KE0 PHIEKKKSHQGRGTMFECETCRNRYRKLENFENHKKFYCSELHGPKTKVAMR----EPEH
. ::. . .:...::. : ::.: .:.: :::.:::::. : : : :.
CCDS44 ---KTKKGLKTKGVIYECNICGARYKKRDNYEAHKKYYCSELQIAKPISAGTHTSPEAEK
640 650 660 670 680
1000 1010 1020 1030 1040 1050
pF1KE0 SPVPGGLQPQILHYRVAGSSGIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQ
: . :..::.. :.. : :: .::::: ::.::.:: :: : .: :
CCDS44 SQIEHEPWSQMMHYKL-GTT--LELTP-LRKRRKEKSLGDEEEPPAFESTKSQFGSPG--
690 700 710 720 730 740
1060 1070 1080 1090 1100 1110
pF1KE0 FQNALGCNPSLPKHNVTIRSDQQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSA
:: .:. ..: .. . . . . .:: ..:. . .:.
CCDS44 --------PSDAARNLPLESTKSPAEPSKSVPSL----EGPTG-FQPRTP-----KPGSG
750 760 770 780
1120 1130 1140 1150 1160 1170
pF1KE0 AQDKIELQRHGTGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGI
... : . . :::::::.:. . .:...: .: :.. :
CCDS44 SESGKERRTTSKEISVIQHTSSFEKSDSLEQPSGLE-------------GEDKPL-----
790 800 810 820
1180 1190 1200 1210 1220 1230
pF1KE0 SQEESHPSRDGSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILV
.: : : :: .:.. : : :: .:::: :::::::::
CCDS44 AQFPSPPPA----PH---------------GRSA----HSL-QP-KLVRQPNIQVPEILV
830 840 850 860
1240 1250 1260 1270 1280 1290
pF1KE0 TEEPDR-DLEAQC--HDQEKSEKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTES
:::::: : : . .. ::.:.:.:::::.::..::.::::::::::::::. .:: ::
CCDS44 TEEPDRPDTEPEPPPKEPEKTEEFQWPQRSQTLAQLPAEKLPPKKKRLRLAEMAQSSGES
870 880 890 900 910 920
1300 1310 1320 1330 1340 1350
pF1KE0 SFDST--LSRSLSRESSLSHT-SSFSASLDIEDVSKTEA-SPKIDFLNKAEFLMIPAGLN
::.:. :::: :.::..: . :: :::.. .: .:.:: ::. :. : : : .
CCDS44 SFESSVPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSDMRPK------PLGTH
930 940 950 960 970
1360 1370 1380 1390 1400
pF1KE0 TLNVPGCH---REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPSS
:.::. : :::::.:::: .. : .... :::::: ::.. : ::.
CCDS44 MLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSLS---------LTGPSA
980 990 1000 1010 1020
1410 1420 1430 1440 1450 1460
pF1KE0 PSRVGVTGHVPLLERRRGPLVRQISLNIAPDSHLSPVHPTSFQNTALPSVNAVPYQGPQL
:. :. ..: :::. :::: ::. :.:.: : : . :.. :. : ..
CCDS44 PAPVAPPARVAPPERRKCFLVRQASLSRPPESELE-VAPKGRQESEEPQ----PSSSKPS
1030 1040 1050 1060 1070 1080
1470 1480 1490 1500 1510
pF1KE0 TSTSLAEFS-ANTLHS-----QTQVKD---LQAETSNSSSTNVF--PVQQLCDINLLNQI
...::...: : : :. . .: : . . . .:: :: : : ..
CCDS44 AKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQT---PLHEKP
1090 1100 1110 1120 1130
1520 1530 1540 1550 1560
pF1KE0 HAPP-----------SHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCF-APKYQLHCQV
. :: .:. : :::. . .: : . : :: :. :
CCDS44 YLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPTV
1140 1150 1160 1170 1180 1190
1570 1580 1590 1600 1610
pF1KE0 FTSG----PSCSSNPVH---SLPNQVISDPVGTDHCVTSAT-LPTK-----LIDSISNSH
. : :. .:.. : . . : :. ..:. :: . . . .::
CCDS44 LHPGQLHLPQLMPHPANIPFRQPPSFLPMPYPTSSALSSGFFLPLQSQFALQLPGDVESH
1200 1210 1220 1230 1240 1250
1620 1630
pF1KE0 ---------PL------------------LPPELRPLGSQVQK------VPS------SF
:: ::: : .:.. .:. :.
CCDS44 LPQIKTSLAPLATGSAGLSPSTEYSSDIRLPPVAPPASSSAPTSAPPLALPACPDTMVSL
1260 1270 1280 1290 1300 1310
1640 1650 1660 1670 1680
pF1KE0 MLPIRLQSSVPAYCFATLTSLPQILVTQD--------LPN--QPICQTNHSVVPISEEQN
..:.:.:...:.: : :.: ::::::. ::. .: . . .: .
CCDS44 VVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFEEPPSKGTTVCGADVHEVG
1320 1330 1340 1350 1360 1370
1690 1700 1710 1720 1730 1740
pF1KE0 SVPT-LQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQESSAS
:. :.. .. :.:.: .: : ...::: :. : .. ....
CCDS44 PGPSGLSEEQSRAFPTP---YLRVPVTLPERKGTSLSSE-------SILSLEGSSSTAGG
1380 1390 1400 1410 1420
1750 1760 1770 1780 1790 1800
pF1KE0 SKRMLSPANSLDIAME-KHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVRQV
:::.::::.::...:: ..:::.:.:. .:...: . :: .:
CCDS44 SKRVLSPAGSLELTMETQQQKRVKEEE--------------ASKADEKLELVKPC---SV
1430 1440 1450 1460 1470
1810 1820 1830 1840 1850 1860
pF1KE0 CTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFENIK
: :: ::. ... . . ... . : .: :.: : . : :..
CCDS44 VLTSTEDGKRPEKSHLGNQGQGRRELEMLSSLSSDPSDT---KEIPPLPHPALSH-----
1480 1490 1500 1510 1520
1870 1880 1890 1900 1910
pF1KE0 SSTSLTLTVRSSPAPSENTH---ISPL--KCTDNNQERKSPGVKNQGDKVNIQEQSQQPV
... . ... : :: . : ..:: : :.... :.. .. . ..: :..:.
CCDS44 GTAPGSEALKEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LPLSETSSRPA
1530 1540 1550 1560 1570 1580
1920 1930 1940 1950 1960 1970
pF1KE0 TSLSLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNP
: . : . : ::::.:::: .:::: : :. . :...:.:. : .: :::
CCDS44 KSQEGTDSKKVLQ--FPSLHTTTNVSWCYLNYIKPNHIQHADRRSSVYAGWCISLYNPNL
1590 1600 1610 1620 1630
1980 1990 2000 2010 2020 2030
pF1KE0 LGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVE
:. ::.::.:: :::...: : .: . : .. :: ::. : ... : : :
CCDS44 PGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSSRKPRMTEVHL---PSLVSP
1640 1650 1660 1670 1680 1690
2040 2050 2060 2070 2080 2090
pF1KE0 FSNKDASEINSEQDKEN-------SLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYIC
..:: .....:..... . ..:: :::::.::::::::::::::::::::.:
CCDS44 EGQKDLARVEKEEERRGEPEEDAPASQRGEPARIKIFEGGYKSNEEYVYVRGRGRGKYVC
1700 1710 1720 1730 1740 1750
2100 2110 2120 2130 2140
pF1KE0 EECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGV-
:::::::::::::::::::::::::: : .:.:.:::::::::::::::::::: . ::
CCDS44 EECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNLTKHMKSKAHSKKCQETGVL
1760 1770 1780 1790 1800 1810
2150 2160 2170 2180 2190 2200
pF1KE0 -----SVGLIDE--QDTEESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESV
: :. ::.: . : .. :.. :::.::. : : .:.::.::. ....
CCDS44 EELEAEEGTSDDLFQDSE-GREGSEAVEEHQFSDLEDSDS-DSDLDEDEDEDEE-ESQDE
1820 1830 1840 1850 1860 1870
2210 2220 2230 2240 2250
pF1KE0 LSATPSVTASPQHLP-----SRSSLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRM
:: :: : : : . : . : : . :. : .. . :.
CCDS44 LS-RPSSEAPPPGPPHALRADSSPILGPQPPDAPASGTEATRGSSVSEAE--------RL
1880 1890 1900 1910 1920
2260 2270 2280 2290 2300 2310
pF1KE0 TVLSTAQSDYNRKTLSPGKARQRAARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSM
:. : ..:. . : : . . :.:: .. : .: : .: : .
CCDS44 TASSCSMSSQSMPGL-PWLGPAPLGSVEKDTGSAL--SYKPVSPRRPWSPSKEAGSRPPL
1930 1940 1950 1960 1970 1980
2320 2330 2340 2350 2360
pF1KE0 AGKAVAITQSPSS------VRLPPAAAEHSP--QTAAGMPSVASPHPDPQEQKQQITLQP
: : ..:.. :: .: : :.: : .. : : : .:. : . .:: :
CCDS44 ARKH-SLTKNDSSPQRCSPAREPQASAPSPPGLHVDPGRGMGALPCGSPRLQLSPLTLCP
1990 2000 2010 2020 2030 2040
2370 2380 2390 2400 2410
pF1KE0 TPGLPSPHTHLFSHL--------PLHSQQ------QSRTPYNMVPVGGIHVV-PAGLTYS
.:..:..:.: : .: :...: .: : .. :.. . .
CCDS44 LGRELAPRAHVLSKLEGTTDPGLPRYSPTRRWSPGQAESPPRSAPPGKWALAGPGSPSAG
2050 2060 2070 2080 2090 2100
2420 2430 2440 2450 2460 2470
pF1KE0 TFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRV
: . .. .: . . :. :. :. : .: : :: : : : :
CCDS44 EHGPGLGLDPRVLFPPAPLPHKLLS--RSPETCAS----PWK-AE-SRSPSCSP-G----
2110 2120 2130 2140
2480 2490 2500 2510 2520 2530
pF1KE0 PGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAVGLQVLTANPSSQSS
: . : :.: : ... . :: :. : : :.. : :: .
CCDS44 P-----AHP-LSSRPFSALHDFHGHILARTEENIFSHLP---LHS---QHLT------RA
2150 2160 2170 2180
2540 2550 2560 2570 2580
pF1KE0 PAPQAHIPGLQILNI---ALPTLIPSVSQVAVD--AQGAPEMPASQSKACET---QPKQT
: : : :.:... : :::.:. . . :. . :. .. ... .: : .: ..
CCDS44 PCPLIPIGGIQMVQARPGAHPTLLPGPTAAWVSGFSGGGSDLTGAR-EAQERGRWSPTES
2190 2200 2210 2220 2230 2240
2590 2600 2610 2620 2630 2640
pF1KE0 SVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAASANHVKP
: ::.. :... .: .:. .::. . . :..... :
CCDS44 SSASVSPVAKV-------------SKFTLSSELEGGDYPK-------ERERTGGGPGRPP
2250 2260 2270 2280
2650 2660 2670 2680 2690 2700
pF1KE0 K--PELTSIQGQPASTSQPLLKAHSEVFTKPSGQ---QTLSPDRQVPRPTALPRRQPTVH
:. :. ..:. : .: . . :.:. :. :: . :: . :. . :
CCDS44 DWTPHGTGAPAEPTPTHSPCTPPDT-LPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPP
2290 2300 2310 2320 2330 2340
2710
pF1KE0 FSDVSSDDDEDRLVIAT
.. ::
CCDS44 LDRSSSVGCLAEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA
2350 2360 2370 2380 2390 2400
>>CCDS463.1 HIVEP3 gene_id:59269|Hs108|chr1 (2406 aa)
initn: 1987 init1: 601 opt: 1059 Z-score: 401.1 bits: 88.4 E(32554): 5e-16
Smith-Waterman score: 2649; 31.0% identity (53.5% similar) in 2676 aa overlap (203-2707:1-2354)
180 190 200 210 220
pF1KE0 RTDNSECISSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQK---GSPCA--IKTEKLRPN
:.:: :. . : ::: : : .. .
CCDS46 MDPEQSVKGTKKAEGSPRKRLTKGEAIQ-T
10 20
230 240 250 260 270 280
pF1KE0 KTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQH
... : : ... . .. .:::.: . : ... .. .:. : .
CCDS46 SVSSSVPYPGSGTAATQESPAQELLAPQPFPGPSSVLREGSQEKTGQQQKPPKRPPIEAS
30 40 50 60 70 80
290 300 310 320 330 340
pF1KE0 EHFVPKSNQHNQQLPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTP
: . . :: : .: . . :.. . : . : ....:. . :
CCDS46 VH-ISQLPQH----PLTPAFMSPGKPEHLLEGSTWQLVDPMRPGPSGSFVAPG----LHP
90 100 110 120 130 140
350 360 370 380 390 400
pF1KE0 QNQQMDSASPLSISPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYI
:.: . : . . : : . : . . ..:. .. ... :..::.: ::::
CCDS46 QSQLLPSHASI-IPPEDLPGVPKVFVPRPSQVSLKPTEEAHK------KERKPQKPGKYI
150 160 170 180 190
410 420 430 440 450 460
pF1KE0 CEYCNRACAKPSVLLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQ
:.::.: ::::::: :::::::::::::: ::::::::::::::.::::: :: ::.
CCDS46 CQYCSRPCAKPSVLQKHIRSHTGERPYPCGPCGFSFKTKSNLYKHRKSHAHRIKAGLA--
200 210 220 230 240 250
470 480 490 500 510 520
pF1KE0 PDAGGLFLSHESPKALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAET
:: . :..: .. . : :: . . ... .: .:... : .
CCDS46 SGMGGEMY----PHGLEMERIPGEEFEEPTEGESTDSEEETSATSGHPAELSPR--PKQP
260 270 280 290 300
530 540 550 560 570 580
pF1KE0 LLKSSFTPSSPENVIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPEL
::.:.. :. .. . ..:. .:.. . : : . .: . .. :::
CCDS46 LLSSGLYSSGSHSSSHERCSLSQSSTAQSLEDPPPFV---------EPSSEHPLSHKPED
310 320 330 340 350
590 600 610 620 630 640
pF1KE0 SSAQKQKDLQVTNVQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQ
. . ::: :. .:.
CCDS46 THTIKQK---------LALRLSE-------------------------------------
360 370
650 660 670 680 690 700
pF1KE0 RQQATDYSQEQQGKLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPST-EQDSGRS
:... : :: .::: : :::.::::::::::.: ::::. :. ::
CCDS46 RKKVID---EQA--FLSPGSKGSTESGYFSRSESAEQQVSPPNTNAKSYAEIIFGKCGRI
380 390 400 410 420
710 720 730 740 750 760
pF1KE0 NGPSAALVTASTPSALP--TGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQL
. .: :...:: :: : .: :.: . : :...:. :.:::. :::.:: ...
CCDS46 GQRTAMLTATSTQPLLPLSTEDKPSLVP--LSVP-RTQVIEH-ITKLITINEAVVDTSEI
430 440 450 460 470 480
770 780 790 800 810 820
pF1KE0 DSVKPRRTSLSRRGSIDSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVF
:::::::.:::::.:..:::: .... :. :: :. : : :.: .
CCDS46 DSVKPRRSSLSRRSSMESPKSSLYRE-------PL----SSHSEKTK-P----EQS-LLS
490 500 510 520
830 840 850 860 870 880
pF1KE0 LLSVPSL-DCLPITRSNSMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGP
: :: .:. ::.:::... . : : ::.::: ::::.: : . .
CCDS46 LQHPPSTAPPVPLLRSHSMPSAACT-----ISTPHHPFRGSYSFDDHI----TDSEALSH
530 540 550 560 570
890 900 910 920 930 940
pF1KE0 NAPVPQSGHPRTLVRQAAIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQG
.. : : ::: : :: ::: ..: : : :.. .. . . . :..
CCDS46 SSHVFTS-HPRMLKRQPAIELPLGGEYSSEEPGPS---SKDTASKPSDEVEPKESELTK-
580 590 600 610 620 630
950 960 970 980 990
pF1KE0 PHIEKKKSHQGRGTMFECETCRNRYRKLENFENHKKFYCSELHGPKTKVAMR----EPEH
. ::. . .:...::. : ::.: .:.: :::.:::::. : : : :.
CCDS46 ---KTKKGLKTKGVIYECNICGARYKKRDNYEAHKKYYCSELQIAKPISAGTHTSPEAEK
640 650 660 670 680
1000 1010 1020 1030 1040 1050
pF1KE0 SPVPGGLQPQILHYRVAGSSGIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQ
: . :..::.. :.. : :: .::::: ::.::.:: :: : .: :
CCDS46 SQIEHEPWSQMMHYKL-GTT--LELTP-LRKRRKEKSLGDEEEPPAFESTKSQFGSPG--
690 700 710 720 730 740
1060 1070 1080 1090 1100 1110
pF1KE0 FQNALGCNPSLPKHNVTIRSDQQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSA
:: .:. ..: .. . . . . .:: ..:. . .:.
CCDS46 --------PSDAARNLPLESTKSPAEPSKSVPSL----EGPTG-FQPRTP-----KPGSG
750 760 770 780
1120 1130 1140 1150 1160 1170
pF1KE0 AQDKIELQRHGTGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGI
... : . . :::::::.:. . .:...: .: :.. :
CCDS46 SESGKERRTTSKEISVIQHTSSFEKSDSLEQPSGLE-------------GEDKPL-----
790 800 810 820
1180 1190 1200 1210 1220 1230
pF1KE0 SQEESHPSRDGSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILV
.: : : :: .:.. : : :: .:::: :::::::::
CCDS46 AQFPSPPPA----PH---------------GRSA----HSL-QP-KLVRQPNIQVPEILV
830 840 850 860
1240 1250 1260 1270 1280 1290
pF1KE0 TEEPDR-DLEAQC--HDQEKSEKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTES
:::::: : : . .. ::.:.:.:::::.::..::.::::::::::::::. .:: ::
CCDS46 TEEPDRPDTEPEPPPKEPEKTEEFQWPQRSQTLAQLPAEKLPPKKKRLRLAEMAQSSGES
870 880 890 900 910 920
1300 1310 1320 1330 1340 1350
pF1KE0 SFDST--LSRSLSRESSLSHT-SSFSASLDIEDVSKTEA-SPKIDFLNKAEFLMIPAGLN
::.:. :::: :.::..: . :: :::.. .: .:.:: ::. :. : : : .
CCDS46 SFESSVPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSDMRPK------PLGTH
930 940 950 960 970
1360 1370 1380 1390 1400
pF1KE0 TLNVPGCH---REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPSS
:.::. : :::::.:::: .. : .... :::::: ::.. : ::.
CCDS46 MLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSLS---------LTGPSA
980 990 1000 1010 1020
1410 1420 1430 1440 1450 1460
pF1KE0 PSRVGVTGHVPLLERRRGPLVRQISLNIAPDSHLSPVHPTSFQNTALPSVNAVPYQGPQL
:. :. ..: :::. :::: ::. :.:.: : : . :.. :. : ..
CCDS46 PAPVAPPARVAPPERRKCFLVRQASLSRPPESELE-VAPKGRQESEEPQ----PSSSKPS
1030 1040 1050 1060 1070 1080
1470 1480 1490 1500 1510
pF1KE0 TSTSLAEFS-ANTLHS-----QTQVKD---LQAETSNSSSTNVF--PVQQLCDINLLNQI
...::...: : : :. . .: : . . . .:: :: : : ..
CCDS46 AKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQT---PLHEKP
1090 1100 1110 1120 1130
1520 1530 1540 1550 1560
pF1KE0 HAPP-----------SHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCF-APKYQLHCQV
. :: .:. : :::. . .: : . : :: :. :
CCDS46 YLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPTV
1140 1150 1160 1170 1180 1190
1570 1580 1590 1600 1610
pF1KE0 FTSG----PSCSSNPVH---SLPNQVISDPVGTDHCVTSAT-LPTK-----LIDSISNSH
. : :. .:.. : . . : :. ..:. :: . . . .::
CCDS46 LHPGQLHLPQLMPHPANIPFRQPPSFLPMPYPTSSALSSGFFLPLQSQFALQLPGDVESH
1200 1210 1220 1230 1240 1250
1620 1630
pF1KE0 ---------PL------------------LPPELRPLGSQVQK------VPS------SF
:: ::: : .:.. .:. :.
CCDS46 LPQIKTSLAPLATGSAGLSPSTEYSSDIRLPPVAPPASSSAPTSAPPLALPACPDTMVSL
1260 1270 1280 1290 1300 1310
1640 1650 1660 1670 1680
pF1KE0 MLPIRLQSSVPAYCFATLTSLPQILVTQD--------LPN--QPICQTNHSVVPISEEQN
..:.:.:...:.: : :.: ::::::. ::. .: . . .: .
CCDS46 VVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFEEPPSKGTTVCGADVHEVG
1320 1330 1340 1350 1360 1370
1690 1700 1710 1720 1730 1740
pF1KE0 SVPT-LQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQESSAS
:. :.. .. :.:.: .: : ...::: :. : .. ....
CCDS46 PGPSGLSEEQSRAFPTP---YLRVPVTLPERKGTSLSSE-------SILSLEGSSSTAGG
1380 1390 1400 1410 1420
1750 1760 1770 1780 1790 1800
pF1KE0 SKRMLSPANSLDIAME-KHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVRQV
:::.::::.::...:: ..:::.:.:. .:...: . :: .:
CCDS46 SKRVLSPAGSLELTMETQQQKRVKEEE--------------ASKADEKLELVKPC---SV
1430 1440 1450 1460 1470
1810 1820 1830 1840 1850 1860
pF1KE0 CTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFENIK
: :: ::. ... . . ... . : .: :.: : . : :..
CCDS46 VLTSTEDGKRPEKSHLGNQGQGRRELEMLSSLSSDPSDT---KEIPPLPHPALSH-----
1480 1490 1500 1510 1520
1870 1880 1890 1900 1910
pF1KE0 SSTSLTLTVRSSPAPSENTH---ISPL--KCTDNNQERKSPGVKNQGDKVNIQEQSQQPV
... . ... : :: . : ..:: : :.... :.. .. . ..: :..:.
CCDS46 GTAPGSEALKEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LPLSETSSRPA
1530 1540 1550 1560 1570 1580
1920 1930 1940 1950 1960 1970
pF1KE0 TSLSLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNP
: . : . : ::::.:::: .:::: : :. . :...:.:. : .: :::
CCDS46 KSQEGTDSKKVLQ--FPSLHTTTNVSWCYLNYIKPNHIQHADRRSSVYAGWCISLYNPNL
1590 1600 1610 1620 1630
1980 1990 2000 2010 2020 2030
pF1KE0 LGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVE
:. ::.::.:: :::...: : .: . : .. :: ::. : ... : : :
CCDS46 PGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSSRKPRMTEVHL---PSLVSP
1640 1650 1660 1670 1680 1690
2040 2050 2060 2070 2080 2090
pF1KE0 FSNKDASEINSEQDKEN-------SLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYIC
..:: .....:..... . ..:: :::::.::::::::::::::::::::.:
CCDS46 EGQKDLARVEKEEERRGEPEEDAPASQRGEPARIKIFEGGYKSNEEYVYVRGRGRGKYVC
1700 1710 1720 1730 1740 1750
2100 2110 2120 2130 2140
pF1KE0 EECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGV-
:::::::::::::::::::::::::: : .:.:.:::::::::::::::::::: . ::
CCDS46 EECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNLTKHMKSKAHSKKCQETGVL
1760 1770 1780 1790 1800 1810
2150 2160 2170 2180 2190 2200
pF1KE0 -----SVGLIDE--QDTEESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESV
: :. ::.: . : .. :.. :::.::. : : .:.::.::. ....
CCDS46 EELEAEEGTSDDLFQDSE-GREGSEAVEEHQFSDLEDSDS-DSDLDEDEDEDEE-ESQDE
1820 1830 1840 1850 1860 1870
2210 2220 2230 2240 2250
pF1KE0 LSATPSVTASPQHLP-----SRSSLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRM
:: :: : : : . : . : : . :. : .. . :.
CCDS46 LS-RPSSEAPPPGPPHALRADSSPILGPQPPDAPASGTEATRGSSVSEAE--------RL
1880 1890 1900 1910 1920
2260 2270 2280 2290 2300 2310
pF1KE0 TVLSTAQSDYNRKTLSPGKARQRAARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSM
:. : ..:. . : : . . :.:: .. : .: : .: : .
CCDS46 TASSCSMSSQSMPGL-PWLGPAPLGSVEKDTGSAL--SYKPVSPRRPWSPSKEAGSRPPL
1930 1940 1950 1960 1970 1980
2320 2330 2340 2350 2360
pF1KE0 AGKAVAITQSPSS------VRLPPAAAEHSP--QTAAGMPSVASPHPDPQEQKQQITLQP
: : ..:.. :: .: : :.: : .. : : : .:. : . .:: :
CCDS46 ARKH-SLTKNDSSPQRCSPAREPQASAPSPPGLHVDPGRGMGALPCGSPRLQLSPLTLCP
1990 2000 2010 2020 2030 2040
2370 2380 2390 2400 2410
pF1KE0 TPGLPSPHTHLFSHL--------PLHSQQ------QSRTPYNMVPVGGIHVV-PAGLTYS
.:..:..:.: : .: :...: .: : .. :.. . .
CCDS46 LGRELAPRAHVLSKLEGTTDPGLPRYSPTRRWSPGQAESPPRSAPPGKWALAGPGSPSAG
2050 2060 2070 2080 2090 2100
2420 2430 2440 2450 2460 2470
pF1KE0 TFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRV
: . .. .: . . :. :. :. : .: : :: : : : :
CCDS46 EHGPGLGLDPRVLFPPAPLPHKLLS--RSPETCAS----PWQKAE-SRSPSCSP-G----
2110 2120 2130 2140
2480 2490 2500 2510 2520 2530
pF1KE0 PGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAVGLQVLTANPSSQSS
: . : :.: : ... . :: :. : : :.. : :: .
CCDS46 P-----AHP-LSSRPFSALHDFHGHILARTEENIFSHLP---LHS---QHLT------RA
2150 2160 2170 2180 2190
2540 2550 2560 2570 2580
pF1KE0 PAPQAHIPGLQILNI---ALPTLIPSVSQVAVD--AQGAPEMPASQSKACET---QPKQT
: : : :.:... : :::.:. . . :. . :. .. ... .: : .: ..
CCDS46 PCPLIPIGGIQMVQARPGAHPTLLPGPTAAWVSGFSGGGSDLTGAR-EAQERGRWSPTES
2200 2210 2220 2230 2240
2590 2600 2610 2620 2630 2640
pF1KE0 SVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAASANHVKP
: ::.. :... .: .:. .::. . . :..... :
CCDS46 SSASVSPVAKV-------------SKFTLSSELEGGDYPK-------ERERTGGGPGRPP
2250 2260 2270 2280
2650 2660 2670 2680 2690 2700
pF1KE0 K--PELTSIQGQPASTSQPLLKAHSEVFTKPSGQ---QTLSPDRQVPRPTALPRRQPTVH
:. :. ..:. : .: . . :.:. :. :: . :: . :. . :
CCDS46 DWTPHGTGAPAEPTPTHSPCTPPDT-LPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPP
2290 2300 2310 2320 2330 2340
2710
pF1KE0 FSDVSSDDDEDRLVIAT
.. ::
CCDS46 LDRSSSVGCLAEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA
2350 2360 2370 2380 2390 2400
>>CCDS43510.1 HIVEP2 gene_id:3097|Hs108|chr6 (2446 aa)
initn: 1923 init1: 629 opt: 934 Z-score: 356.4 bits: 80.2 E(32554): 1.6e-13
Smith-Waterman score: 2750; 32.5% identity (55.1% similar) in 2437 aa overlap (247-2426:3-2257)
220 230 240 250 260 270
pF1KE0 CAIKTEKLRPNKTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGA
:.. .... .: .. : . :. ..::.:
CCDS43 MDTGDTALGQKATSRSGETDKASGRWRQEQSA
10 20 30
280 290 300 310 320
pF1KE0 ---MQS-ASHLYHQHEHFVPKS--NQHNQQLPGCSGFTGSLTNLQNQENAKL-----EQV
:.. .:: ... .. :.. : . :: : :: .: ... .: : .
CCDS43 VIKMSTFGSHEGQRQPQIEPEQIGNTASAQLFG-SGKLASPSEVVQQVAEKQYPPHRPSP
40 50 60 70 80 90
330 340 350 360 370
pF1KE0 YNIAVTSSVGLTS-PSSRSQVTPQNQQMDSASPLSISPANSTQSP---PMPI------YN
:. . : : :.. . : .:.... : .: :. : :.:: :
CCDS43 YSCQHSLSFPQHSLPQGVMHSTKPHQSLEGPPWLFPGPLPSVASEDLFPFPIHGHSGGYP
100 110 120 130 140 150
380 390 400 410 420
pF1KE0 STHVASV-------VNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSVLLKHIRSH
...:. ..:.:: . :..:::: ::::: ::.::::::::: ::::::
CCDS43 RKKISSLNPAYSQYSQKSIEQAEEAHKKEHKPKKPGKYICPYCSRACAKPSVLKKHIRSH
160 170 180 190 200 210
430 440 450 460 470 480
pF1KE0 TGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHES---PKALSI
::::::::. ::::::::::::::.:::::.:: ::: ... :. :. :
CCDS43 TGERPYPCIPCGFSFKTKSNLYKHRKSHAHAIKAGLVPFTESAVSKLDLEAGFIDVEAEI
220 230 240 250 260 270
490 500 510 520 530 540
pF1KE0 HSDVEDSGESEEEGATDERQHD-LGAMELQPVHIIKRMSNAETLLKSSFTPSSPENVIGD
::: :.: ...::.. . : .. :. : .: ... : :.. :
CCDS43 HSDGEQSTDTDEESSLFAEASDKMSPGPPIPLDIASR---------GGYHGSLEESLGGP
280 290 300 310 320
550 560 570 580 590 600
pF1KE0 FLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTNVQPL
. ..: ... ::. : :. :: :. :
CCDS43 M-------------KVPILII------------PKSGIPLPNESSQYIGPDML-----P-
330 340 350
610 620 630 640 650 660
pF1KE0 SANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQGKLLS
: . . :.: :::. . :. .. ..: . .:::
CCDS43 --------------NPSLNTKAD--------DSHTVKQKLALRLSEKKGQDSEPSLNLLS
360 370 380
670 680 690 700 710 720
pF1KE0 PRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAAL-VTASTPSALP
:.: ::::::::::::::.: .:::. :. . .: :: ::...
CCDS43 PHSKGSTDSGYFSRSESAEQQISPPNTNAKSYEEIIFGKYCRLSPRNALSVTTTSQERAA
390 400 410 420 430 440
730 740 750 760 770 780
pF1KE0 TGEKALLLP-GQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSIDS
:.:... : .. : .: .:. .:.:: .. .: : .::. . ...:
CCDS43 MGRKGIMEPLPHVNTRLDVKMFEDPVSQLIPSK---------GDVDPSQTSMLKSTKFNS
450 460 470 480 490 500
790 800 810 820 830 840
pF1KE0 PKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSNSM
.: : .. : . :. .. . . : . :. : :: .: .: :. ::::.
CCDS43 -------ESRQPQIIPSSIRNEGK--LYPANF---QGSNPV-LLEAP-VDSSPLIRSNSV
510 520 530 540
850 860 870 880 890 900
pF1KE0 PTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQAAI
::. ::. :. :: ::::.:::... . :::: : . :: : : ::::.
CCDS43 PTS--SAT--NLTIPPS-LRGSHSFDERMTG-SDDVFYPGTVGIPPQ----RMLRRQAAF
550 560 570 580 590
910 920 930 940 950 960
pF1KE0 EDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFECE
: :..:.:: . :.: : . :..: ..:: : . .. .
CCDS43 ELPSVQEGHV-------EVEHHGRMLKG----ISSSSL------KEKKLSPGDRVGYDYD
600 610 620 630
970 980 990 1000 1010
pF1KE0 TCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGG---LQPQILHYRVAGSS
.::. :.: :. :. :. : . . .: :: ..: . . :
CCDS43 VCRKPYKKWEDSETPKQNY-------RDISCLSSLKH----GGEYFMDPVV---PLQGVP
640 650 660 670 680
1020 1030 1040 1050 1060 1070
pF1KE0 GIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRS
... : . ::::: :::::.:. . :. .. :.. : .:.: . . .::
CCDS43 SMFGTTCENRKRRKEKSVGDEEDTPMICSSIV-STPVGIM---ASDYDPKL-QMQEGVRS
690 700 710 720 730 740
1080 1090 1100 1110 1120 1130
pF1KE0 D---QQHKNIQLQNSHIHLVARGP--EQTMDPKLSTIMEQQISSAAQDKI-EL---QRHG
:.:. :: : : : . . : . :.. :. .::. .: . :
CCDS43 GFAMAGHENL----SHGHTERFDPCRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPG
750 760 770 780 790
1140 1150 1160 1170 1180
pF1KE0 TGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGS-LKVIGISQEESHPSRD
. ::::::::::::::::.. : : .. .. . . . : .. .: : . :. :
CCDS43 NVISVIQHTNSLSRPNSFERSESAELVACTQDKAPSPSETCDSEISEAPVSPEWAPPG-D
800 810 820 830 840 850
1190 1200 1210 1220 1230 1240
pF1KE0 GSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDR---D
:.. :. . :.. . . :. :: ::::::::::::: ::::::. .
CCDS43 GAESG---------GKPSPSQQVQQQSYHT--QP-RLVRQHNIQVPEIRVTEEPDKPEKE
860 870 880 890 900
1250 1260 1270 1280 1290 1300
pF1KE0 LEAQCHDQEKS-EKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDST---L
::: .. :: :.:.:::::::::.::.:::::::::::::..:::: ::::.:: :
CCDS43 KEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKKRLRLADMEHSSGESSFESTGTGL
910 920 930 940 950 960
1310 1320 1330 1340 1350 1360
pF1KE0 SRSLSRESSLSHTSSFSASLDIEDVSKTEASPKIDFLNK-AEFLMIPAGLNTLNVPGCH-
::: :.::.:::.:::: :.. :..:: : :: : ..: .::: .::: .:.::: :
CCDS43 SRSPSQESNLSHSSSFSMSFEREETSKLSALPKQDEFGKHSEFLTVPAGSYSLSVPGHHH
970 980 990 1000 1010 1020
1370 1380 1390 1400 1410
pF1KE0 -REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPS-SPSRVGVTGH
.:::: .:::. : . . :: ..:::::: :... .:.. . ::::
CCDS43 QKEMRRCSSEQMPCPHPA-EVPEVRSKSFDYGNLSH---APVSGAAASTVSPSR------
1030 1040 1050 1060 1070
1420 1430 1440 1450 1460 1470
pF1KE0 VPLLERRRGPLVRQISLNIAPDSHLSPV-HPTSFQNTALPSVNAVP----YQGPQLTSTS
::.. :::: :.. .:. . : : .. : ..: ..:: .
CCDS43 ----ERKKCFLVRQASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGPPAVLPP
1080 1090 1100 1110 1120
1480 1490 1500 1510
pF1KE0 LAE-------------FSANTLH-SQTQVKDLQAETSNSSSTNVFPVQQLCDINLLNQIH
: . .:.. :: .: :. .... : . . :.. . . .: .: :
CCDS43 LQQEDPGKQVAGPCPPLSSGPLHLAQPQIMHMDSQESLRNPL-IQPTSYMTSKHLPEQPH
1130 1140 1150 1160 1170 1180
1520 1530 1540 1550 1560 1570
pF1KE0 APPSHQSTQLS-LQVST-QGSKPDKNSVLSGSSKS---EDCFAPKYQLHCQVFTSGPSC-
: ... .: .: . : . : : ... . : . : : . ::
CCDS43 LFPHQETIPFSPIQNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQ
1190 1200 1210 1220 1230 1240
1580 1590 1600 1610
pF1KE0 ----SSNPVHSLPNQVISDPVGTDH-------CVTSAT--LPTKLID---SISNSHPLLP
:: :.. . ... . :. : : ..:. : .:. : ..:.
CCDS43 TEIHSSYPLEHVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTET
1250 1260 1270 1280 1290 1300
1620 1630 1640 1650 1660
pF1KE0 PELRPL--------GSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPI
: . : ....:..:.. ..:.:.:. ::.: . ::. ::: :. : :
CCDS43 PSEQVLQEDFASANAGSLQSLPGT-VVPVRIQTHVPSYGSVMYTSISQIL-GQNSPAIVI
1310 1320 1330 1340 1350 1360
1670 1680 1690 1700 1710 1720
pF1KE0 CQTNHSVVPISEEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKI
:....... . :.. .: : . : ... : . ..::. .
CCDS43 CKVDENMTQRTLVTNAA--MQGIGFNI-----AQVLGQHAGLEKYPIWKAPQTLPLGLES
1370 1380 1390 1400 1410
1730 1740 1750 1760 1770 1780
pF1KE0 SVGRLSPQQESSAS----SKRMLSPANSLDIAME-KHQKRAKDEN--GAVCATDVRPLEA
:. :. .:.. ::::::::.::.. :: :.:::.:.:. : . . .. .:
CCDS43 SIPLCLPSTSDSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQI-VEELSAVEL
1420 1430 1440 1450 1460 1470
1790 1800 1810 1820 1830
pF1KE0 LSSRVN-EASKQKKPILVRQVCTTEPLDGVMLEKDVFSQ--PEISNEAVNLTN-----VL
.: .. . :. .:: :::: :..:: ::.. .. ::. : :.. ... :
CCDS43 TNSDIKKDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFL
1480 1490 1500 1510 1520 1530
1840 1850 1860 1870 1880 1890
pF1KE0 PADNSSTGCSKFVVIEPISELQEFENIKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQE
:. . .: . . : :. .:: : . .: : . . : : :.. :
CCDS43 PSKEMLSGSRAPLPGQKSS--GPSESKESSDELDIDETASDM-SMSPQSSSLPAGDGQLE
1540 1550 1560 1570 1580 1590
1900 1910 1920 1930 1940 1950
pF1KE0 RKSPGVKNQ-GDKVNIQEQSQQPV--TSLSLFNIKDTQQ-LAFPSLKTTTNFTWCYLLRQ
... : : : : . . : ..: : .. : :: : ::::.:::. .::.:
CCDS43 EEGKGHKRPVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYT
1600 1610 1620 1630 1640 1650
1960 1970 1980 1990 2000 2010
pF1KE0 KSLHLPQKDQKTSAYTDWTVSASNPNPLGLPTKVALALLNSKQNTGKSLYCQAITTHSKS
: .. : :.:.:..: .:. :::: :: ::..:::: :::. .: : . .
CCDS43 KPNYVQQATFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGT
1660 1670 1680 1690 1700 1710
2020 2030 2040 2050 2060
pF1KE0 DLLVYSSKWK--SSLSKRA---LGNQ-KSTVVEFSNKDASEINSEQDKENSLIKSEPRRI
:. :: :: .... : .:.. . .: :. .. . . ::. . ..:: ::
CCDS43 GKLTSSSAWKQFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRI
1720 1730 1740 1750 1760 1770
2070 2080 2090 2100 2110 2120
pF1KE0 KIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFS
:::.:::::::.:::::::::::::::::::::::::::::::::::::::: : :::.
CCDS43 KIFEGGYKSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFA
1780 1790 1800 1810 1820 1830
2130 2140 2150 2160 2170
pF1KE0 FKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTEESD---------EKQRFSYERSGY
:::::::::::::::: :::..::::. .:. .:::.. ::. .: . .
CCDS43 FKTKGNLTKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDH
1840 1850 1860 1870 1880 1890
2180 2190 2200 2210
pF1KE0 ---DLEESDGPDEDDNENEDDDED-----------SQAESV------LSATP-SVTASPQ
: ::::: : :::...:.::: ....:. .:. : .: : :.
CCDS43 QFSDAEESDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPH
1900 1910 1920 1930 1940 1950
2220 2230 2240
pF1KE0 HLPSRSSL--------------------QDPVSTDEDVRITD---CFSGVHTD--P----
.:: ::: . : .. ::...:. :.. :: :
CCDS43 GVPSDSSLGHSSLISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDR
1960 1970 1980 1990 2000 2010
2250 2260 2270 2280 2290
pF1KE0 MDVLPRALLTRMTVLSTAQS---DYNRKTL--SPGKARQRAARDENDT---IPSVDTSR-
.:. : . . . : .: :.. .. ::: . ::.. ::. : :
CCDS43 LDI-PSCMDEECMLPSEPSSSPRDFSPSSHHSSPGYD-SSPCRDNSPKRYLIPKGDLSPR
2020 2030 2040 2050 2060 2070
2300 2310 2320
pF1KE0 ---SPCHQMSVDY---PESEEILRSSMA------------------GKAVAITQ--SP--
:: ...: :..: :: :. :: .. . ::
CCDS43 RHLSPRRDLSPMRHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRR
2080 2090 2100 2110 2120 2130
2330 2340 2350 2360
pF1KE0 -----SSVRLPPA--AAEHSPQTAAGM-----PSVASPHPDPQEQKQQITL---------
...: : : :.: . :. : : .: :. .. :.
CCDS43 ERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGP-PNLRRGLPQVPYFSLYGDQEG
2140 2150 2160 2170 2180 2190
2370 2380 2390 2400 2410
pF1KE0 -QPTPG---LP-SPHTHLFSHLPLHSQQQSRTPYNMVPVGGI---HVVPAGLTYSTFVPL
:: .: .:. ..::::::::::: :.: ::::::: : .: .: :.. :
CCDS43 AYEHPGSSLFPEGPNDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPAL--SSLHPS
2200 2210 2220 2230 2240 2250
2420 2430 2440 2450 2460 2470
pF1KE0 QAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRVPGLQN
. :. .
CCDS43 PTLPLPMEGFEEKKGASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQST
2260 2270 2280 2290 2300 2310
2718 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 07:02:21 2016 done: Sat Nov 5 07:02:22 2016
Total Scan time: 8.760 Total Display time: 1.210
Function used was FASTA [36.3.4 Apr, 2011]