FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0298, 2718 aa 1>>>pF1KE0298 2718 - 2718 aa - 2718 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 15.1988+/-0.0017; mu= -19.9777+/- 0.099 mean_var=784.8906+/-206.708, 0's: 0 Z-trim(110.0): 9 B-trim: 614 in 1/51 Lambda= 0.045779 statistics sampled from 11298 (11303) to 11298 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.663), E-opt: 0.2 (0.347), width: 16 Scan time: 8.760 The best scores are: opt bits E(32554) CCDS43426.1 HIVEP1 gene_id:3096|Hs108|chr6 (2718) 17896 1200.5 0 CCDS44124.1 HIVEP3 gene_id:59269|Hs108|chr1 (2405) 1059 88.4 5e-16 CCDS463.1 HIVEP3 gene_id:59269|Hs108|chr1 (2406) 1059 88.4 5e-16 CCDS43510.1 HIVEP2 gene_id:3097|Hs108|chr6 (2446) 934 80.2 1.6e-13 >>CCDS43426.1 HIVEP1 gene_id:3096|Hs108|chr6 (2718 aa) initn: 17896 init1: 17896 opt: 17896 Z-score: 6410.3 bits: 1200.5 E(32554): 0 Smith-Waterman score: 17896; 99.9% identity (100.0% similar) in 2718 aa overlap (1-2718:1-2718) 10 20 30 40 50 60 pF1KE0 MPRTKQIHPRNLRDKIEEAQKELNGAEVSKKEILQAGVKGTSESLKGVKRKKIVAENHLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MPRTKQIHPRNLRDKIEEAQKELNGAEVSKKEILQAGVKGTSESLKGVKRKKIVAENHLK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 KIPKSPLRNPLQAKHKQNTEESSFAVLHSASESHKKQNYIPVKNGKQFTKQNGETPGIIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KIPKSPLRNPLQAKHKQNTEESSFAVLHSASESHKKQNYIPVKNGKQFTKQNGETPGIIA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 EASKSEESVSPKKPLFLQQPSELRRWRSEGADPAKFSDLDEQCDSSSLSSKTRTDNSECI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EASKSEESVSPKKPLFLQQPSELRRWRSEGADPAKFSDLDEQCDSSSLSSKTRTDNSECI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 SSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQKGSPCAIKTEKLRPNKTARSPPKLKNSS :::::: ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SSHCGTTSPSYTNTAFDVLLKAMEPELSTLSQKGSPCAIKTEKLRPNKTARSPPKLKNSS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 MDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQHEHFVPKSNQHNQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQHEHFVPKSNQHNQQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 LPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTPQNQQMDSASPLSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTPQNQQMDSASPLSI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 SPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 LLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHESP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHESP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 KALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAETLLKSSFTPSSPEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAETLLKSSFTPSSPEN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 VIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTN 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE0 VQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE0 KLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAALVTASTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::.:::: CCDS43 KLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAALVTTSTPS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE0 ALPTGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ALPTGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE0 DSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSN 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE0 SMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE0 AIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFE 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE0 CETCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGGLQPQILHYRVAGSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CETCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGGLQPQILHYRVAGSSG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE0 IWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRSD 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE0 QQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSAAQDKIELQRHGTGISVIQHTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSAAQDKIELQRHGTGISVIQHTN 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE0 SLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGISQEESHPSRDGSHPHQLALSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGISQEESHPSRDGSHPHQLALSD 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE0 ALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDRDLEAQCHDQEKSEKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDRDLEAQCHDQEKSEKF 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE0 SWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDSTLSRSLSRESSLSHTSSFSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDSTLSRSLSRESSLSHTSSFSA 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE0 SLDIEDVSKTEASPKIDFLNKAEFLMIPAGLNTLNVPGCHREMRRTASEQINCTQTSMEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SLDIEDVSKTEASPKIDFLNKAEFLMIPAGLNTLNVPGCHREMRRTASEQINCTQTSMEV 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE0 SDLRSKSFDCGSITPPQTTPLTELQPPSSPSRVGVTGHVPLLERRRGPLVRQISLNIAPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SDLRSKSFDCGSITPPQTTPLTELQPPSSPSRVGVTGHVPLLERRRGPLVRQISLNIAPD 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE0 SHLSPVHPTSFQNTALPSVNAVPYQGPQLTSTSLAEFSANTLHSQTQVKDLQAETSNSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SHLSPVHPTSFQNTALPSVNAVPYQGPQLTSTSLAEFSANTLHSQTQVKDLQAETSNSSS 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE0 TNVFPVQQLCDINLLNQIHAPPSHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCFAPKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TNVFPVQQLCDINLLNQIHAPPSHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCFAPKY 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE0 QLHCQVFTSGPSCSSNPVHSLPNQVISDPVGTDHCVTSATLPTKLIDSISNSHPLLPPEL ::::::::::::::::::::::::::::::::::::::::::::::::.::::::::::: CCDS43 QLHCQVFTSGPSCSSNPVHSLPNQVISDPVGTDHCVTSATLPTKLIDSMSNSHPLLPPEL 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE0 RPLGSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RPLGSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPICQTNHSVVPIS 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE0 EEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQES 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE0 SASSKRMLSPANSLDIAMEKHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SASSKRMLSPANSLDIAMEKHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVR 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE0 QVCTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QVCTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFEN 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE0 IKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQGDKVNIQEQSQQPVTSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 IKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQERKSPGVKNQGDKVNIQEQSQQPVTSL 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE0 SLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNPLGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNPLGL 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE0 PTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVEFSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVEFSN 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE0 KDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KDASEINSEQDKENSLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKP 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE0 SMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTE 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE0 ESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESVLSATPSVTASPQHLPSRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESVLSATPSVTASPQHLPSRS 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE0 SLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRMTVLSTAQSDYNRKTLSPGKARQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRMTVLSTAQSDYNRKTLSPGKARQR 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE0 AARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSMAGKAVAITQSPSSVRLPPAAAEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSMAGKAVAITQSPSSVRLPPAAAEH 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE0 SPQTAAGMPSVASPHPDPQEQKQQITLQPTPGLPSPHTHLFSHLPLHSQQQSRTPYNMVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SPQTAAGMPSVASPHPDPQEQKQQITLQPTPGLPSPHTHLFSHLPLHSQQQSRTPYNMVP 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE0 VGGIHVVPAGLTYSTFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VGGIHVVPAGLTYSTFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAEL 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE0 SSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SSVVPCIPIGQIRVPGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAV 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KE0 GLQVLTANPSSQSSPAPQAHIPGLQILNIALPTLIPSVSQVAVDAQGAPEMPASQSKACE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GLQVLTANPSSQSSPAPQAHIPGLQILNIALPTLIPSVSQVAVDAQGAPEMPASQSKACE 2530 2540 2550 2560 2570 2580 2590 2600 2610 2620 2630 2640 pF1KE0 TQPKQTSVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TQPKQTSVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAAS 2590 2600 2610 2620 2630 2640 2650 2660 2670 2680 2690 2700 pF1KE0 ANHVKPKPELTSIQGQPASTSQPLLKAHSEVFTKPSGQQTLSPDRQVPRPTALPRRQPTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ANHVKPKPELTSIQGQPASTSQPLLKAHSEVFTKPSGQQTLSPDRQVPRPTALPRRQPTV 2650 2660 2670 2680 2690 2700 2710 pF1KE0 HFSDVSSDDDEDRLVIAT :::::::::::::::::: CCDS43 HFSDVSSDDDEDRLVIAT 2710 >>CCDS44124.1 HIVEP3 gene_id:59269|Hs108|chr1 (2405 aa) initn: 1987 init1: 601 opt: 1059 Z-score: 401.1 bits: 88.4 E(32554): 5e-16 Smith-Waterman score: 2640; 31.0% identity (53.5% similar) in 2676 aa overlap (203-2707:1-2353) 180 190 200 210 220 pF1KE0 RTDNSECISSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQK---GSPCA--IKTEKLRPN :.:: :. . : ::: : : .. . CCDS44 MDPEQSVKGTKKAEGSPRKRLTKGEAIQ-T 10 20 230 240 250 260 270 280 pF1KE0 KTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQH ... : : ... . .. .:::.: . : ... .. .:. : . CCDS44 SVSSSVPYPGSGTAATQESPAQELLAPQPFPGPSSVLREGSQEKTGQQQKPPKRPPIEAS 30 40 50 60 70 80 290 300 310 320 330 340 pF1KE0 EHFVPKSNQHNQQLPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTP : . . :: : .: . . :.. . : . : ....:. . : CCDS44 VH-ISQLPQH----PLTPAFMSPGKPEHLLEGSTWQLVDPMRPGPSGSFVAPG----LHP 90 100 110 120 130 140 350 360 370 380 390 400 pF1KE0 QNQQMDSASPLSISPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYI :.: . : . . : : . : . . ..:. .. ... :..::.: :::: CCDS44 QSQLLPSHASI-IPPEDLPGVPKVFVPRPSQVSLKPTEEAHK------KERKPQKPGKYI 150 160 170 180 190 410 420 430 440 450 460 pF1KE0 CEYCNRACAKPSVLLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQ :.::.: ::::::: :::::::::::::: ::::::::::::::.::::: :: ::. CCDS44 CQYCSRPCAKPSVLQKHIRSHTGERPYPCGPCGFSFKTKSNLYKHRKSHAHRIKAGLA-- 200 210 220 230 240 250 470 480 490 500 510 520 pF1KE0 PDAGGLFLSHESPKALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAET :: . :..: .. . : :: . . ... .: .:... : . CCDS44 SGMGGEMY----PHGLEMERIPGEEFEEPTEGESTDSEEETSATSGHPAELSPR--PKQP 260 270 280 290 300 530 540 550 560 570 580 pF1KE0 LLKSSFTPSSPENVIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPEL ::.:.. :. .. . ..:. .:.. . : : . .: . .. ::: CCDS44 LLSSGLYSSGSHSSSHERCSLSQSSTAQSLEDPPPFV---------EPSSEHPLSHKPED 310 320 330 340 350 590 600 610 620 630 640 pF1KE0 SSAQKQKDLQVTNVQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQ . . ::: :. .:. CCDS44 THTIKQK---------LALRLSE------------------------------------- 360 370 650 660 670 680 690 700 pF1KE0 RQQATDYSQEQQGKLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPST-EQDSGRS :... : :: .::: : :::.::::::::::.: ::::. :. :: CCDS44 RKKVID---EQA--FLSPGSKGSTESGYFSRSESAEQQVSPPNTNAKSYAEIIFGKCGRI 380 390 400 410 420 710 720 730 740 750 760 pF1KE0 NGPSAALVTASTPSALP--TGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQL . .: :...:: :: : .: :.: . : :...:. :.:::. :::.:: ... CCDS44 GQRTAMLTATSTQPLLPLSTEDKPSLVP--LSVP-RTQVIEH-ITKLITINEAVVDTSEI 430 440 450 460 470 480 770 780 790 800 810 820 pF1KE0 DSVKPRRTSLSRRGSIDSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVF :::::::.:::::.:..:::: .... :. :: :. : : :.: . CCDS44 DSVKPRRSSLSRRSSMESPKSSLYRE-------PL----SSHSEKTK-P----EQS-LLS 490 500 510 520 830 840 850 860 870 880 pF1KE0 LLSVPSL-DCLPITRSNSMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGP : :: .:. ::.:::... . : : ::.::: ::::.: : . . CCDS44 LQHPPSTAPPVPLLRSHSMPSAACT-----ISTPHHPFRGSYSFDDHI----TDSEALSH 530 540 550 560 570 890 900 910 920 930 940 pF1KE0 NAPVPQSGHPRTLVRQAAIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQG .. : : ::: : :: ::: ..: : : :.. .. . . . :.. CCDS44 SSHVFTS-HPRMLKRQPAIELPLGGEYSSEEPGPS---SKDTASKPSDEVEPKESELTK- 580 590 600 610 620 630 950 960 970 980 990 pF1KE0 PHIEKKKSHQGRGTMFECETCRNRYRKLENFENHKKFYCSELHGPKTKVAMR----EPEH . ::. . .:...::. : ::.: .:.: :::.:::::. : : : :. CCDS44 ---KTKKGLKTKGVIYECNICGARYKKRDNYEAHKKYYCSELQIAKPISAGTHTSPEAEK 640 650 660 670 680 1000 1010 1020 1030 1040 1050 pF1KE0 SPVPGGLQPQILHYRVAGSSGIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQ : . :..::.. :.. : :: .::::: ::.::.:: :: : .: : CCDS44 SQIEHEPWSQMMHYKL-GTT--LELTP-LRKRRKEKSLGDEEEPPAFESTKSQFGSPG-- 690 700 710 720 730 740 1060 1070 1080 1090 1100 1110 pF1KE0 FQNALGCNPSLPKHNVTIRSDQQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSA :: .:. ..: .. . . . . .:: ..:. . .:. CCDS44 --------PSDAARNLPLESTKSPAEPSKSVPSL----EGPTG-FQPRTP-----KPGSG 750 760 770 780 1120 1130 1140 1150 1160 1170 pF1KE0 AQDKIELQRHGTGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGI ... : . . :::::::.:. . .:...: .: :.. : CCDS44 SESGKERRTTSKEISVIQHTSSFEKSDSLEQPSGLE-------------GEDKPL----- 790 800 810 820 1180 1190 1200 1210 1220 1230 pF1KE0 SQEESHPSRDGSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILV .: : : :: .:.. : : :: .:::: ::::::::: CCDS44 AQFPSPPPA----PH---------------GRSA----HSL-QP-KLVRQPNIQVPEILV 830 840 850 860 1240 1250 1260 1270 1280 1290 pF1KE0 TEEPDR-DLEAQC--HDQEKSEKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTES :::::: : : . .. ::.:.:.:::::.::..::.::::::::::::::. .:: :: CCDS44 TEEPDRPDTEPEPPPKEPEKTEEFQWPQRSQTLAQLPAEKLPPKKKRLRLAEMAQSSGES 870 880 890 900 910 920 1300 1310 1320 1330 1340 1350 pF1KE0 SFDST--LSRSLSRESSLSHT-SSFSASLDIEDVSKTEA-SPKIDFLNKAEFLMIPAGLN ::.:. :::: :.::..: . :: :::.. .: .:.:: ::. :. : : : . CCDS44 SFESSVPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSDMRPK------PLGTH 930 940 950 960 970 1360 1370 1380 1390 1400 pF1KE0 TLNVPGCH---REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPSS :.::. : :::::.:::: .. : .... :::::: ::.. : ::. CCDS44 MLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSLS---------LTGPSA 980 990 1000 1010 1020 1410 1420 1430 1440 1450 1460 pF1KE0 PSRVGVTGHVPLLERRRGPLVRQISLNIAPDSHLSPVHPTSFQNTALPSVNAVPYQGPQL :. :. ..: :::. :::: ::. :.:.: : : . :.. :. : .. CCDS44 PAPVAPPARVAPPERRKCFLVRQASLSRPPESELE-VAPKGRQESEEPQ----PSSSKPS 1030 1040 1050 1060 1070 1080 1470 1480 1490 1500 1510 pF1KE0 TSTSLAEFS-ANTLHS-----QTQVKD---LQAETSNSSSTNVF--PVQQLCDINLLNQI ...::...: : : :. . .: : . . . .:: :: : : .. CCDS44 AKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQT---PLHEKP 1090 1100 1110 1120 1130 1520 1530 1540 1550 1560 pF1KE0 HAPP-----------SHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCF-APKYQLHCQV . :: .:. : :::. . .: : . : :: :. : CCDS44 YLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPTV 1140 1150 1160 1170 1180 1190 1570 1580 1590 1600 1610 pF1KE0 FTSG----PSCSSNPVH---SLPNQVISDPVGTDHCVTSAT-LPTK-----LIDSISNSH . : :. .:.. : . . : :. ..:. :: . . . .:: CCDS44 LHPGQLHLPQLMPHPANIPFRQPPSFLPMPYPTSSALSSGFFLPLQSQFALQLPGDVESH 1200 1210 1220 1230 1240 1250 1620 1630 pF1KE0 ---------PL------------------LPPELRPLGSQVQK------VPS------SF :: ::: : .:.. .:. :. CCDS44 LPQIKTSLAPLATGSAGLSPSTEYSSDIRLPPVAPPASSSAPTSAPPLALPACPDTMVSL 1260 1270 1280 1290 1300 1310 1640 1650 1660 1670 1680 pF1KE0 MLPIRLQSSVPAYCFATLTSLPQILVTQD--------LPN--QPICQTNHSVVPISEEQN ..:.:.:...:.: : :.: ::::::. ::. .: . . .: . CCDS44 VVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFEEPPSKGTTVCGADVHEVG 1320 1330 1340 1350 1360 1370 1690 1700 1710 1720 1730 1740 pF1KE0 SVPT-LQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQESSAS :. :.. .. :.:.: .: : ...::: :. : .. .... CCDS44 PGPSGLSEEQSRAFPTP---YLRVPVTLPERKGTSLSSE-------SILSLEGSSSTAGG 1380 1390 1400 1410 1420 1750 1760 1770 1780 1790 1800 pF1KE0 SKRMLSPANSLDIAME-KHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVRQV :::.::::.::...:: ..:::.:.:. .:...: . :: .: CCDS44 SKRVLSPAGSLELTMETQQQKRVKEEE--------------ASKADEKLELVKPC---SV 1430 1440 1450 1460 1470 1810 1820 1830 1840 1850 1860 pF1KE0 CTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFENIK : :: ::. ... . . ... . : .: :.: : . : :.. CCDS44 VLTSTEDGKRPEKSHLGNQGQGRRELEMLSSLSSDPSDT---KEIPPLPHPALSH----- 1480 1490 1500 1510 1520 1870 1880 1890 1900 1910 pF1KE0 SSTSLTLTVRSSPAPSENTH---ISPL--KCTDNNQERKSPGVKNQGDKVNIQEQSQQPV ... . ... : :: . : ..:: : :.... :.. .. . ..: :..:. CCDS44 GTAPGSEALKEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LPLSETSSRPA 1530 1540 1550 1560 1570 1580 1920 1930 1940 1950 1960 1970 pF1KE0 TSLSLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNP : . : . : ::::.:::: .:::: : :. . :...:.:. : .: ::: CCDS44 KSQEGTDSKKVLQ--FPSLHTTTNVSWCYLNYIKPNHIQHADRRSSVYAGWCISLYNPNL 1590 1600 1610 1620 1630 1980 1990 2000 2010 2020 2030 pF1KE0 LGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVE :. ::.::.:: :::...: : .: . : .. :: ::. : ... : : : CCDS44 PGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSSRKPRMTEVHL---PSLVSP 1640 1650 1660 1670 1680 1690 2040 2050 2060 2070 2080 2090 pF1KE0 FSNKDASEINSEQDKEN-------SLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYIC ..:: .....:..... . ..:: :::::.::::::::::::::::::::.: CCDS44 EGQKDLARVEKEEERRGEPEEDAPASQRGEPARIKIFEGGYKSNEEYVYVRGRGRGKYVC 1700 1710 1720 1730 1740 1750 2100 2110 2120 2130 2140 pF1KE0 EECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGV- :::::::::::::::::::::::::: : .:.:.:::::::::::::::::::: . :: CCDS44 EECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNLTKHMKSKAHSKKCQETGVL 1760 1770 1780 1790 1800 1810 2150 2160 2170 2180 2190 2200 pF1KE0 -----SVGLIDE--QDTEESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESV : :. ::.: . : .. :.. :::.::. : : .:.::.::. .... CCDS44 EELEAEEGTSDDLFQDSE-GREGSEAVEEHQFSDLEDSDS-DSDLDEDEDEDEE-ESQDE 1820 1830 1840 1850 1860 1870 2210 2220 2230 2240 2250 pF1KE0 LSATPSVTASPQHLP-----SRSSLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRM :: :: : : : . : . : : . :. : .. . :. CCDS44 LS-RPSSEAPPPGPPHALRADSSPILGPQPPDAPASGTEATRGSSVSEAE--------RL 1880 1890 1900 1910 1920 2260 2270 2280 2290 2300 2310 pF1KE0 TVLSTAQSDYNRKTLSPGKARQRAARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSM :. : ..:. . : : . . :.:: .. : .: : .: : . CCDS44 TASSCSMSSQSMPGL-PWLGPAPLGSVEKDTGSAL--SYKPVSPRRPWSPSKEAGSRPPL 1930 1940 1950 1960 1970 1980 2320 2330 2340 2350 2360 pF1KE0 AGKAVAITQSPSS------VRLPPAAAEHSP--QTAAGMPSVASPHPDPQEQKQQITLQP : : ..:.. :: .: : :.: : .. : : : .:. : . .:: : CCDS44 ARKH-SLTKNDSSPQRCSPAREPQASAPSPPGLHVDPGRGMGALPCGSPRLQLSPLTLCP 1990 2000 2010 2020 2030 2040 2370 2380 2390 2400 2410 pF1KE0 TPGLPSPHTHLFSHL--------PLHSQQ------QSRTPYNMVPVGGIHVV-PAGLTYS .:..:..:.: : .: :...: .: : .. :.. . . CCDS44 LGRELAPRAHVLSKLEGTTDPGLPRYSPTRRWSPGQAESPPRSAPPGKWALAGPGSPSAG 2050 2060 2070 2080 2090 2100 2420 2430 2440 2450 2460 2470 pF1KE0 TFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRV : . .. .: . . :. :. :. : .: : :: : : : : CCDS44 EHGPGLGLDPRVLFPPAPLPHKLLS--RSPETCAS----PWK-AE-SRSPSCSP-G---- 2110 2120 2130 2140 2480 2490 2500 2510 2520 2530 pF1KE0 PGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAVGLQVLTANPSSQSS : . : :.: : ... . :: :. : : :.. : :: . CCDS44 P-----AHP-LSSRPFSALHDFHGHILARTEENIFSHLP---LHS---QHLT------RA 2150 2160 2170 2180 2540 2550 2560 2570 2580 pF1KE0 PAPQAHIPGLQILNI---ALPTLIPSVSQVAVD--AQGAPEMPASQSKACET---QPKQT : : : :.:... : :::.:. . . :. . :. .. ... .: : .: .. CCDS44 PCPLIPIGGIQMVQARPGAHPTLLPGPTAAWVSGFSGGGSDLTGAR-EAQERGRWSPTES 2190 2200 2210 2220 2230 2240 2590 2600 2610 2620 2630 2640 pF1KE0 SVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAASANHVKP : ::.. :... .: .:. .::. . . :..... : CCDS44 SSASVSPVAKV-------------SKFTLSSELEGGDYPK-------ERERTGGGPGRPP 2250 2260 2270 2280 2650 2660 2670 2680 2690 2700 pF1KE0 K--PELTSIQGQPASTSQPLLKAHSEVFTKPSGQ---QTLSPDRQVPRPTALPRRQPTVH :. :. ..:. : .: . . :.:. :. :: . :: . :. . : CCDS44 DWTPHGTGAPAEPTPTHSPCTPPDT-LPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPP 2290 2300 2310 2320 2330 2340 2710 pF1KE0 FSDVSSDDDEDRLVIAT .. :: CCDS44 LDRSSSVGCLAEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2350 2360 2370 2380 2390 2400 >>CCDS463.1 HIVEP3 gene_id:59269|Hs108|chr1 (2406 aa) initn: 1987 init1: 601 opt: 1059 Z-score: 401.1 bits: 88.4 E(32554): 5e-16 Smith-Waterman score: 2649; 31.0% identity (53.5% similar) in 2676 aa overlap (203-2707:1-2354) 180 190 200 210 220 pF1KE0 RTDNSECISSHCGTMSPSYTNTAFDVLLKAMEPELSTLSQK---GSPCA--IKTEKLRPN :.:: :. . : ::: : : .. . CCDS46 MDPEQSVKGTKKAEGSPRKRLTKGEAIQ-T 10 20 230 240 250 260 270 280 pF1KE0 KTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGAMQSASHLYHQH ... : : ... . .. .:::.: . : ... .. .:. : . CCDS46 SVSSSVPYPGSGTAATQESPAQELLAPQPFPGPSSVLREGSQEKTGQQQKPPKRPPIEAS 30 40 50 60 70 80 290 300 310 320 330 340 pF1KE0 EHFVPKSNQHNQQLPGCSGFTGSLTNLQNQENAKLEQVYNIAVTSSVGLTSPSSRSQVTP : . . :: : .: . . :.. . : . : ....:. . : CCDS46 VH-ISQLPQH----PLTPAFMSPGKPEHLLEGSTWQLVDPMRPGPSGSFVAPG----LHP 90 100 110 120 130 140 350 360 370 380 390 400 pF1KE0 QNQQMDSASPLSISPANSTQSPPMPIYNSTHVASVVNQSVEQMCNLLLKDQKPKKQGKYI :.: . : . . : : . : . . ..:. .. ... :..::.: :::: CCDS46 QSQLLPSHASI-IPPEDLPGVPKVFVPRPSQVSLKPTEEAHK------KERKPQKPGKYI 150 160 170 180 190 410 420 430 440 450 460 pF1KE0 CEYCNRACAKPSVLLKHIRSHTGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQ :.::.: ::::::: :::::::::::::: ::::::::::::::.::::: :: ::. CCDS46 CQYCSRPCAKPSVLQKHIRSHTGERPYPCGPCGFSFKTKSNLYKHRKSHAHRIKAGLA-- 200 210 220 230 240 250 470 480 490 500 510 520 pF1KE0 PDAGGLFLSHESPKALSIHSDVEDSGESEEEGATDERQHDLGAMELQPVHIIKRMSNAET :: . :..: .. . : :: . . ... .: .:... : . CCDS46 SGMGGEMY----PHGLEMERIPGEEFEEPTEGESTDSEEETSATSGHPAELSPR--PKQP 260 270 280 290 300 530 540 550 560 570 580 pF1KE0 LLKSSFTPSSPENVIGDFLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPEL ::.:.. :. .. . ..:. .:.. . : : . .: . .. ::: CCDS46 LLSSGLYSSGSHSSSHERCSLSQSSTAQSLEDPPPFV---------EPSSEHPLSHKPED 310 320 330 340 350 590 600 610 620 630 640 pF1KE0 SSAQKQKDLQVTNVQPLSANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQ . . ::: :. .:. CCDS46 THTIKQK---------LALRLSE------------------------------------- 360 370 650 660 670 680 690 700 pF1KE0 RQQATDYSQEQQGKLLSPRSLGSTDSGYFSRSESADQTVSPPTPFARRLPST-EQDSGRS :... : :: .::: : :::.::::::::::.: ::::. :. :: CCDS46 RKKVID---EQA--FLSPGSKGSTESGYFSRSESAEQQVSPPNTNAKSYAEIIFGKCGRI 380 390 400 410 420 710 720 730 740 750 760 pF1KE0 NGPSAALVTASTPSALP--TGEKALLLPGQMRPPLATKTLEERISKLISDNEALVDDKQL . .: :...:: :: : .: :.: . : :...:. :.:::. :::.:: ... CCDS46 GQRTAMLTATSTQPLLPLSTEDKPSLVP--LSVP-RTQVIEH-ITKLITINEAVVDTSEI 430 440 450 460 470 480 770 780 790 800 810 820 pF1KE0 DSVKPRRTSLSRRGSIDSPKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVF :::::::.:::::.:..:::: .... :. :: :. : : :.: . CCDS46 DSVKPRRSSLSRRSSMESPKSSLYRE-------PL----SSHSEKTK-P----EQS-LLS 490 500 510 520 830 840 850 860 870 880 pF1KE0 LLSVPSL-DCLPITRSNSMPTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGP : :: .:. ::.:::... . : : ::.::: ::::.: : . . CCDS46 LQHPPSTAPPVPLLRSHSMPSAACT-----ISTPHHPFRGSYSFDDHI----TDSEALSH 530 540 550 560 570 890 900 910 920 930 940 pF1KE0 NAPVPQSGHPRTLVRQAAIEDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQG .. : : ::: : :: ::: ..: : : :.. .. . . . :.. CCDS46 SSHVFTS-HPRMLKRQPAIELPLGGEYSSEEPGPS---SKDTASKPSDEVEPKESELTK- 580 590 600 610 620 630 950 960 970 980 990 pF1KE0 PHIEKKKSHQGRGTMFECETCRNRYRKLENFENHKKFYCSELHGPKTKVAMR----EPEH . ::. . .:...::. : ::.: .:.: :::.:::::. : : : :. CCDS46 ---KTKKGLKTKGVIYECNICGARYKKRDNYEAHKKYYCSELQIAKPISAGTHTSPEAEK 640 650 660 670 680 1000 1010 1020 1030 1040 1050 pF1KE0 SPVPGGLQPQILHYRVAGSSGIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQ : . :..::.. :.. : :: .::::: ::.::.:: :: : .: : CCDS46 SQIEHEPWSQMMHYKL-GTT--LELTP-LRKRRKEKSLGDEEEPPAFESTKSQFGSPG-- 690 700 710 720 730 740 1060 1070 1080 1090 1100 1110 pF1KE0 FQNALGCNPSLPKHNVTIRSDQQHKNIQLQNSHIHLVARGPEQTMDPKLSTIMEQQISSA :: .:. ..: .. . . . . .:: ..:. . .:. CCDS46 --------PSDAARNLPLESTKSPAEPSKSVPSL----EGPTG-FQPRTP-----KPGSG 750 760 770 780 1120 1130 1140 1150 1160 1170 pF1KE0 AQDKIELQRHGTGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGSLKVIGI ... : . . :::::::.:. . .:...: .: :.. : CCDS46 SESGKERRTTSKEISVIQHTSSFEKSDSLEQPSGLE-------------GEDKPL----- 790 800 810 820 1180 1190 1200 1210 1220 1230 pF1KE0 SQEESHPSRDGSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILV .: : : :: .:.. : : :: .:::: ::::::::: CCDS46 AQFPSPPPA----PH---------------GRSA----HSL-QP-KLVRQPNIQVPEILV 830 840 850 860 1240 1250 1260 1270 1280 1290 pF1KE0 TEEPDR-DLEAQC--HDQEKSEKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTES :::::: : : . .. ::.:.:.:::::.::..::.::::::::::::::. .:: :: CCDS46 TEEPDRPDTEPEPPPKEPEKTEEFQWPQRSQTLAQLPAEKLPPKKKRLRLAEMAQSSGES 870 880 890 900 910 920 1300 1310 1320 1330 1340 1350 pF1KE0 SFDST--LSRSLSRESSLSHT-SSFSASLDIEDVSKTEA-SPKIDFLNKAEFLMIPAGLN ::.:. :::: :.::..: . :: :::.. .: .:.:: ::. :. : : : . CCDS46 SFESSVPLSRSPSQESNVSLSGSSRSASFERDDHGKAEAPSPSSDMRPK------PLGTH 930 940 950 960 970 1360 1370 1380 1390 1400 pF1KE0 TLNVPGCH---REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPSS :.::. : :::::.:::: .. : .... :::::: ::.. : ::. CCDS46 MLTVPSHHPHAREMRRSASEQSPNVSHSAHMTETRSKSFDYGSLS---------LTGPSA 980 990 1000 1010 1020 1410 1420 1430 1440 1450 1460 pF1KE0 PSRVGVTGHVPLLERRRGPLVRQISLNIAPDSHLSPVHPTSFQNTALPSVNAVPYQGPQL :. :. ..: :::. :::: ::. :.:.: : : . :.. :. : .. CCDS46 PAPVAPPARVAPPERRKCFLVRQASLSRPPESELE-VAPKGRQESEEPQ----PSSSKPS 1030 1040 1050 1060 1070 1080 1470 1480 1490 1500 1510 pF1KE0 TSTSLAEFS-ANTLHS-----QTQVKD---LQAETSNSSSTNVF--PVQQLCDINLLNQI ...::...: : : :. . .: : . . . .:: :: : : .. CCDS46 AKSSLSQISSAATSHGGPPGGKGPGQDRPPLGPTVPYTEALQVFHHPVAQT---PLHEKP 1090 1100 1110 1120 1130 1520 1530 1540 1550 1560 pF1KE0 HAPP-----------SHQSTQLSLQVSTQGSKPDKNSVLSGSSKSEDCF-APKYQLHCQV . :: .:. : :::. . .: : . : :: :. : CCDS46 YLPPPVSLFSFQHLVQHEPGQSPEFFSTQAMSSLLSSPYSMPPLPPSLFQAPPLPLQPTV 1140 1150 1160 1170 1180 1190 1570 1580 1590 1600 1610 pF1KE0 FTSG----PSCSSNPVH---SLPNQVISDPVGTDHCVTSAT-LPTK-----LIDSISNSH . : :. .:.. : . . : :. ..:. :: . . . .:: CCDS46 LHPGQLHLPQLMPHPANIPFRQPPSFLPMPYPTSSALSSGFFLPLQSQFALQLPGDVESH 1200 1210 1220 1230 1240 1250 1620 1630 pF1KE0 ---------PL------------------LPPELRPLGSQVQK------VPS------SF :: ::: : .:.. .:. :. CCDS46 LPQIKTSLAPLATGSAGLSPSTEYSSDIRLPPVAPPASSSAPTSAPPLALPACPDTMVSL 1260 1270 1280 1290 1300 1310 1640 1650 1660 1670 1680 pF1KE0 MLPIRLQSSVPAYCFATLTSLPQILVTQD--------LPN--QPICQTNHSVVPISEEQN ..:.:.:...:.: : :.: ::::::. ::. .: . . .: . CCDS46 VVPVRVQTNMPSYGSAMYTTLSQILVTQSQGSSATVALPKFEEPPSKGTTVCGADVHEVG 1320 1330 1340 1350 1360 1370 1690 1700 1710 1720 1730 1740 pF1KE0 SVPT-LQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKISVGRLSPQQESSAS :. :.. .. :.:.: .: : ...::: :. : .. .... CCDS46 PGPSGLSEEQSRAFPTP---YLRVPVTLPERKGTSLSSE-------SILSLEGSSSTAGG 1380 1390 1400 1410 1420 1750 1760 1770 1780 1790 1800 pF1KE0 SKRMLSPANSLDIAME-KHQKRAKDENGAVCATDVRPLEALSSRVNEASKQKKPILVRQV :::.::::.::...:: ..:::.:.:. .:...: . :: .: CCDS46 SKRVLSPAGSLELTMETQQQKRVKEEE--------------ASKADEKLELVKPC---SV 1430 1440 1450 1460 1470 1810 1820 1830 1840 1850 1860 pF1KE0 CTTEPLDGVMLEKDVFSQPEISNEAVNLTNVLPADNSSTGCSKFVVIEPISELQEFENIK : :: ::. ... . . ... . : .: :.: : . : :.. CCDS46 VLTSTEDGKRPEKSHLGNQGQGRRELEMLSSLSSDPSDT---KEIPPLPHPALSH----- 1480 1490 1500 1510 1520 1870 1880 1890 1900 1910 pF1KE0 SSTSLTLTVRSSPAPSENTH---ISPL--KCTDNNQERKSPGVKNQGDKVNIQEQSQQPV ... . ... : :: . : ..:: : :.... :.. .. . ..: :..:. CCDS46 GTAPGSEALKEYPQPSGKPHRRGLTPLSVKKEDSKEQPDLPSLAPPSS-LPLSETSSRPA 1530 1540 1550 1560 1570 1580 1920 1930 1940 1950 1960 1970 pF1KE0 TSLSLFNIKDTQQLAFPSLKTTTNFTWCYLLRQKSLHLPQKDQKTSAYTDWTVSASNPNP : . : . : ::::.:::: .:::: : :. . :...:.:. : .: ::: CCDS46 KSQEGTDSKKVLQ--FPSLHTTTNVSWCYLNYIKPNHIQHADRRSSVYAGWCISLYNPNL 1590 1600 1610 1620 1630 1980 1990 2000 2010 2020 2030 pF1KE0 LGLPTKVALALLNSKQNTGKSLYCQAITTHSKSDLLVYSSKWKSSLSKRALGNQKSTVVE :. ::.::.:: :::...: : .: . : .. :: ::. : ... : : : CCDS46 PGVSTKAALSLLRSKQKVSKETYTMATAPHPEAGRLVPSSSRKPRMTEVHL---PSLVSP 1640 1650 1660 1670 1680 1690 2040 2050 2060 2070 2080 2090 pF1KE0 FSNKDASEINSEQDKEN-------SLIKSEPRRIKIFDGGYKSNEEYVYVRGRGRGKYIC ..:: .....:..... . ..:: :::::.::::::::::::::::::::.: CCDS46 EGQKDLARVEKEEERRGEPEEDAPASQRGEPARIKIFEGGYKSNEEYVYVRGRGRGKYVC 1700 1710 1720 1730 1740 1750 2100 2110 2120 2130 2140 pF1KE0 EECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFSFKTKGNLTKHMKSKAHSKKCVDLGV- :::::::::::::::::::::::::: : .:.:.:::::::::::::::::::: . :: CCDS46 EECGIRCKKPSMLKKHIRTHTDVRPYVCKHCHFAFKTKGNLTKHMKSKAHSKKCQETGVL 1760 1770 1780 1790 1800 1810 2150 2160 2170 2180 2190 2200 pF1KE0 -----SVGLIDE--QDTEESDEKQRFSYERSGYDLEESDGPDEDDNENEDDDEDSQAESV : :. ::.: . : .. :.. :::.::. : : .:.::.::. .... CCDS46 EELEAEEGTSDDLFQDSE-GREGSEAVEEHQFSDLEDSDS-DSDLDEDEDEDEE-ESQDE 1820 1830 1840 1850 1860 1870 2210 2220 2230 2240 2250 pF1KE0 LSATPSVTASPQHLP-----SRSSLQDPVSTDEDVRITDCFSGVHTDPMDVLPRALLTRM :: :: : : : . : . : : . :. : .. . :. CCDS46 LS-RPSSEAPPPGPPHALRADSSPILGPQPPDAPASGTEATRGSSVSEAE--------RL 1880 1890 1900 1910 1920 2260 2270 2280 2290 2300 2310 pF1KE0 TVLSTAQSDYNRKTLSPGKARQRAARDENDTIPSVDTSRSPCHQMSVDYPESEEILRSSM :. : ..:. . : : . . :.:: .. : .: : .: : . CCDS46 TASSCSMSSQSMPGL-PWLGPAPLGSVEKDTGSAL--SYKPVSPRRPWSPSKEAGSRPPL 1930 1940 1950 1960 1970 1980 2320 2330 2340 2350 2360 pF1KE0 AGKAVAITQSPSS------VRLPPAAAEHSP--QTAAGMPSVASPHPDPQEQKQQITLQP : : ..:.. :: .: : :.: : .. : : : .:. : . .:: : CCDS46 ARKH-SLTKNDSSPQRCSPAREPQASAPSPPGLHVDPGRGMGALPCGSPRLQLSPLTLCP 1990 2000 2010 2020 2030 2040 2370 2380 2390 2400 2410 pF1KE0 TPGLPSPHTHLFSHL--------PLHSQQ------QSRTPYNMVPVGGIHVV-PAGLTYS .:..:..:.: : .: :...: .: : .. :.. . . CCDS46 LGRELAPRAHVLSKLEGTTDPGLPRYSPTRRWSPGQAESPPRSAPPGKWALAGPGSPSAG 2050 2060 2070 2080 2090 2100 2420 2430 2440 2450 2460 2470 pF1KE0 TFVPLQAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRV : . .. .: . . :. :. :. : .: : :: : : : : CCDS46 EHGPGLGLDPRVLFPPAPLPHKLLS--RSPETCAS----PWQKAE-SRSPSCSP-G---- 2110 2120 2130 2140 2480 2490 2500 2510 2520 2530 pF1KE0 PGLQNLSTPGLQSLPSLSMETVNIVGLANTNMAPQVHPPGLALNAVGLQVLTANPSSQSS : . : :.: : ... . :: :. : : :.. : :: . CCDS46 P-----AHP-LSSRPFSALHDFHGHILARTEENIFSHLP---LHS---QHLT------RA 2150 2160 2170 2180 2190 2540 2550 2560 2570 2580 pF1KE0 PAPQAHIPGLQILNI---ALPTLIPSVSQVAVD--AQGAPEMPASQSKACET---QPKQT : : : :.:... : :::.:. . . :. . :. .. ... .: : .: .. CCDS46 PCPLIPIGGIQMVQARPGAHPTLLPGPTAAWVSGFSGGGSDLTGAR-EAQERGRWSPTES 2200 2210 2220 2230 2240 2590 2600 2610 2620 2630 2640 pF1KE0 SVASANQVSRTESPQGLPTVQRENAKKVLNPPAPAGDHARLDGLSKMDTEKAASANHVKP : ::.. :... .: .:. .::. . . :..... : CCDS46 SSASVSPVAKV-------------SKFTLSSELEGGDYPK-------ERERTGGGPGRPP 2250 2260 2270 2280 2650 2660 2670 2680 2690 2700 pF1KE0 K--PELTSIQGQPASTSQPLLKAHSEVFTKPSGQ---QTLSPDRQVPRPTALPRRQPTVH :. :. ..:. : .: . . :.:. :. :: . :: . :. . : CCDS46 DWTPHGTGAPAEPTPTHSPCTPPDT-LPRPPQGRRAAQSWSPRLESPRAPTNPEPSATPP 2290 2300 2310 2320 2330 2340 2710 pF1KE0 FSDVSSDDDEDRLVIAT .. :: CCDS46 LDRSSSVGCLAEASARFPARTRNLSGEPRTRQDSPKPSGSGEPRAHPHQPEDRVPPNA 2350 2360 2370 2380 2390 2400 >>CCDS43510.1 HIVEP2 gene_id:3097|Hs108|chr6 (2446 aa) initn: 1923 init1: 629 opt: 934 Z-score: 356.4 bits: 80.2 E(32554): 1.6e-13 Smith-Waterman score: 2750; 32.5% identity (55.1% similar) in 2437 aa overlap (247-2426:3-2257) 220 230 240 250 260 270 pF1KE0 CAIKTEKLRPNKTARSPPKLKNSSMDAPNQTSQELVAESQSSCTSYTVHMSAAQKNEQGA :.. .... .: .. : . :. ..::.: CCDS43 MDTGDTALGQKATSRSGETDKASGRWRQEQSA 10 20 30 280 290 300 310 320 pF1KE0 ---MQS-ASHLYHQHEHFVPKS--NQHNQQLPGCSGFTGSLTNLQNQENAKL-----EQV :.. .:: ... .. :.. : . :: : :: .: ... .: : . CCDS43 VIKMSTFGSHEGQRQPQIEPEQIGNTASAQLFG-SGKLASPSEVVQQVAEKQYPPHRPSP 40 50 60 70 80 90 330 340 350 360 370 pF1KE0 YNIAVTSSVGLTS-PSSRSQVTPQNQQMDSASPLSISPANSTQSP---PMPI------YN :. . : : :.. . : .:.... : .: :. : :.:: : CCDS43 YSCQHSLSFPQHSLPQGVMHSTKPHQSLEGPPWLFPGPLPSVASEDLFPFPIHGHSGGYP 100 110 120 130 140 150 380 390 400 410 420 pF1KE0 STHVASV-------VNQSVEQMCNLLLKDQKPKKQGKYICEYCNRACAKPSVLLKHIRSH ...:. ..:.:: . :..:::: ::::: ::.::::::::: :::::: CCDS43 RKKISSLNPAYSQYSQKSIEQAEEAHKKEHKPKKPGKYICPYCSRACAKPSVLKKHIRSH 160 170 180 190 200 210 430 440 450 460 470 480 pF1KE0 TGERPYPCVTCGFSFKTKSNLYKHKKSHAHTIKLGLVLQPDAGGLFLSHES---PKALSI ::::::::. ::::::::::::::.:::::.:: ::: ... :. :. : CCDS43 TGERPYPCIPCGFSFKTKSNLYKHRKSHAHAIKAGLVPFTESAVSKLDLEAGFIDVEAEI 220 230 240 250 260 270 490 500 510 520 530 540 pF1KE0 HSDVEDSGESEEEGATDERQHD-LGAMELQPVHIIKRMSNAETLLKSSFTPSSPENVIGD ::: :.: ...::.. . : .. :. : .: ... : :.. : CCDS43 HSDGEQSTDTDEESSLFAEASDKMSPGPPIPLDIASR---------GGYHGSLEESLGGP 280 290 300 310 320 550 560 570 580 590 600 pF1KE0 FLLQDRSAESQAVTELPKVVVHHVTVSPLRTDSPKAMDPKPELSSAQKQKDLQVTNVQPL . ..: ... ::. : :. :: :. : CCDS43 M-------------KVPILII------------PKSGIPLPNESSQYIGPDML-----P- 330 340 350 610 620 630 640 650 660 pF1KE0 SANMSQGGVSRLETNENSHQKGDMNPLEGKQDSHVGTVHAQLQRQQATDYSQEQQGKLLS : . . :.: :::. . :. .. ..: . .::: CCDS43 --------------NPSLNTKAD--------DSHTVKQKLALRLSEKKGQDSEPSLNLLS 360 370 380 670 680 690 700 710 720 pF1KE0 PRSLGSTDSGYFSRSESADQTVSPPTPFARRLPSTEQDSGRSNGPSAAL-VTASTPSALP :.: ::::::::::::::.: .:::. :. . .: :: ::... CCDS43 PHSKGSTDSGYFSRSESAEQQISPPNTNAKSYEEIIFGKYCRLSPRNALSVTTTSQERAA 390 400 410 420 430 440 730 740 750 760 770 780 pF1KE0 TGEKALLLP-GQMRPPLATKTLEERISKLISDNEALVDDKQLDSVKPRRTSLSRRGSIDS :.:... : .. : .: .:. .:.:: .. .: : .::. . ...: CCDS43 MGRKGIMEPLPHVNTRLDVKMFEDPVSQLIPSK---------GDVDPSQTSMLKSTKFNS 450 460 470 480 490 500 790 800 810 820 830 840 pF1KE0 PKSYIFKDSFQFDLKPVGRRTSSSSDIPKSPFTPTEKSKQVFLLSVPSLDCLPITRSNSM .: : .. : . :. .. . . : . :. : :: .: .: :. ::::. CCDS43 -------ESRQPQIIPSSIRNEGK--LYPANF---QGSNPV-LLEAP-VDSSPLIRSNSV 510 520 530 540 850 860 870 880 890 900 pF1KE0 PTTGYSAVPANIIPPPHPLRGSQSFDDKIGAFYDDVFVSGPNAPVPQSGHPRTLVRQAAI ::. ::. :. :: ::::.:::... . :::: : . :: : : ::::. CCDS43 PTS--SAT--NLTIPPS-LRGSHSFDERMTG-SDDVFYPGTVGIPPQ----RMLRRQAAF 550 560 570 580 590 910 920 930 940 950 960 pF1KE0 EDSSANESHVLGTGQSLDESHQGCHAAGEAMSVRSKALAQGPHIEKKKSHQGRGTMFECE : :..:.:: . :.: : . :..: ..:: : . .. . CCDS43 ELPSVQEGHV-------EVEHHGRMLKG----ISSSSL------KEKKLSPGDRVGYDYD 600 610 620 630 970 980 990 1000 1010 pF1KE0 TCRNRYRKLENFENHKKFYCSELHGPKTKVAMREPEHSPVPGG---LQPQILHYRVAGSS .::. :.: :. :. :. : . . .: :: ..: . . : CCDS43 VCRKPYKKWEDSETPKQNY-------RDISCLSSLKH----GGEYFMDPVV---PLQGVP 640 650 660 670 680 1020 1030 1040 1050 1060 1070 pF1KE0 GIWEQTPQIRKRRKMKSVGDDEELQQNESGTSPKSSEGLQFQNALGCNPSLPKHNVTIRS ... : . ::::: :::::.:. . :. .. :.. : .:.: . . .:: CCDS43 SMFGTTCENRKRRKEKSVGDEEDTPMICSSIV-STPVGIM---ASDYDPKL-QMQEGVRS 690 700 710 720 730 740 1080 1090 1100 1110 1120 1130 pF1KE0 D---QQHKNIQLQNSHIHLVARGP--EQTMDPKLSTIMEQQISSAAQDKI-EL---QRHG :.:. :: : : : . . : . :.. :. .::. .: . : CCDS43 GFAMAGHENL----SHGHTERFDPCRPQLQPGSPSLVSEESPSAIDSDKMSDLGGRKPPG 750 760 770 780 790 1140 1150 1160 1170 1180 pF1KE0 TGISVIQHTNSLSRPNSFDKPEPFERASPVSFQELNRTGKSGS-LKVIGISQEESHPSRD . ::::::::::::::::.. : : .. .. . . . : .. .: : . :. : CCDS43 NVISVIQHTNSLSRPNSFERSESAELVACTQDKAPSPSETCDSEISEAPVSPEWAPPG-D 800 810 820 830 840 850 1190 1200 1210 1220 1230 1240 pF1KE0 GSHPHQLALSDALRGELQESSRKSPSERHVLGQPSRLVRQHNIQVPEILVTEEPDR---D :.. :. . :.. . . :. :: ::::::::::::: ::::::. . CCDS43 GAESG---------GKPSPSQQVQQQSYHT--QP-RLVRQHNIQVPEIRVTEEPDKPEKE 860 870 880 890 900 1250 1260 1270 1280 1290 1300 pF1KE0 LEAQCHDQEKS-EKFSWPQRSETLSKLPTEKLPPKKKRLRLAEIEHSSTESSFDST---L ::: .. :: :.:.:::::::::.::.:::::::::::::..:::: ::::.:: : CCDS43 KEAQSKEPEKPVEEFQWPQRSETLSQLPAEKLPPKKKRLRLADMEHSSGESSFESTGTGL 910 920 930 940 950 960 1310 1320 1330 1340 1350 1360 pF1KE0 SRSLSRESSLSHTSSFSASLDIEDVSKTEASPKIDFLNK-AEFLMIPAGLNTLNVPGCH- ::: :.::.:::.:::: :.. :..:: : :: : ..: .::: .::: .:.::: : CCDS43 SRSPSQESNLSHSSSFSMSFEREETSKLSALPKQDEFGKHSEFLTVPAGSYSLSVPGHHH 970 980 990 1000 1010 1020 1370 1380 1390 1400 1410 pF1KE0 -REMRRTASEQINCTQTSMEVSDLRSKSFDCGSITPPQTTPLTELQPPS-SPSRVGVTGH .:::: .:::. : . . :: ..:::::: :... .:.. . :::: CCDS43 QKEMRRCSSEQMPCPHPA-EVPEVRSKSFDYGNLSH---APVSGAAASTVSPSR------ 1030 1040 1050 1060 1070 1420 1430 1440 1450 1460 1470 pF1KE0 VPLLERRRGPLVRQISLNIAPDSHLSPV-HPTSFQNTALPSVNAVP----YQGPQLTSTS ::.. :::: :.. .:. . : : .. : ..: ..:: . CCDS43 ----ERKKCFLVRQASFSGSPEISQGEVGMDQSVKQEQLEHLHAGLRSGWHHGPPAVLPP 1080 1090 1100 1110 1120 1480 1490 1500 1510 pF1KE0 LAE-------------FSANTLH-SQTQVKDLQAETSNSSSTNVFPVQQLCDINLLNQIH : . .:.. :: .: :. .... : . . :.. . . .: .: : CCDS43 LQQEDPGKQVAGPCPPLSSGPLHLAQPQIMHMDSQESLRNPL-IQPTSYMTSKHLPEQPH 1130 1140 1150 1160 1170 1180 1520 1530 1540 1550 1560 1570 pF1KE0 APPSHQSTQLS-LQVST-QGSKPDKNSVLSGSSKS---EDCFAPKYQLHCQVFTSGPSC- : ... .: .: . : . : : ... . : . : : . :: CCDS43 LFPHQETIPFSPIQNALFQFQYPTVCMVHLPAQQPPWWQAHFPHPFAQHPQKSYGKPSFQ 1190 1200 1210 1220 1230 1240 1580 1590 1600 1610 pF1KE0 ----SSNPVHSLPNQVISDPVGTDH-------CVTSAT--LPTKLID---SISNSHPLLP :: :.. . ... . :. : : ..:. : .:. : ..:. CCDS43 TEIHSSYPLEHVAEHTGKKPAEYAHTKEQTYPCYSGASGLHPKNLLPKFPSDQSSKSTET 1250 1260 1270 1280 1290 1300 1620 1630 1640 1650 1660 pF1KE0 PELRPL--------GSQVQKVPSSFMLPIRLQSSVPAYCFATLTSLPQILVTQDLPNQPI : . : ....:..:.. ..:.:.:. ::.: . ::. ::: :. : : CCDS43 PSEQVLQEDFASANAGSLQSLPGT-VVPVRIQTHVPSYGSVMYTSISQIL-GQNSPAIVI 1310 1320 1330 1340 1350 1360 1670 1680 1690 1700 1710 1720 pF1KE0 CQTNHSVVPISEEQNSVPTLQKGHQNALPNPEKEFLCENVFSEMSQNSSLSESLPITQKI :....... . :.. .: : . : ... : . ..::. . CCDS43 CKVDENMTQRTLVTNAA--MQGIGFNI-----AQVLGQHAGLEKYPIWKAPQTLPLGLES 1370 1380 1390 1400 1410 1730 1740 1750 1760 1770 1780 pF1KE0 SVGRLSPQQESSAS----SKRMLSPANSLDIAME-KHQKRAKDEN--GAVCATDVRPLEA :. :. .:.. ::::::::.::.. :: :.:::.:.:. : . . .. .: CCDS43 SIPLCLPSTSDSVATLGGSKRMLSPASSLELFMETKQQKRVKEEKMYGQI-VEELSAVEL 1420 1430 1440 1450 1460 1470 1790 1800 1810 1820 1830 pF1KE0 LSSRVN-EASKQKKPILVRQVCTTEPLDGVMLEKDVFSQ--PEISNEAVNLTN-----VL .: .. . :. .:: :::: :..:: ::.. .. ::. : :.. ... : CCDS43 TNSDIKKDLSRPQKPQLVRQGCASEPKDGLQSGSSSFSSLSPSSSQDYPSVSPSSREPFL 1480 1490 1500 1510 1520 1530 1840 1850 1860 1870 1880 1890 pF1KE0 PADNSSTGCSKFVVIEPISELQEFENIKSSTSLTLTVRSSPAPSENTHISPLKCTDNNQE :. . .: . . : :. .:: : . .: : . . : : :.. : CCDS43 PSKEMLSGSRAPLPGQKSS--GPSESKESSDELDIDETASDM-SMSPQSSSLPAGDGQLE 1540 1550 1560 1570 1580 1590 1900 1910 1920 1930 1940 1950 pF1KE0 RKSPGVKNQ-GDKVNIQEQSQQPV--TSLSLFNIKDTQQ-LAFPSLKTTTNFTWCYLLRQ ... : : : : . . : ..: : .. : :: : ::::.:::. .::.: CCDS43 EEGKGHKRPVGMLVRMASAPSGNVADSTLLLTDMADFQQILQFPSLRTTTTVSWCFLNYT 1600 1610 1620 1630 1640 1650 1960 1970 1980 1990 2000 2010 pF1KE0 KSLHLPQKDQKTSAYTDWTVSASNPNPLGLPTKVALALLNSKQNTGKSLYCQAITTHSKS : .. : :.:.:..: .:. :::: :: ::..:::: :::. .: : . . CCDS43 KPNYVQQATFKSSVYASWCISSCNPNPSGLNTKTTLALLRSKQKITAEIYTLAAMHRPGT 1660 1670 1680 1690 1700 1710 2020 2030 2040 2050 2060 pF1KE0 DLLVYSSKWK--SSLSKRA---LGNQ-KSTVVEFSNKDASEINSEQDKENSLIKSEPRRI :. :: :: .... : .:.. . .: :. .. . . ::. . ..:: :: CCDS43 GKLTSSSAWKQFTQMKPDASFLFGSKLERKLVGNILKERGKGDIHGDKDIGSKQTEPIRI 1720 1730 1740 1750 1760 1770 2070 2080 2090 2100 2110 2120 pF1KE0 KIFDGGYKSNEEYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYHCTYCNFS :::.:::::::.:::::::::::::::::::::::::::::::::::::::: : :::. CCDS43 KIFEGGYKSNEDYVYVRGRGRGKYICEECGIRCKKPSMLKKHIRTHTDVRPYVCKLCNFA 1780 1790 1800 1810 1820 1830 2130 2140 2150 2160 2170 pF1KE0 FKTKGNLTKHMKSKAHSKKCVDLGVSVGLIDEQDTEESD---------EKQRFSYERSGY :::::::::::::::: :::..::::. .:. .:::.. ::. .: . . CCDS43 FKTKGNLTKHMKSKAHMKKCLELGVSMTSVDDTETEEAENLEDLHKAAEKHSMSSISTDH 1840 1850 1860 1870 1880 1890 2180 2190 2200 2210 pF1KE0 ---DLEESDGPDEDDNENEDDDED-----------SQAESV------LSATP-SVTASPQ : ::::: : :::...:.::: ....:. .:. : .: : :. CCDS43 QFSDAEESDGEDGDDNDDDDEDEDDFDDQGDLTPKTRSRSTSPQPPRFSSLPVNVGAVPH 1900 1910 1920 1930 1940 1950 2220 2230 2240 pF1KE0 HLPSRSSL--------------------QDPVSTDEDVRITD---CFSGVHTD--P---- .:: ::: . : .. ::...:. :.. :: : CCDS43 GVPSDSSLGHSSLISYLVTLPSIRVTQLMTPSDSCEDTQMTEYQRLFQSKSTDSEPDKDR 1960 1970 1980 1990 2000 2010 2250 2260 2270 2280 2290 pF1KE0 MDVLPRALLTRMTVLSTAQS---DYNRKTL--SPGKARQRAARDENDT---IPSVDTSR- .:. : . . . : .: :.. .. ::: . ::.. ::. : : CCDS43 LDI-PSCMDEECMLPSEPSSSPRDFSPSSHHSSPGYD-SSPCRDNSPKRYLIPKGDLSPR 2020 2030 2040 2050 2060 2070 2300 2310 2320 pF1KE0 ---SPCHQMSVDY---PESEEILRSSMA------------------GKAVAITQ--SP-- :: ...: :..: :: :. :: .. . :: CCDS43 RHLSPRRDLSPMRHLSPRKEAALRREMSQRDVSPRRHLSPRRPVSPGKDITARRDLSPRR 2080 2090 2100 2110 2120 2130 2330 2340 2350 2360 pF1KE0 -----SSVRLPPA--AAEHSPQTAAGM-----PSVASPHPDPQEQKQQITL--------- ...: : : :.: . :. : : .: :. .. :. CCDS43 ERRYMTTIRAPSPRRALYHNPPLSMGQYLQAEPIVLGP-PNLRRGLPQVPYFSLYGDQEG 2140 2150 2160 2170 2180 2190 2370 2380 2390 2400 2410 pF1KE0 -QPTPG---LP-SPHTHLFSHLPLHSQQQSRTPYNMVPVGGI---HVVPAGLTYSTFVPL :: .: .:. ..::::::::::: :.: ::::::: : .: .: :.. : CCDS43 AYEHPGSSLFPEGPNDYVFSHLPLHSQQQVRAPIPMVPVGGIQMVHSMPPAL--SSLHPS 2200 2210 2220 2230 2240 2250 2420 2430 2440 2450 2460 2470 pF1KE0 QAGPVQLTIPAVSVVHRTLGTHRNTVTEVSGTTNPAGVAELSSVVPCIPIGQIRVPGLQN . :. . CCDS43 PTLPLPMEGFEEKKGASGESFSKDPYVLSKQHEKRGPHALQSSGPPSTPSSPRLLMKQST 2260 2270 2280 2290 2300 2310 2718 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 07:02:21 2016 done: Sat Nov 5 07:02:22 2016 Total Scan time: 8.760 Total Display time: 1.210 Function used was FASTA [36.3.4 Apr, 2011]