FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2719, 2590 aa
1>>>pF1KE2719 2590 - 2590 aa - 2590 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.2110+/-0.00135; mu= 16.3404+/- 0.081
mean_var=97.8274+/-19.575, 0's: 0 Z-trim(101.3): 49 B-trim: 0 in 0/52
Lambda= 0.129671
statistics sampled from 6429 (6454) to 6429 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.532), E-opt: 0.2 (0.198), width: 16
Scan time: 3.560
The best scores are: opt bits E(32554)
CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590) 16962 3185.4 0
CCDS75158.1 HELQ gene_id:113510|Hs108|chr4 (1034) 700 143.1 7.5e-33
CCDS3603.1 HELQ gene_id:113510|Hs108|chr4 (1101) 700 143.1 8e-33
CCDS3360.1 POLN gene_id:353497|Hs108|chr4 ( 900) 477 101.3 2.4e-20
CCDS3967.1 MTREX gene_id:23517|Hs108|chr5 (1042) 310 70.1 7e-11
>>CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590 aa)
initn: 16962 init1: 16962 opt: 16962 Z-score: 17138.1 bits: 3185.4 E(32554): 0
Smith-Waterman score: 16962; 99.9% identity (99.9% similar) in 2590 aa overlap (1-2590:1-2590)
10 20 30 40 50 60
pF1KE2 MNLLRRSGKRRRSESGSDSFSGSGGDSSASPQFLSGSVLSPPPGLGRCLKAAAAGECKPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MNLLRRSGKRRRSESGSDSFSGSGGDSSASPQFLSGSVLSPPPGLGRCLKAAAAGECKPT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 VPDYEIDKLLLANWGLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAG
::::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VPDYERDKLLLANWGLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 KTLVAELLILKRVLEMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KTLVAELLILKRVLEMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 FSSLDIAVCTIERANGLINRLIEENKMDLLGMVVVDELHMLGDSHRGYLLELLLTKICYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FSSLDIAVCTIERANGLINRLIEENKMDLLGMVVVDELHMLGDSHRGYLLELLLTKICYI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 TRKSASCQADLASSLSNAVQIVGMSATLPNLELVASWLNAELYHTDFRPVPLLESVKVGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TRKSASCQADLASSLSNAVQIVGMSATLPNLELVASWLNAELYHTDFRPVPLLESVKVGN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 SIYDSSMKLVREFEPMLQVKGDEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SIYDSSMKLVREFEPMLQVKGDEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIARE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 FYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGLDSVLQKTVPWGVAFHHAGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGLDSVLQKTVPWGVAFHHAGL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 TFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 AGRKGVDTVGESILICKNSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AGRKGVDTVGESILICKNSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 GGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 SDGTEGKVYHPTHLGSATLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPMFED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SDGTEGKVYHPTHLGSATLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPMFED
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 WTTIDWYRFFCLWEKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 WTTIDWYRFFCLWEKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 TSLVLLDLISEVPLREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLGWHNMELLLSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TSLVLLDLISEVPLREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLGWHNMELLLSQ
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 FQKRLTFGIQRELCDLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FQKRLTFGIQRELCDLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFK
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 SARKAVDEEEEAVEERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SARKAVDEEEEAVEERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 CALLHSSTCSLTHSESEVKEHTFISQTKSSYKKLTSKNKSNTIFSDSYIKHSPNIVQDLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CALLHSSTCSLTHSESEVKEHTFISQTKSSYKKLTSKNKSNTIFSDSYIKHSPNIVQDLN
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 KSREHTSSFNCNFQNGNQEHQRCSIFRARKRASLDINKEKPGASQNEGKTSDKKVVQTFS
::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::
CCDS33 KSREHTSSFNCNFQNGNQEHQTCSIFRARKRASLDINKEKPGASQNEGKTSDKKVVQTFS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 QKTKKAPLNFNSEKMSRSFRSWKRRKHLKRSRDSSPLKDSGACRIHLQGQTLSNPSLCED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QKTKKAPLNFNSEKMSRSFRSWKRRKHLKRSRDSSPLKDSGACRIHLQGQTLSNPSLCED
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 PFTLDEKKTEFRNSGPFAKNVSLSGKEKDNKTSFPLQIKQNCSWNITLTNDNFVEHIVTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PFTLDEKKTEFRNSGPFAKNVSLSGKEKDNKTSFPLQIKQNCSWNITLTNDNFVEHIVTG
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 SQSKNVTCQATSVVSEKGRGVAVEAEKINEVLIQNGSKNQNVYMKHHDIHPINQYLRKQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SQSKNVTCQATSVVSEKGRGVAVEAEKINEVLIQNGSKNQNVYMKHHDIHPINQYLRKQS
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 HEQTSTITKQKNIIERQMPCEAVSSYINRDSNVTINCERIKLNTEENKPSHFQALGDDIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HEQTSTITKQKNIIERQMPCEAVSSYINRDSNVTINCERIKLNTEENKPSHFQALGDDIS
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE2 RTVIPSEVLPSAGAFSKSEGQHENFLNISRLQEKTGTYTTNKTKNNHVSDLGLVLCDFED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RTVIPSEVLPSAGAFSKSEGQHENFLNISRLQEKTGTYTTNKTKNNHVSDLGLVLCDFED
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE2 SFYLDTQSEKIIQQMATENAKLGAKDTNLAAGIMQKSLVQQNSMNSFQKECHIPFPAEQH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SFYLDTQSEKIIQQMATENAKLGAKDTNLAAGIMQKSLVQQNSMNSFQKECHIPFPAEQH
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE2 PLGATKIDHLDLKTVGTMKQSSDSHGVDILTPESPIFHSPILLEENGLFLKKNEVSVTDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PLGATKIDHLDLKTVGTMKQSSDSHGVDILTPESPIFHSPILLEENGLFLKKNEVSVTDS
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE2 QLNSFLQGYQTQETVKPVILLIPQKRTPTGVEGECLPVPETSLNMSDSLLFDSFSDDYLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QLNSFLQGYQTQETVKPVILLIPQKRTPTGVEGECLPVPETSLNMSDSLLFDSFSDDYLV
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE2 KEQLPDMQMKEPLPSEVTSNHFSDSLCLQEDLIKKSNVNENQDTHQQLTCSNDESIIFSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KEQLPDMQMKEPLPSEVTSNHFSDSLCLQEDLIKKSNVNENQDTHQQLTCSNDESIIFSE
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE2 MDSVQMVEALDNVDIFPVQEKNHTVVSPRALELSDPVLDEHHQGDQDGGDQDERAEKSKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MDSVQMVEALDNVDIFPVQEKNHTVVSPRALELSDPVLDEHHQGDQDGGDQDERAEKSKL
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE2 TGTRQNHSFIWSGASFDLSPGLQRILDKVSSPLENEKLKSMTINFSSLNRKNTELNEEQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TGTRQNHSFIWSGASFDLSPGLQRILDKVSSPLENEKLKSMTINFSSLNRKNTELNEEQE
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE2 VISNLETKQVQGISFSSNNEVKSKIEMLENNANHDETSSLLPRKESNIVDDNGLIPPTPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VISNLETKQVQGISFSSNNEVKSKIEMLENNANHDETSSLLPRKESNIVDDNGLIPPTPI
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE2 PTSASKLTFPGILETPVNPWKTNNVLQPGESYLFGSPSDIKNHDLSPGSRNGFKDNSPIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PTSASKLTFPGILETPVNPWKTNNVLQPGESYLFGSPSDIKNHDLSPGSRNGFKDNSPIS
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE2 DTSFSLQLSQDGLQLTPASSSSESLSIIDVASDQNLFQTFIKEWRCKKRFSISLACEKIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DTSFSLQLSQDGLQLTPASSSSESLSIIDVASDQNLFQTFIKEWRCKKRFSISLACEKIR
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE2 SLTSSKTATIGSRFKQASSPQEIPIRDDGFPIKGCDDTLVVGLAVCWGGRDAYYFSLQKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SLTSSKTATIGSRFKQASSPQEIPIRDDGFPIKGCDDTLVVGLAVCWGGRDAYYFSLQKE
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE2 QKHSEISASLVPPSLDPSLTLKDRMWYLQSCLRKESDKECSVVIYDFIQSYKILLLSCGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QKHSEISASLVPPSLDPSLTLKDRMWYLQSCLRKESDKECSVVIYDFIQSYKILLLSCGI
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE2 SLEQSYEDPKVACWLLDPDSQEPTLHSIVTSFLPHELPLLEGMETSQGIQSLGLNAGSEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SLEQSYEDPKVACWLLDPDSQEPTLHSIVTSFLPHELPLLEGMETSQGIQSLGLNAGSEH
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE2 SGRYRASVESILIFNSMNQLNSLLQKENLQDVFRKVEMPSQYCLALLELNGIGFSTAECE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SGRYRASVESILIFNSMNQLNSLLQKENLQDVFRKVEMPSQYCLALLELNGIGFSTAECE
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE2 SQKHIMQAKLDAIETQAYQLAGHSFSFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SQKHIMQAKLDAIETQAYQLAGHSFSFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGS
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE2 TRRGIDNGRKLRLGRQFSTSKDVLNKLKALHPLPGLILEWRRITNAITKVVFPLQREKCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TRRGIDNGRKLRLGRQFSTSKDVLNKLKALHPLPGLILEWRRITNAITKVVFPLQREKCL
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE2 NPFLGMERIYPVSQSHTATGRITFTEPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NPFLGMERIYPVSQSHTATGRITFTEPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPM
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE2 GRGKYKKGFSVNPRCQAQMEERAADRGMPFSISMRHAFVPFPGGSILAADYSQLELRILA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GRGKYKKGFSVNPRCQAQMEERAADRGMPFSISMRHAFVPFPGGSILAADYSQLELRILA
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE2 HLSHDRRLIQVLNTGADVFRSIAAEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HLSHDRRLIQVLNTGADVFRSIAAEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGE
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE2 QMGIKENDAACYIDSFKSRYTGINQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QMGIKENDAACYIDSFKSRYTGINQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYR
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE2 KAHAERQAINTIVQGSAADIVKIATVNIQKQLETFHSTFKSHGHREGMLQSDRTGLSRKR
::::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::
CCDS33 KAHAERQAINTIVQGSAADIVKIATVNIQKQLETFHSTFKSHGHREGMLQSDQTGLSRKR
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KE2 KLQGMFCPIRGGFFILQLHDELLYEVAEEDVVQVAQIVKNEMESAVKLSVKLKVKVKIGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KLQGMFCPIRGGFFILQLHDELLYEVAEEDVVQVAQIVKNEMESAVKLSVKLKVKVKIGA
2530 2540 2550 2560 2570 2580
2590
pF1KE2 SWGELKDFDV
::::::::::
CCDS33 SWGELKDFDV
2590
>>CCDS75158.1 HELQ gene_id:113510|Hs108|chr4 (1034 aa)
initn: 1097 init1: 369 opt: 700 Z-score: 703.2 bits: 143.1 E(32554): 7.5e-33
Smith-Waterman score: 1166; 31.0% identity (60.0% similar) in 872 aa overlap (4-856:253-1005)
10 20 30
pF1KE2 MNLLRRSGKRRRSESGSDSFSG--SGGDSSASP
.: :. : .: .: ... .:. .. .:
CCDS75 WKSSSHNTVNEELPHNCIEQPQQNDESSSKVRTSSDMNRRKSIKDHLKNAMTGNAKAQTP
230 240 250 260 270 280
40 50 60 70 80 90
pF1KE2 QFLSGSVLSPPPGLGRCLKAAAAGECKPTVPDYEIDKLLLANWGLPKAVLEKYHSF-GVK
: : : : . . : :: . : : ..::. : . : .: :..
CCDS75 IF------SRSKQLKDTLLSEEINVAKKTVESSSND--LGPFYSLPSKVRDLYAQFKGIE
290 300 310 320 330
100 110 120 130 140 150
pF1KE2 KMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVLEMRKKALFILPFVSVA
:..::: :: :..: : :::.:: :::.:::::::.:.:...: :: .:.:::.:...
CCDS75 KLYEWQHTCLTLNSVQERKNLIYSLPTSGGKTLVAEILMLQELLCCRKDVLMILPYVAIV
340 350 360 370 380 390
160 170 180 190 200 210
pF1KE2 KEKKYYLQSLFQEVGIKVDGYMGSTSPSRHFSSLDIAVCTIERANGLINRLIEENKMDLL
.::
CCDS75 QEK---------------------------------------------------------
220 230 240 250 260 270
pF1KE2 GMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLASSLSNAVQIVGMSATLPN
:::.:.. :: ::. :.:: : .. . ::.:::::: :
CCDS75 -------LHMIGEGSRGATLEMTLAKILYTSKTT---------------QIIGMSATLNN
400 410 420 430
280 290 300 310 320
pF1KE2 LELVASWLNAELYHTDFRPVPLLESVKVGNSIY--DSSMKLVREFEPMLQVKG-------
.: . ..:.:: : ..:::: : : .:....:: ::. . : .:. :
CCDS75 VEDLQKFLQAEYYTSQFRPVELKEYLKINDTIYEVDSKAENGMTFSRLLNYKYSDTLKKM
440 450 460 470 480 490
330 340 350 360 370 380
pF1KE2 DEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVI
: ::.:.: :.: :.: :.:::::: ::..:..: . : . .. .: .:
CCDS75 DPDHLVALVTEVI-PNYSCLVFCPSKKNCENVAEMICK-FLSKEY-----LKHKE-----
500 510 520 530 540
390 400 410 420 430 440
pF1KE2 LEQKELLEVMDQLRRLPSG-LDSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVL
:: ::. .:. . .: : ::..:.:.:::.::.::: .:: ..: :. :.. ..
CCDS75 ---KEKCEVIKNLKNIGNGNLCPVLKRTIPFGVAYHHSGLTSDERKLLEEAYSTGVLCLF
550 560 570 580 590 600
450 460 470 480 490 500
pF1KE2 AATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGRAGRKGVDTVGESILICKNSE
. ::::..::::::::::.:.: . . : ::::.::::: :.::.:::::: ....
CCDS75 TCTSTLAAGVNLPARRVILRAPYVAKEFLKRNQYKQMIGRAGRAGIDTIGESILILQEKD
610 620 630 640 650 660
510 520 530 540 550
pF1KE2 KSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIVG-GVASTSQDMHTYAACTFL
:.. . :. ::...: .. : . : :.... ..: .:.. .:.. . ::.
CCDS75 KQQVLELI---TKPLENCYSHLVQEFTKG--IQTLFLSLIGLKIATNLDDIYHFMNGTFF
670 680 690 700 710
560 570 580 590 600 610
pF1KE2 AASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEASDGTEGKVY--HPTHLGSA
.. .: . ...:. ..:. . .: :. ..:. . : : : :.:: :
CCDS75 GV-----QQKVLLKEKSLWEITVES-LRYLTEKGLLQKDTIYKSEEEVQYNFHITKLGRA
720 730 740 750 760
620 630 640 650 660 670
pF1KE2 TLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPM-FEDWTTIDWYRFFCLWEKL
....... : .. ::.....:.:::. ::..::.::. . . . ::. .: . .:
CCDS75 SFKGTIDLAYCDILYRDLKKGLEGLVLESLLHLIYLTTPYDLVSQCNPDWMIYFRQFSQL
770 780 790 800 810 820
680 690 700 710 720 730
pF1KE2 PTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFFTSLVLLDLISEVPLRE
. . :: ..:: :.:... ..:..... .. . .:.. :.:: :..:. .
CCDS75 SPAEQNVAAILGVSESFIGKKASGQAIGKKVDKN----VVNRLYLSFVLYTLLKETNIWT
830 840 850 860 870 880
740 750 760 770 780 790
pF1KE2 INQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLG--WHNMELLLSQFQKRLTFGIQRELC
...:.. :: ::.: ..: ... . : ..: : .. :: .. :.::. .. ::
CCDS75 VSEKFNMPRGYIQNLLTGTASFSSCVLHFCEELEEFW-VYRALLVELTKKLTYCVKAELI
890 900 910 920 930 940
800 810 820 830 840 850
pF1KE2 DLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFKSARKAVDEEEEAVE
:..:. . ::. ::..:.... :: :: :: : . . ..:.. :. . ..
CCDS75 PLMEVTGVLEGRAKQLYSAGYKSLMHLANANP-EVLVRTIDHLSRRQAKQIVSSAKMLLH
950 960 970 980 990 1000
860 870 880 890 900 910
pF1KE2 ERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNPCALLHSSTCSLTHS
:.
CCDS75 EKAEALQEEVEELLRLPSDFPGAVASSTDKA
1010 1020 1030
>>CCDS3603.1 HELQ gene_id:113510|Hs108|chr4 (1101 aa)
initn: 1220 init1: 369 opt: 700 Z-score: 702.8 bits: 143.1 E(32554): 8e-33
Smith-Waterman score: 1434; 33.7% identity (65.1% similar) in 875 aa overlap (4-856:253-1072)
10 20 30
pF1KE2 MNLLRRSGKRRRSESGSDSFSG--SGGDSSASP
.: :. : .: .: ... .:. .. .:
CCDS36 WKSSSHNTVNEELPHNCIEQPQQNDESSSKVRTSSDMNRRKSIKDHLKNAMTGNAKAQTP
230 240 250 260 270 280
40 50 60 70 80 90
pF1KE2 QFLSGSVLSPPPGLGRCLKAAAAGECKPTVPDYEIDKLLLANWGLPKAVLEKYHSF-GVK
: : : : . . : :: . : : ..::. : . : .: :..
CCDS36 IF------SRSKQLKDTLLSEEINVAKKTVESSSND--LGPFYSLPSKVRDLYAQFKGIE
290 300 310 320 330
100 110 120 130 140 150
pF1KE2 KMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVLEMRKKALFILPFVSVA
:..::: :: :..: : :::.:: :::.:::::::.:.:...: :: .:.:::.:...
CCDS36 KLYEWQHTCLTLNSVQERKNLIYSLPTSGGKTLVAEILMLQELLCCRKDVLMILPYVAIV
340 350 360 370 380 390
160 170 180 190 200
pF1KE2 KEKKYYLQSLFQEVGIKVDGYMGSTS---PSRHFSSLDIAVCTIERANGLINRLIEENKM
.:: :.:. :.:. :. : :: . :... . .. . :::....:.: ::: ...
CCDS36 QEKISGLSSFGIELGFFVEEYAGSKGRFPPTKRREKKSLYIATIEKGHSLVNSLIETGRI
400 410 420 430 440 450
210 220 230 240 250 260
pF1KE2 DLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLASSLSNAVQIVGMSAT
: ::.::::::::.:.. :: ::. :.:: : .. . ::.:::::
CCDS36 DSLGLVVVDELHMIGEGSRGATLEMTLAKILYTSKTT---------------QIIGMSAT
460 470 480 490
270 280 290 300 310 320
pF1KE2 LPNLELVASWLNAELYHTDFRPVPLLESVKVGNSIY--DSSMKLVREFEPMLQVKG----
: :.: . ..:.:: : ..:::: : : .:....:: ::. . : .:. :
CCDS36 LNNVEDLQKFLQAEYYTSQFRPVELKEYLKINDTIYEVDSKAENGMTFSRLLNYKYSDTL
500 510 520 530 540 550
330 340 350 360 370
pF1KE2 ---DEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECP
: ::.:.: :.: :.: :.:::::: ::..:..: . : . .. .: .:
CCDS36 KKMDPDHLVALVTEVI-PNYSCLVFCPSKKNCENVAEMICK-FLSKEY-----LKHKE--
560 570 580 590 600 610
380 390 400 410 420 430
pF1KE2 PVILEQKELLEVMDQLRRLPSG-LDSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLI
:: ::. .:. . .: : ::..:.:.:::.::.::: .:: ..: :. :..
CCDS36 ------KEKCEVIKNLKNIGNGNLCPVLKRTIPFGVAYHHSGLTSDERKLLEEAYSTGVL
620 630 640 650 660
440 450 460 470 480 490
pF1KE2 RVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGRAGRKGVDTVGESILICK
... ::::..::::::::::.:.: . . : ::::.::::: :.::.:::::: .
CCDS36 CLFTCTSTLAAGVNLPARRVILRAPYVAKEFLKRNQYKQMIGRAGRAGIDTIGESILILQ
670 680 690 700 710 720
500 510 520 530 540 550
pF1KE2 NSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIVG-GVASTSQDMHTYAAC
...:.. . :. ::...: .. : . : :.... ..: .:.. .:.. .
CCDS36 EKDKQQVLELI---TKPLENCYSHLVQEFTKG--IQTLFLSLIGLKIATNLDDIYHFMNG
730 740 750 760 770
560 570 580 590 600 610
pF1KE2 TFLAASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEASDGTEGKVY--HPTHL
::... .: . ...:. ..:. . .: :. ..:. . : : : :.:
CCDS36 TFFGV-----QQKVLLKEKSLWEITVES-LRYLTEKGLLQKDTIYKSEEEVQYNFHITKL
780 790 800 810 820 830
620 630 640 650 660 670
pF1KE2 GSATLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPM-FEDWTTIDWYRFFCLW
: :....... : .. ::.....:.:::. ::..::.::. . . . ::. .: .
CCDS36 GRASFKGTIDLAYCDILYRDLKKGLEGLVLESLLHLIYLTTPYDLVSQCNPDWMIYFRQF
840 850 860 870 880 890
680 690 700 710 720 730
pF1KE2 EKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFFTSLVLLDLISEVP
.: . . :: ..:: :.:... ..:..... .. . .:.. :.:: :..:.
CCDS36 SQLSPAEQNVAAILGVSESFIGKKASGQAIGKKVDKN----VVNRLYLSFVLYTLLKETN
900 910 920 930 940
740 750 760 770 780 790
pF1KE2 LREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLG--WHNMELLLSQFQKRLTFGIQR
. ...:.. :: ::.: ..: ... . : ..: : .. :: .. :.::. ..
CCDS36 IWTVSEKFNMPRGYIQNLLTGTASFSSCVLHFCEELEEFW-VYRALLVELTKKLTYCVKA
950 960 970 980 990 1000
800 810 820 830 840 850
pF1KE2 ELCDLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFKSARKAVDEEEE
:: :..:. . ::. ::..:.... :: :: :: : . . ..:.. :. .
CCDS36 ELIPLMEVTGVLEGRAKQLYSAGYKSLMHLANANP-EVLVRTIDHLSRRQAKQIVSSAKM
1010 1020 1030 1040 1050 1060
860 870 880 890 900 910
pF1KE2 AVEERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNPCALLHSSTCSL
..:.
CCDS36 LLHEKAEALQEEVEELLRLPSDFPGAVASSTDKA
1070 1080 1090 1100
>>CCDS3360.1 POLN gene_id:353497|Hs108|chr4 (900 aa)
initn: 947 init1: 357 opt: 477 Z-score: 478.8 bits: 101.3 E(32554): 2.4e-20
Smith-Waterman score: 786; 25.6% identity (54.1% similar) in 979 aa overlap (1646-2585:10-855)
1620 1630 1640 1650 1660 1670
pF1KE2 EKSKLTGTRQNHSFIWSGASFDLSPGLQRILDKVSSPLENEKLKSMTINFSS--LNRKN-
.: ..:: . : :. :. .. :.
CCDS33 MENYEALVGFDLCNTPLSSVAQKIMSAMHSGDLVDSKTW
10 20 30
1680 1690 1700 1710 1720 1730
pF1KE2 TELNEEQEVISNLETK-QVQGISFSSNNEVKSKIEMLENNANHDETSSLLPRKESNIVDD
. .: .:::.. .: .:: . .... :. .. :...... ...: :.. : . :
CCDS33 GKSTETMEVINKSSVKYSVQLEDRKTQSPEKKDLKSLRSQTSRG-SAKLSPQSFSVRLTD
40 50 60 70 80 90
1740 1750 1760 1770 1780 1790
pF1KE2 NGLIPPTPIPTSASKLTFPGILETPVNPWKTNNVLQPGESYLFGSPSDIKNHDLSPGSRN
. . : :.::. . : : . .::: :.: .:.
CCDS33 Q--LSADQKQKSISSLTLSSCLIPQYN--QEASVLQK------------KGH-----KRK
100 110 120 130
1800 1810 1820 1830 1840 1850
pF1KE2 GFKDNSPISDTSFSLQLSQDGLQLTPAS-SSSESLSIIDVASDQNLFQTFIKEWRCKKRF
: .. .... :..:.. . . : ..:..... . ..: . . . . ::.:
CCDS33 HFLMENINNENKGSINLKRKHITYNNLSEKTSKQMALEEDTDDAEGYLNSGNSGALKKHF
140 150 160 170 180 190
1860 1870 1880 1890 1900 1910
pF1KE2 SISLACEKIRSLTSSKTATIGSRFKQASSPQEIPIRDDGFPIKGCDDTLVVGLAVCWGGR
:. :: : . . . .:::.. . :: : :.: : .. :
CCDS33 -----CD-IRHLDDWAKSQLIEMLKQAAALVITVMYTDGSTQLGADQTPVSSV------R
200 210 220 230 240
1920 1930 1940 1950
pF1KE2 DAYYF-SLQKEQKHSEISASLVPPSL------DPSLTLK---DRMW---------YLQSC
. . : : :. .: : : :: . .. . .: . ..
CCDS33 GIVVLVKRQAEGGHGCPDAPACGPVLEGFVSDDPCIYIQIEHSAIWDQEQEAHQQFARNV
250 260 270 280 290 300
1960 1970 1980 1990 2000
pF1KE2 LRKESDKECSVVIYDFIQSYKILLLSCGISLEQSYE------DPKVACWLLDPDSQEPTL
: . .: :. .. . .:.: : . .. ::..: ::.::.. :..
CCDS33 LFQTMKCKCPVICFNAKDFVRIVLQFFGNDGSWKHVADFIGLDPRIAAWLIDPSDATPSF
310 320 330 340 350 360
2010 2020 2030 2040 2050 2060
pF1KE2 HSIVTSFLPHELPLLEGMETSQGIQSLGLNAGSEHSGRYRASVESILIFNSMNQLNSLLQ
...: .. : . .... : .: .. . : .... .. .: : :.
CCDS33 EDLVEKYC--EKSITVKVNSTYGNSSRNIV-----NQNVRENLKT--LYRLTMDLCSKLK
370 380 390 400 410
2070 2080 2090 2100 2110 2120
pF1KE2 KENLQDVFRKVEMPSQYCLALLELNGIGFSTAECESQKHIMQAKLDAIETQAYQLAGHSF
.: ..:: .:.: ::..: ..: . : :. . .. :.: .: .:. .::. :
CCDS33 DYGLWQLFRTLELPLIPILAVMESHAIQVNKEEMEKTSALLGARLKELEQEAHFVAGERF
420 430 440 450 460 470
2130 2140 2150 2160 2170 2180
pF1KE2 SFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGSTRRGIDNGRKLRLGRQFSTSKDVLN
.::.... :.:: .::: .. .: ...: : : : . :::. :::
CCDS33 LITSNNQLREILFGKLKL----HLLSQ--RNSL--PRTG--------LQKYPSTSEAVLN
480 490 500 510 520
2190 2200 2210 2220 2230 2240
pF1KE2 KLKALHPLPGLILEWRRITNAITKVVFPLQREKCLNPFLGMERIYPVSQSHTATGRITFT
:. ::::: .:::.:.. . . : : :.. .. . .:. :.:::..
CCDS33 ALRDLHPLPKIILEYRQVHKIKSTFVDGLL--ACMKKG-SISSTW--NQTGTVTGRLSAK
530 540 550 560 570
2250 2260 2270 2280 2290 2300
pF1KE2 EPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPMGRGKYKKGFSVNPRCQAQMEERAAD
.::::.. : : . .: :.. .:: : ....:: .
CCDS33 HPNIQGIS-----KHPIQI-TTP------KNF----KGKEDKILTISPRAM---------
580 590 600 610
2310 2320 2330 2340 2350 2360
pF1KE2 RGMPFSISMRHAFVPFPGGSILAADYSQLELRILAHLSHDRRLIQVLNTGA--DVFRSIA
:: : ..::::.::.:::::.::: : .:..... . ::: ...
CCDS33 ------------FVSSKGHTFLAADFSQIELRILTHLSGDPELLKLFQESERDDVFSTLT
620 630 640 650
2370 2380 2390 2400 2410 2420
pF1KE2 AEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGEQMGIKENDAACYIDSFKSRYTGI
..:: . :.: :.:.:.. :...:: : . :. .:. ..:: ...:: ..: :
CCDS33 SQWKDVPVEQVTHADREQTKKVVYAVVYGAGKERLAACLGVPIQEAAQFLESFLQKYKKI
660 670 680 690 700 710
2430 2440 2450 2460 2470 2480
pF1KE2 NQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYRKAHAERQAINTIVQGSAADIVKI
..: .. .:.. : : .:.:::: :: :. .. .:.:::::.: .:::::::. :.
CCDS33 KDFARAAIAQCHQTGCVVSIMGRRRPLPRIHAHDQQLRAQAERQAVNFVVQGSAADLCKL
720 730 740 750 760 770
2490 2500 2510 2520 2530 2540
pF1KE2 ATVNIQKQLETFHSTFKSHGHREGMLQSDRTGLSRKRKLQGMFCPIRGGFFILQLHDELL
: ... : .. :: : .: .. :.:::::
CCDS33 AMIHV------FTAVAASH-----------TLTAR---------------LVAQIHDELL
780 790 800
2550 2560 2570 2580 2590
pF1KE2 YEVAEEDVVQVAQIVKNEMES-------AVKLSVKLKVKVKIGASWGELKDFDV
.:: . .. . : .:. ::: ..:.: :::... : :::.:
CCDS33 FEVEDPQIPECAALVRRTMESLEQVQALELQLQVPLKVSLSAGRSWGHLVPLQEAWGPPP
810 820 830 840 850 860
CCDS33 GPCRTESPSNSLAAPGSPASTQPPPLHFSPSFCL
870 880 890 900
>>CCDS3967.1 MTREX gene_id:23517|Hs108|chr5 (1042 aa)
initn: 311 init1: 126 opt: 310 Z-score: 308.9 bits: 70.1 E(32554): 7e-11
Smith-Waterman score: 387; 27.3% identity (54.6% similar) in 454 aa overlap (105-520:151-564)
80 90 100 110 120 130
pF1KE2 GLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVL
: ...... :: ::::::. :: : .:
CCDS39 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAI-ALAL
130 140 150 160 170
140 150 160 170 180 190
pF1KE2 EMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRHFSSLDIAVCTIERA
. .....: :. .....: . ::.::. . : . . .:. : : . .
CCDS39 REKQRVIFTSPIKALSNQKYREMYEEFQDVGL-MTGDV-TINPT--------ASCLVMTT
180 190 200 210 220
200 210 220 230 240 250
pF1KE2 NGLINRLIEENK-MDLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLAS
. : . : . .. : .. :. ::.:.. ::.:: . : .
CCDS39 EILRSMLYRGSEVMREVAWVIFDEIHYMRDSERGVVWEETIIL-----------------
230 240 250 260 270
260 270 280 290 300
pF1KE2 SLSNAVQIVGMSATLPNLELVASWLN------AELYHTDFRPVPLLESV-KVGNS----I
: . :. : .:::.:: . : :. .. .::.::.:: . . .:.. .
CCDS39 -LPDNVHYVFLSATIPNARQFAEWICHLHKQPCHVIYTDYRPTPLQHYIFPAGGDGLHLV
280 290 300 310 320 330
310 320 330 340
pF1KE2 YDSSMKLVRE--FEPMLQV--------KGDE----------DHVVSLCYETICDN-HSVL
: . . :: :. .:: :::. ..: .. . : . :.
CCDS39 VDENGDF-REDNFNTAMQVLRDAGDLAKGDQKGRKGGTKGPSNVFKIVKMIMERNFQPVI
340 350 360 370 380 390
350 360 370 380 390 400
pF1KE2 LFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGL
.: ::: :: : ... .: .. . .:. :. . . : :. ..::. .
CCDS39 IFSFSKKDCEAYALQMTKLDFNTDEEKK-MVEE-----VFSNAIDCLS--DEDKKLPQ-V
400 410 420 430 440
410 420 430 440 450 460
pF1KE2 DSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRT
. :: . :...::.:: .. :: : .:::..: :: :.. :.:.::: :.. .
CCDS39 EHVLP-LLKRGIGIHHGGLLPILKETIEILFSEGLIKALFATETFAMGINMPARTVLFTN
450 460 470 480 490 500
470 480 490 500 510
pF1KE2 P-IFGGRPLDILT---YKQMVGRAGRKGVDTVGESILICKNSEK-SKGIALLQGSLKPVR
: :. . .. : :: :::::.:.: : ::. .. . . : ::.:: :.
CCDS39 ARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVDEKMSPTIGKQLLKGSADPLN
510 520 530 540 550 560
520 530 540 550 560 570
pF1KE2 SCLQRREGEEVTGSMIRAILEIIVGGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQES
: ..
CCDS39 SAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPGVVEKVKNSEEQYNKIVIPNE
570 580 590 600 610 620
2590 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Feb 25 13:19:50 2018 done: Sun Feb 25 13:19:50 2018
Total Scan time: 3.560 Total Display time: 0.340
Function used was FASTA [36.3.4 Apr, 2011]