FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDF0380, 772 aa 1>>>pF1KSDF0380 772 - 772 aa - 772 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.4454+/-0.000928; mu= 1.3317+/- 0.056 mean_var=193.7366+/-38.975, 0's: 0 Z-trim(111.8): 35 B-trim: 30 in 1/53 Lambda= 0.092144 statistics sampled from 12687 (12710) to 12687 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.722), E-opt: 0.2 (0.39), width: 16 Scan time: 5.000 The best scores are: opt bits E(32554) CCDS11524.1 NFE2L1 gene_id:4779|Hs108|chr17 ( 772) 5024 680.7 2.3e-195 CCDS82151.1 NFE2L1 gene_id:4779|Hs108|chr17 ( 761) 3852 524.9 1.8e-148 CCDS82150.1 NFE2L1 gene_id:4779|Hs108|chr17 ( 742) 3257 445.8 1.2e-124 CCDS42782.1 NFE2L2 gene_id:4780|Hs108|chr2 ( 605) 859 127.0 9e-29 CCDS5396.1 NFE2L3 gene_id:9603|Hs108|chr7 ( 694) 846 125.3 3.3e-28 CCDS46457.1 NFE2L2 gene_id:4780|Hs108|chr2 ( 589) 838 124.2 6.1e-28 CCDS46458.1 NFE2L2 gene_id:4780|Hs108|chr2 ( 582) 668 101.6 3.8e-21 CCDS8876.1 NFE2 gene_id:4778|Hs108|chr12 ( 373) 619 95.0 2.4e-19 >>CCDS11524.1 NFE2L1 gene_id:4779|Hs108|chr17 (772 aa) initn: 5024 init1: 5024 opt: 5024 Z-score: 3620.7 bits: 680.7 E(32554): 2.3e-195 Smith-Waterman score: 5024; 100.0% identity (100.0% similar) in 772 aa overlap (1-772:1-772) 10 20 30 40 50 60 pF1KSD MLSLKKYLTEGLLQFTILLSLIGVRVDVDTYLTSQLPPLREIILGPSSAYTQTQFHNLRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MLSLKKYLTEGLLQFTILLSLIGVRVDVDTYLTSQLPPLREIILGPSSAYTQTQFHNLRN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TLDGYGIHPKSIDLDNYFTARRLLSQVRALDRFQVPTTEVNAWLVHRDPEGSVSGSQPNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TLDGYGIHPKSIDLDNYFTARRLLSQVRALDRFQVPTTEVNAWLVHRDPEGSVSGSQPNS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GLALESSSGLQDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GLALESSSGLQDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QDIDLGAGREVFDYSHRQKEQDVEKELRDGGEQDTWAGEGAEALARNLLVDGETGESFPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QDIDLGAGREVFDYSHRQKEQDVEKELRDGGEQDTWAGEGAEALARNLLVDGETGESFPA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD QVPSGEDQTALSLEECLRLLEATCPFGENAEFPADISSITEAVPSESEPPALQNNLLSPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QVPSGEDQTALSLEECLRLLEATCPFGENAEFPADISSITEAVPSESEPPALQNNLLSPL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LTGTESPFDLEQQWQDLMSIMEMQAMEVNTSASEILYSAPPGDPLSTNYSLAPNTPINQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LTGTESPFDLEQQWQDLMSIMEMQAMEVNTSASEILYSAPPGDPLSTNYSLAPNTPINQN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD VSLHQASLGGCSQDFLLFSPEVESLPVASSSTLLPLAPSNSTSLNSTFGSTNLTGLFFPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VSLHQASLGGCSQDFLLFSPEVESLPVASSSTLLPLAPSNSTSLNSTFGSTNLTGLFFPP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD QLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDLAIEEGFNPVQASQLEEEFDSDSGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDLAIEEGFNPVQASQLEEEFDSDSGLS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD LDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGYSSDSETLDLEEAEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGYSSDSETLDLEEAEG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD AVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHNHTYNMAPSALDSADLPPPSALKKGSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHNHTYNMAPSALDSADLPPPSALKKGSK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD EKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELLSKYQLSEAQLSLIRDIRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELLSKYQLSEAQLSLIRDIRR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD RGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVEFLRSLRQMKQKVQSLYQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVEFLRSLRQMKQKVQSLYQE 670 680 690 700 710 720 730 740 750 760 770 pF1KSD VFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARRQERKPKDRRK :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARRQERKPKDRRK 730 740 750 760 770 >>CCDS82151.1 NFE2L1 gene_id:4779|Hs108|chr17 (761 aa) initn: 3852 init1: 3852 opt: 3852 Z-score: 2778.8 bits: 524.9 E(32554): 1.8e-148 Smith-Waterman score: 4914; 98.6% identity (98.6% similar) in 772 aa overlap (1-772:1-761) 10 20 30 40 50 60 pF1KSD MLSLKKYLTEGLLQFTILLSLIGVRVDVDTYLTSQLPPLREIILGPSSAYTQTQFHNLRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MLSLKKYLTEGLLQFTILLSLIGVRVDVDTYLTSQLPPLREIILGPSSAYTQTQFHNLRN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TLDGYGIHPKSIDLDNYFTARRLLSQVRALDRFQVPTTEVNAWLVHRDPEGSVSGSQPNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 TLDGYGIHPKSIDLDNYFTARRLLSQVRALDRFQVPTTEVNAWLVHRDPEGSVSGSQPNS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GLALESSSGLQDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWR :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GLALESSSGLQDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDL------ 130 140 150 160 170 190 200 210 220 230 240 pF1KSD QDIDLGAGREVFDYSHRQKEQDVEKELRDGGEQDTWAGEGAEALARNLLVDGETGESFPA ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 -----GAGREVFDYSHRQKEQDVEKELRDGGEQDTWAGEGAEALARNLLVDGETGESFPA 180 190 200 210 220 250 260 270 280 290 300 pF1KSD QVPSGEDQTALSLEECLRLLEATCPFGENAEFPADISSITEAVPSESEPPALQNNLLSPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 QVPSGEDQTALSLEECLRLLEATCPFGENAEFPADISSITEAVPSESEPPALQNNLLSPL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KSD LTGTESPFDLEQQWQDLMSIMEMQAMEVNTSASEILYSAPPGDPLSTNYSLAPNTPINQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 LTGTESPFDLEQQWQDLMSIMEMQAMEVNTSASEILYSAPPGDPLSTNYSLAPNTPINQN 290 300 310 320 330 340 370 380 390 400 410 420 pF1KSD VSLHQASLGGCSQDFLLFSPEVESLPVASSSTLLPLAPSNSTSLNSTFGSTNLTGLFFPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 VSLHQASLGGCSQDFLLFSPEVESLPVASSSTLLPLAPSNSTSLNSTFGSTNLTGLFFPP 350 360 370 380 390 400 430 440 450 460 470 480 pF1KSD QLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDLAIEEGFNPVQASQLEEEFDSDSGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 QLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDLAIEEGFNPVQASQLEEEFDSDSGLS 410 420 430 440 450 460 490 500 510 520 530 540 pF1KSD LDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGYSSDSETLDLEEAEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 LDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGYSSDSETLDLEEAEG 470 480 490 500 510 520 550 560 570 580 590 600 pF1KSD AVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHNHTYNMAPSALDSADLPPPSALKKGSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 AVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHNHTYNMAPSALDSADLPPPSALKKGSK 530 540 550 560 570 580 610 620 630 640 650 660 pF1KSD EKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELLSKYQLSEAQLSLIRDIRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 EKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELLSKYQLSEAQLSLIRDIRR 590 600 610 620 630 640 670 680 690 700 710 720 pF1KSD RGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVEFLRSLRQMKQKVQSLYQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 RGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVEFLRSLRQMKQKVQSLYQE 650 660 670 680 690 700 730 740 750 760 770 pF1KSD VFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARRQERKPKDRRK :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 VFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARRQERKPKDRRK 710 720 730 740 750 760 >>CCDS82150.1 NFE2L1 gene_id:4779|Hs108|chr17 (742 aa) initn: 3249 init1: 3249 opt: 3257 Z-score: 2351.5 bits: 445.8 E(32554): 1.2e-124 Smith-Waterman score: 4754; 96.1% identity (96.1% similar) in 772 aa overlap (1-772:1-742) 10 20 30 40 50 60 pF1KSD MLSLKKYLTEGLLQFTILLSLIGVRVDVDTYLTSQLPPLREIILGPSSAYTQTQFHNLRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MLSLKKYLTEGLLQFTILLSLIGVRVDVDTYLTSQLPPLREIILGPSSAYTQTQFHNLRN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TLDGYGIHPKSIDLDNYFTARRLLSQVRALDRFQVPTTEVNAWLVHRDPEGSVSGSQPNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 TLDGYGIHPKSIDLDNYFTARRLLSQVRALDRFQVPTTEVNAWLVHRDPEGSVSGSQPNS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GLALESSSGLQDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GLALESSSGLQDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QDIDLGAGREVFDYSHRQKEQDVEKELRDGGEQDTWAGEGAEALARNLLVDGETGESFPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 QDIDLGAGREVFDYSHRQKEQDVEKELRDGGEQDTWAGEGAEALARNLLVDGETGESFPA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD QVPSGEDQTALSLEECLRLLEATCPFGENAEFPADISSITEAVPSESEPPALQNNLLSPL : ::::::::::::::::::::::::::::: CCDS82 Q------------------------------FPADISSITEAVPSESEPPALQNNLLSPL 250 260 270 310 320 330 340 350 360 pF1KSD LTGTESPFDLEQQWQDLMSIMEMQAMEVNTSASEILYSAPPGDPLSTNYSLAPNTPINQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 LTGTESPFDLEQQWQDLMSIMEMQAMEVNTSASEILYSAPPGDPLSTNYSLAPNTPINQN 280 290 300 310 320 330 370 380 390 400 410 420 pF1KSD VSLHQASLGGCSQDFLLFSPEVESLPVASSSTLLPLAPSNSTSLNSTFGSTNLTGLFFPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 VSLHQASLGGCSQDFLLFSPEVESLPVASSSTLLPLAPSNSTSLNSTFGSTNLTGLFFPP 340 350 360 370 380 390 430 440 450 460 470 480 pF1KSD QLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDLAIEEGFNPVQASQLEEEFDSDSGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 QLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDLAIEEGFNPVQASQLEEEFDSDSGLS 400 410 420 430 440 450 490 500 510 520 530 540 pF1KSD LDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGYSSDSETLDLEEAEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 LDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGYSSDSETLDLEEAEG 460 470 480 490 500 510 550 560 570 580 590 600 pF1KSD AVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHNHTYNMAPSALDSADLPPPSALKKGSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 AVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHNHTYNMAPSALDSADLPPPSALKKGSK 520 530 540 550 560 570 610 620 630 640 650 660 pF1KSD EKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELLSKYQLSEAQLSLIRDIRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 EKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELLSKYQLSEAQLSLIRDIRR 580 590 600 610 620 630 670 680 690 700 710 720 pF1KSD RGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVEFLRSLRQMKQKVQSLYQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 RGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVEFLRSLRQMKQKVQSLYQE 640 650 660 670 680 690 730 740 750 760 770 pF1KSD VFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARRQERKPKDRRK :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 VFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARRQERKPKDRRK 700 710 720 730 740 >>CCDS42782.1 NFE2L2 gene_id:4780|Hs108|chr2 (605 aa) initn: 943 init1: 582 opt: 859 Z-score: 630.1 bits: 127.0 E(32554): 9e-29 Smith-Waterman score: 1048; 35.9% identity (61.9% similar) in 632 aa overlap (161-754:7-597) 140 150 160 170 180 190 pF1KSD QDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWRQDIDLGAGRE :: : ...:.::::::::::::::..:: CCDS42 MMDLELPP-PGLPSQQDMDLIDILWRQDIDLGVSRE 10 20 30 200 210 220 230 240 pF1KSD VFDYSHRQKEQDVEKELRDGGE-QDTWAGEGAEALARNLLVDGETGESFPAQVPSGEDQT :::.:.:.:: ..::. . : :. : .:. .: .: :::: .: : :. . :. CCDS42 VFDFSQRRKEYELEKQKKLEKERQEQLQKEQEKAFFAQLQLDEETGEFLPIQ-PAQHIQS 40 50 60 70 80 90 250 260 270 280 290 pF1KSD ------------------ALSLEECLRLLEATCPFGENAEFP-ADISSITEAVPSESEPP :: ...:..:: : :: .. : : ..:.. .:.. : : CCDS42 ETSGSANYSQVAHIPKSDALYFDDCMQLLAQTFPFVDDNEVSSATFQSLVPDIPGHIESP 100 110 120 130 140 150 300 310 320 330 pF1KSD AL--QNNLLSPLLTGTE-SPFDL-------EQQWQDLMSIMEMQAMEV-NTSASEILYSA .. :. :: . .. .: :: :: :..:.:: :.: ... : . : . CCDS42 VFIATNQAQSPETSVAQVAPVDLDGMQQDIEQVWEELLSIPELQCLNIENDKLVETTMVP 160 170 180 190 200 210 340 350 360 370 380 390 pF1KSD PPGDPLST--NYSLAPNTPINQNVSLHQASLGGCSQDFL-LFSPEVESLPVASSSTLLPL : :. :: . . : :... .:.:: :: : :. . . . : . CCDS42 SPEAKLTEVDNYHFYSSIP-----SMEKE-VGNCSPHFLNAFEDSFSSILSTEDPNQLTV 220 230 240 250 260 400 410 420 430 440 450 pF1KSD APSNS-TSLNSTFGSTNLTGLFFPPQLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDL :: ...:. ::. .... :..... : : :. :.: . :.. :: CCDS42 NSLNSDATVNTDFGDEFYSAFIAEPSISNSM-----PS-PATLSHSLSELLNGPIDVSDL 270 280 290 300 310 320 460 470 480 490 500 510 pF1KSD AIEEGFNPVQASQLEEEFDSDSGLSLDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSAS .. ..:: . . : :::::.::..: :: ..: : : ::: ... CCDS42 SLCKAFNQNHPESTAEFNDSDSGISLNTS--PS-VASPEHSVESSSYGDT---------- 330 340 350 360 520 530 540 550 560 570 pF1KSD SSFSEEGAVGYSSDSETLDLEEAEGAVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHN- .: : :::. .:. : :.: . . : : : .: : :.. CCDS42 -------LLGLS-DSEVEELDSAPGSV--KQNGPKTPVHSSGDMVQ----PLSPSQGQST 370 380 390 400 410 580 590 600 610 620 630 pF1KSD HTYNMAPSALDSADLPPPSALKKG--SKEKQADFLDKQMSRDEHRARAMKIPFTNDKIIN :... .:: . .: .:.:... :. ...::: ::.:..::: .:::: CCDS42 HVHDAQCENTPEKELPVSPGHRKTPFTKDKHSSRLEAHLTRDELRAKALHIPFPVEKIIN 420 430 440 450 460 470 640 650 660 670 680 690 pF1KSD LPVEEFNELLSKYQLSEAQLSLIRDIRRRGKNKMAAQNCRKRKLDTILNLERDVEDLQRD ::: .:::..:: :..::::.::::::::::::.::::::::::..:..::.:.. :. . CCDS42 LPVVDFNEMMSKEQFNEAQLALIRDIRRRGKNKVAAQNCRKRKLENIVELEQDLDHLKDE 480 490 500 510 520 530 700 710 720 730 740 750 pF1KSD KARLLREKVEFLRSLRQMKQKVQSLYQEVFGRLRDENGRPYSPSQYALQYAGDGSVLLIP : .::.:: : .::. .:.....:: :::. ::::.:.:::::.:.:: . ::.:.:.: CCDS42 KEKLLKEKGENDKSLHLLKKQLSTLYLEVFSMLRDEDGKPYSPSEYSLQQTRDGNVFLVP 540 550 560 570 580 590 760 770 pF1KSD RTMADQQARRQERKPKDRRK .. CCDS42 KSKKPDVKKN 600 >>CCDS5396.1 NFE2L3 gene_id:9603|Hs108|chr7 (694 aa) initn: 1077 init1: 626 opt: 846 Z-score: 619.8 bits: 125.3 E(32554): 3.3e-28 Smith-Waterman score: 1196; 35.9% identity (60.4% similar) in 788 aa overlap (1-770:1-694) 10 20 30 40 50 pF1KSD MLSLKKYLTEG--LLQFTILLSLIGVRVDVDTYLTSQLPP---LREIIL---GP-SSAYT : ::.. . : ::..:.:::: :.:::.: :: ::: :.. .: :: ::::. CCDS53 MKHLKRWWSAGGGLLHLTLLLSLAGLRVDLDLYLL--LPPPTLLQDELLFLGGPASSAYA 10 20 30 40 50 60 70 80 90 100 pF1KSD QTQFHNLRNTLDGYG----IHPKSIDLDNYFTAR-RLLSQVRALDRFQVPTTEVNAWLVH . : .. :.: .:::. .:: . .:: .:::: :: : :.::::: CCDS53 LSPF----SASGGWGRAGHLHPKGRELDPAAPPEGQLLREVRALGVPFVPRTSVDAWLVH 60 70 80 90 100 110 110 120 130 140 150 160 pF1KSD RDPEGSVSGSQPNSGLALESSSGLQDVTGPDNGVRESETEQGFGEDLEDLGAVAPPVSGD ::.. .. : : ::.: .. :.: :.. :: : : . .: . : CCDS53 SVAAGSADEAHGLLGAAAASSTGGAGAS-VDGG---SQAVQGGGGDPR--AARSGP---- 120 130 140 150 160 170 180 190 200 210 220 pF1KSD LTKEDIDLIDILWRQDIDLGAGREVFDYSHRQKEQDVEKELRDGGEQDTWAGEGAEALAR : ::.: :: . : :: : . CCDS53 ------------------LDAGEE-------------EKAPAEPTAQVPDAG-GCASEEN 170 180 190 230 240 250 260 270 280 pF1KSD NLLVDGETGESFPAQVPSGEDQTALSLEECLRLLEATCPFGENAEFPADISSITEAVPSE ..: . . . . .: .:.... . :. :. .: . : ..:.: : CCDS53 GVLREKHEAVDHSSQHEENEERVSAQKENSLQ---------QNDD---DENKIAEKPDWE 200 210 220 230 240 290 300 310 320 330 340 pF1KSD SEPPALQNNLLSPLLTGTESPFDLEQQWQDLMSIMEMQAMEVNTSASEILYSAPPGDPLS .: . . : :.::.. :.::. .: : : : . .. . . : : : CCDS53 AEKTTESRN--ERHLNGTDTSFSLEDLFQLLSSQPENSLEGISLGDIPLPGSISDGMNSS 250 260 270 280 290 350 360 370 380 390 400 pF1KSD TNYSLAPNTPINQNVSLHQASLGGCSQDFLLFSPEVESLPVASSSTLLPLAPSNSTSLNS ..: . . :.:.:.::.: : : .. . .: ... :. .: : :..:. .. CCDS53 AHYHVNFSQAISQDVNLHEAILL-CPNNTFRRDPTART--SQSQEPFLQLN-SHTTNPEQ 300 310 320 330 340 350 410 420 430 440 450 460 pF1KSD TFGSTNLTGLFFPPQLNGTANDTAGPELPDPLGGLLDEAMLDEISLMDLAIEEGFNPVQA :. .::::: :. : : : :. : : :: ..:::.::.:: :..:.:... CCDS53 TLPGTNLTG-FLSPVDNHMRNLTSQDLLYD-----LDINIFDEINLMSLATEDNFDPIDV 360 370 380 390 400 470 480 490 500 510 520 pF1KSD SQLEEEFDSDSGLSLDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGY ::: .: ::::::::::::. ..: .:..: : .:::.:: CCDS53 SQLFDEPDSDSGLSLDSSHN-------------------NTSVIKSNSSHSVCDEGAIGY 410 420 430 440 530 540 550 560 570 580 pF1KSD SSDSETLDLEEAEGAVG-YQPEYSKFCRMSYQDPAQLSCLPYLEHVGHNHTYNMAPSALD .: :. . .. ::::: : :: ::.:... .: . : . .:: :::::.. :.: . CCDS53 CTDHESSSHHDLEGAVGGYYPEPSKLCHLDQSDSDFHGDLTF-QHVFHNHTYHLQPTAPE 450 460 470 480 490 500 590 600 610 620 630 640 pF1KSD SADLPPPSALKKGSKEKQADFL---DKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELL :.. : : : :.. .. .: :...::::.::.:..:::. :.:...::. :: .: CCDS53 STSEPFPWPGK--SQKIRSRYLEDTDRNLSRDEQRAKALHIPFSVDEIVGMPVDSFNSML 510 520 530 540 550 560 650 660 670 680 690 700 pF1KSD SKYQLSEAQLSLIRDIRRRGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVE :.: :.. :.:::::::::::::.::::::::::: ::::: :: .:: : : ::... CCDS53 SRYYLTDLQVSLIRDIRRRGKNKVAAQNCRKRKLDIILNLEDDVCNLQAKKETLKREQAQ 570 580 590 600 610 620 710 720 730 740 750 760 pF1KSD FLRSLRQMKQKVQSLYQEVFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARR ... ::::...::...:.::::..::: .:..:::: . :::.:..:. .. . .. CCDS53 CNKAINIMKQKLHDLYHDIFSRLRDDQGRPVNPNHYALQCTHDGSILIVPKELVASGHKK 630 640 650 660 670 680 770 pF1KSD QERKPKDRRK . .: : . CCDS53 ETQKGKRK 690 >>CCDS46457.1 NFE2L2 gene_id:4780|Hs108|chr2 (589 aa) initn: 929 init1: 582 opt: 838 Z-score: 615.2 bits: 124.2 E(32554): 6.1e-28 Smith-Waterman score: 1027; 35.8% identity (62.0% similar) in 623 aa overlap (172-754:1-581) 150 160 170 180 190 200 pF1KSD ESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWRQDIDLGAGREVFDYSHRQKEQ .::::::::::::::..:::::.:.:.:: CCDS46 MDLIDILWRQDIDLGVSREVFDFSQRRKEY 10 20 30 210 220 230 240 pF1KSD DVEKELRDGGE-QDTWAGEGAEALARNLLVDGETGESFPAQVPSGEDQT----------- ..::. . : :. : .:. .: .: :::: .: : :. . :. CCDS46 ELEKQKKLEKERQEQLQKEQEKAFFAQLQLDEETGEFLPIQ-PAQHIQSETSGSANYSQV 40 50 60 70 80 250 260 270 280 290 pF1KSD -------ALSLEECLRLLEATCPFGENAEFP-ADISSITEAVPSESEPPAL--QNNLLSP :: ...:..:: : :: .. : : ..:.. .:.. : :.. :. :: CCDS46 AHIPKSDALYFDDCMQLLAQTFPFVDDNEVSSATFQSLVPDIPGHIESPVFIATNQAQSP 90 100 110 120 130 140 300 310 320 330 340 pF1KSD LLTGTE-SPFDL-------EQQWQDLMSIMEMQAMEV-NTSASEILYSAPPGDPLST--N . .. .: :: :: :..:.:: :.: ... : . : . : :. : CCDS46 ETSVAQVAPVDLDGMQQDIEQVWEELLSIPELQCLNIENDKLVETTMVPSPEAKLTEVDN 150 160 170 180 190 200 350 360 370 380 390 400 pF1KSD YSLAPNTPINQNVSLHQASLGGCSQDFL-LFSPEVESLPVASSSTLLPLAPSNS-TSLNS : . . : :... .:.:: :: : :. . . . : . :: ...:. CCDS46 YHFYSSIP-----SMEKE-VGNCSPHFLNAFEDSFSSILSTEDPNQLTVNSLNSDATVNT 210 220 230 240 250 260 410 420 430 440 450 460 pF1KSD TFGSTNLTGLFFPPQLNGTANDTAGPELPDP--LGGLLDEAMLDEISLMDLAIEEGFNPV ::. .... :..... .:.: :. :.: . :.. ::.. ..:: CCDS46 DFGDEFYSAFIAEPSISNS--------MPSPATLSHSLSELLNGPIDVSDLSLCKAFNQN 270 280 290 300 310 470 480 490 500 510 520 pF1KSD QASQLEEEFDSDSGLSLDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAV . . : :::::.::..: :: ..: : : ::: ... . CCDS46 HPESTAEFNDSDSGISLNTS--PS-VASPEHSVESSSYGDT-----------------LL 320 330 340 350 530 540 550 560 570 580 pF1KSD GYSSDSETLDLEEAEGAVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHN-HTYNMAPSA : : :::. .:. : :.: . . : : : .: : :.. :... CCDS46 GLS-DSEVEELDSAPGSV--KQNGPKTPVHSSGDMVQ----PLSPSQGQSTHVHDAQCEN 360 370 380 390 400 590 600 610 620 630 640 pF1KSD LDSADLPPPSALKKG--SKEKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNEL .:: . .: .:.:... :. ...::: ::.:..::: .::::::: .:::. CCDS46 TPEKELPVSPGHRKTPFTKDKHSSRLEAHLTRDELRAKALHIPFPVEKIINLPVVDFNEM 410 420 430 440 450 460 650 660 670 680 690 700 pF1KSD LSKYQLSEAQLSLIRDIRRRGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKV .:: :..::::.::::::::::::.::::::::::..:..::.:.. :. .: .::.:: CCDS46 MSKEQFNEAQLALIRDIRRRGKNKVAAQNCRKRKLENIVELEQDLDHLKDEKEKLLKEKG 470 480 490 500 510 520 710 720 730 740 750 760 pF1KSD EFLRSLRQMKQKVQSLYQEVFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQAR : .::. .:.....:: :::. ::::.:.:::::.:.:: . ::.:.:.:.. CCDS46 ENDKSLHLLKKQLSTLYLEVFSMLRDEDGKPYSPSEYSLQQTRDGNVFLVPKSKKPDVKK 530 540 550 560 570 580 770 pF1KSD RQERKPKDRRK CCDS46 N >>CCDS46458.1 NFE2L2 gene_id:4780|Hs108|chr2 (582 aa) initn: 927 init1: 582 opt: 668 Z-score: 493.1 bits: 101.6 E(32554): 3.8e-21 Smith-Waterman score: 1027; 35.6% identity (62.1% similar) in 618 aa overlap (172-754:1-574) 150 160 170 180 190 200 pF1KSD ESETEQGFGEDLEDLGAVAPPVSGDLTKEDIDLIDILWRQDIDLGAGREVFDYSHRQKEQ .::::::::::::::..:::::.:.:.:: CCDS46 MDLIDILWRQDIDLGVSREVFDFSQRRKEY 10 20 30 210 220 230 240 pF1KSD DVEKELRDGGE-QDTWAGEGAEALARNLLVDGETGESFPAQVPSGEDQT----------- ..::. . : :. : .:. .: .: :::: .: : :. . :. CCDS46 ELEKQKKLEKERQEQLQKEQEKAFFAQLQLDEETGEFLPIQ-PAQHIQSETSGSANYSQV 40 50 60 70 80 250 260 270 280 290 pF1KSD -------ALSLEECLRLLEATCPFGENAE-----FPADISSITEAVPSESEPPALQNNLL :: ...:..:: : :: .. : .:. : : . . .... : . . CCDS46 AHIPKSDALYFDDCMQLLAQTFPFVDDNESLVPDIPGHIESPVFIATNQAQSPETSVAQV 90 100 110 120 130 140 300 310 320 330 340 350 pF1KSD SPL-LTGTESPFDLEQQWQDLMSIMEMQAMEV-NTSASEILYSAPPGDPLST--NYSLAP .:. : : .. :.:: :..:.:: :.: ... : . : . : :. :: . CCDS46 APVDLDGMQQ--DIEQVWEELLSIPELQCLNIENDKLVETTMVPSPEAKLTEVDNYHFYS 150 160 170 180 190 200 360 370 380 390 400 410 pF1KSD NTPINQNVSLHQASLGGCSQDFL-LFSPEVESLPVASSSTLLPLAPSNS-TSLNSTFGST . : :... .:.:: :: : :. . . . : . :: ...:. ::. CCDS46 SIP-----SMEKE-VGNCSPHFLNAFEDSFSSILSTEDPNQLTVNSLNSDATVNTDFGDE 210 220 230 240 250 260 420 430 440 450 460 pF1KSD NLTGLFFPPQLNGTANDTAGPELPDP--LGGLLDEAMLDEISLMDLAIEEGFNPVQASQL .... :..... .:.: :. :.: . :.. ::.. ..:: . . CCDS46 FYSAFIAEPSISNS--------MPSPATLSHSLSELLNGPIDVSDLSLCKAFNQNHPEST 270 280 290 300 310 470 480 490 500 510 520 pF1KSD EEEFDSDSGLSLDSSHSPSSLSSSEGSSSSSSSSSSSSSSASSSASSSFSEEGAVGYSSD : :::::.::..: :: ..: : : ::: ... .: : : CCDS46 AEFNDSDSGISLNTS--PS-VASPEHSVESSSYGDT-----------------LLGLS-D 320 330 340 350 530 540 550 560 570 580 pF1KSD SETLDLEEAEGAVGYQPEYSKFCRMSYQDPAQLSCLPYLEHVGHN-HTYNMAPSALDSAD ::. .:. : :.: . . : : : .: : :.. :... . CCDS46 SEVEELDSAPGSV--KQNGPKTPVHSSGDMVQ----PLSPSQGQSTHVHDAQCENTPEKE 360 370 380 390 400 590 600 610 620 630 640 pF1KSD LPPPSALKKG--SKEKQADFLDKQMSRDEHRARAMKIPFTNDKIINLPVEEFNELLSKYQ :: . .: .:.:... :. ...::: ::.:..::: .::::::: .:::..:: : CCDS46 LPVSPGHRKTPFTKDKHSSRLEAHLTRDELRAKALHIPFPVEKIINLPVVDFNEMMSKEQ 410 420 430 440 450 460 650 660 670 680 690 700 pF1KSD LSEAQLSLIRDIRRRGKNKMAAQNCRKRKLDTILNLERDVEDLQRDKARLLREKVEFLRS ..::::.::::::::::::.::::::::::..:..::.:.. :. .: .::.:: : .: CCDS46 FNEAQLALIRDIRRRGKNKVAAQNCRKRKLENIVELEQDLDHLKDEKEKLLKEKGENDKS 470 480 490 500 510 520 710 720 730 740 750 760 pF1KSD LRQMKQKVQSLYQEVFGRLRDENGRPYSPSQYALQYAGDGSVLLIPRTMADQQARRQERK :. .:.....:: :::. ::::.:.:::::.:.:: . ::.:.:.:.. CCDS46 LHLLKKQLSTLYLEVFSMLRDEDGKPYSPSEYSLQQTRDGNVFLVPKSKKPDVKKN 530 540 550 560 570 580 770 pF1KSD PKDRRK >>CCDS8876.1 NFE2 gene_id:4778|Hs108|chr12 (373 aa) initn: 698 init1: 600 opt: 619 Z-score: 460.9 bits: 95.0 E(32554): 2.4e-19 Smith-Waterman score: 658; 34.9% identity (55.2% similar) in 467 aa overlap (289-753:5-365) 260 270 280 290 300 310 pF1KSD LLEATCPFGENAEFPADISSITEAVPSESEPPALQNNLLSPLLTGTESPFDLEQQWQDLM :: . : . : :. . ..: ::..: CCDS88 MSPCPPQQSRNRVIQLSTSELG--EMELTWQEIM 10 20 30 320 330 340 350 360 370 pF1KSD SIMEMQAMEVNTSASEILYSAPPGDPLSTNYSLAPNTPINQN-VSLHQASLGGCSQDFLL :: :.:.... : : .: . :.: : . :.: : : : CCDS88 SITELQGLNAP--------SEPSFEPQAPAPYLGPPPPTTYCPCSIHPDS------GFPL 40 50 60 70 380 390 400 410 420 430 pF1KSD FSPEVESLPVASSSTLLPLAPSNSTSLNSTFGSTNLTGLFFPPQLNGTANDTAGP-ELPD : : ::...: . :. :: : . : : : CCDS88 PPPPYE-LPASTSHV-----PD-------------------PPYSYG---NMAIPVSKPL 80 90 100 110 440 450 460 470 480 490 pF1KSD PLGGLLDEAMLDEISLMDLAIEEGFNPVQASQLEEEFDSDSGLSLDSSHSPSSLSSSEGS :.:::.: . : ..:.:... : : . .:. .:::::::. : CCDS88 SLSGLLSEPLQDPLALLDIGLPAG--PPKP---QEDPESDSGLSLNYS------------ 120 130 140 150 500 510 520 530 540 550 pF1KSD SSSSSSSSSSSSSASSSASSSFSEEGAVGYSSDSETLDLEEAEGAVGYQPEYSKFCRMSY :.:.:.:: .: : . :: .. . : CCDS88 --------------------------------DAESLELEGTE-AGRRRSEYVEMYPVEY 160 170 180 560 570 580 590 600 610 pF1KSD QDPAQLSCLPYLEHVGHNHTYNMAPSALDSADLPPPSALKKGSKEKQADFLDKQMSRDEH : .: .: . ..:.. :.. :.: : : : : . . . ::::. CCDS88 --PYSL--MP--NSLAHSN-YTL-PAAETPLALEPSS----GPVRAKPTARGEAGSRDER 190 200 210 220 620 630 640 650 660 670 pF1KSD RARAMKIPFTNDKIINLPVEEFNELLSKYQLSEAQLSLIRDIRRRGKNKMAAQNCRKRKL :: :::::: .:::.::::..:::::..: :.:.::.:.::::::::::.:::::::::: CCDS88 RALAMKIPFPTDKIVNLPVDDFNELLARYPLTESQLALVRDIRRRGKNKVAAQNCRKRKL 230 240 250 260 270 280 680 690 700 710 720 730 pF1KSD DTILNLERDVEDLQRDKARLLREKVEFLRSLRQMKQKVQSLYQEVFGRLRDENGRPYSPS .::..:::..: : .. :::: . : :.:. :.:.. ::...: .::::.: ::: CCDS88 ETIVQLERELERLTNERERLLRARGEADRTLEVMRQQLTELYRDIFQHLRDESGNSYSPE 290 300 310 320 330 340 740 750 760 770 pF1KSD QYALQYAGDGSVLLIPRTMADQQARRQERKPKDRRK .:::: :.::...:.:: CCDS88 EYALQQAADGTIFLVPRGTKMEATD 350 360 370 772 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 09:00:04 2016 done: Thu Nov 3 09:00:05 2016 Total Scan time: 5.000 Total Display time: 0.180 Function used was FASTA [36.3.4 Apr, 2011]