FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9879, 584 aa 1>>>pF1KB9879 584 - 584 aa - 584 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.5949+/-0.000861; mu= 2.2867+/- 0.052 mean_var=273.4198+/-55.392, 0's: 0 Z-trim(116.6): 11 B-trim: 0 in 0/50 Lambda= 0.077564 statistics sampled from 17213 (17222) to 17213 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.815), E-opt: 0.2 (0.529), width: 16 Scan time: 3.660 The best scores are: opt bits E(32554) CCDS12678.1 IRF2BP1 gene_id:26145|Hs108|chr19 ( 584) 4068 468.2 1.2e-131 CCDS1602.1 IRF2BP2 gene_id:359948|Hs108|chr1 ( 587) 962 120.7 5.2e-27 CCDS41475.1 IRF2BP2 gene_id:359948|Hs108|chr1 ( 571) 648 85.5 1.9e-16 CCDS9854.1 IRF2BPL gene_id:64207|Hs108|chr14 ( 796) 616 82.1 3e-15 >>CCDS12678.1 IRF2BP1 gene_id:26145|Hs108|chr19 (584 aa) initn: 4068 init1: 4068 opt: 4068 Z-score: 2476.8 bits: 468.2 E(32554): 1.2e-131 Smith-Waterman score: 4068; 100.0% identity (100.0% similar) in 584 aa overlap (1-584:1-584) 10 20 30 40 50 60 pF1KB9 MASVQASRRQWCYLCDLPKMPWAMVWDFSEAVCRGCVNFEGADRIELLIDAARQLKRSHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MASVQASRRQWCYLCDLPKMPWAMVWDFSEAVCRGCVNFEGADRIELLIDAARQLKRSHV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 LPEGRSPGPPALKHPATKDLAAAAAQGPQLPPPQAQPQPSGTGGGVSGQDRYDRATSSGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LPEGRSPGPPALKHPATKDLAAAAAQGPQLPPPQAQPQPSGTGGGVSGQDRYDRATSSGR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 LPLPSPALEYTLGSRLANGLGREEAVAEGARRALLGSMPGLMPPGLLAAAVSGLGSRGLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LPLPSPALEYTLGSRLANGLGREEAVAEGARRALLGSMPGLMPPGLLAAAVSGLGSRGLT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 LAPGLSPARPLFGSDFEKEKQQRNADCLAELNEAMRGRAEEWHGRPKAVREQLLALSACA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LAPGLSPARPLFGSDFEKEKQQRNADCLAELNEAMRGRAEEWHGRPKAVREQLLALSACA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 PFNVRFKKDHGLVGRVFAFDATARPPGYEFELKLFTEYPCGSGNVYAGVLAVARQMFHDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PFNVRFKKDHGLVGRVFAFDATARPPGYEFELKLFTEYPCGSGNVYAGVLAVARQMFHDA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 LREPGKALASSGFKYLEYERRHGSGEWRQLGELLTDGVRSFREPAPAEALPQQYPEPAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LREPGKALASSGFKYLEYERRHGSGEWRQLGELLTDGVRSFREPAPAEALPQQYPEPAPA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 ALCGPPPRAPSRNLAPTPRRRKASPEPEGEAAGKMTTEEQQQRHWVAPGGPYSAETPGVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ALCGPPPRAPSRNLAPTPRRRKASPEPEGEAAGKMTTEEQQQRHWVAPGGPYSAETPGVP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 SPIAALKNVAEALGHSPKDPGGGGGPVRAGGASPAASSTAQPPTQHRLVARNGEAEVSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SPIAALKNVAEALGHSPKDPGGGGGPVRAGGASPAASSTAQPPTQHRLVARNGEAEVSPT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 AGAEAVSGGGSGTGATPGAPLCCTLCRERLEDTHFVQCPSVPGHKFCFPCSREFIKAQGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AGAEAVSGGGSGTGATPGAPLCCTLCRERLEDTHFVQCPSVPGHKFCFPCSREFIKAQGP 490 500 510 520 530 540 550 560 570 580 pF1KB9 AGEVYCPSGDKCPLVGSSVPWAFMQGEIATILAGDIKVKKERDP :::::::::::::::::::::::::::::::::::::::::::: CCDS12 AGEVYCPSGDKCPLVGSSVPWAFMQGEIATILAGDIKVKKERDP 550 560 570 580 >>CCDS1602.1 IRF2BP2 gene_id:359948|Hs108|chr1 (587 aa) initn: 1073 init1: 566 opt: 962 Z-score: 598.4 bits: 120.7 E(32554): 5.2e-27 Smith-Waterman score: 1025; 38.0% identity (56.1% similar) in 629 aa overlap (1-583:5-586) 10 20 30 40 50 pF1KB9 MASVQASRRQWCYLCDLPKMPWAMVWDFSEAVCRGCVNFEGADRIELLIDAARQLK .: . ::::: :::::::.:::::.:::.: :::::::.:::::.:..:..::::: CCDS16 MAAAVAVAAASRRQSCYLCDLPRMPWAMIWDFTEPVCRGCVNYEGADRVEFVIETARQLK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 RSH-VLPEGRSPGPPALKHPATKDLAAAAAQGPQLPPPQA--QPQPSGTGGGVSGQDRYD :.: .:::::: : : :.:::. : : . : : . :: . : CCDS16 RAHGCFPEGRSP-PGAA--------ASAAAKPPPLSAKDILLQQQQQLGHGGPEAAPRAP 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 RATSSGRLPLPSPALEYTLGSRLANGLGREEAVAEGARRALLGSMPGLMPPGLLAAAVSG .: : :: . : . ::.. .: . .: :.. : .:: . . : . CCDS16 QALE--RYPLAAAAER---PPRLGSDFGSSRPAAS------LAQPPTPQPPPVNGILVPN 120 130 140 150 160 180 190 200 210 220 230 pF1KB9 LGSRGLTLAPGLSPARPLFGSDFEKEKQQRNADCLAELNEAMRGRAEEWHGRPKAVREQL : : : :. : . .:. : : : : : :. CCDS16 -GFSKLEEPPELNRQSP---------NPRRGHAVPPTLVPLMNGSATPL---PTALG--- 170 180 190 200 240 250 260 270 280 290 pF1KB9 LALSACAPFNVRFKKDHGLVGRVFAFD--ATARPPGYEFELKLFTEYPCGSGNVYAGVLA :. : : . . . .: . : : :: . . : .. : CCDS16 LGGRAAASLAAVSGTAAASLGSAQPTDLGAHKRPASVSSSAAVEHEQREAA--------A 210 220 230 240 250 300 310 320 330 340 pF1KB9 VARQMFHDALREPGKALASS-GFKYLEYE---RRHGSGE--WRQLGELLTDGVRSFREPA .: : : :. .:... : : : . .:::: : . . . : . .... . CCDS16 KEKQPPPPAHRGPADSLSTAAGAAELSAEGAGKSRGSGEQDWVNRPKTVRDTLLALHQHG 260 270 280 290 300 310 350 360 370 380 390 pF1KB9 PAEALPQQYP-EPAPAA--LCGPPPRAP--SRNLAPTPRRRKASPEPEGEAAG-KMTTEE . . ... ::: .: : : . :. .: : :.:: :::::::.. :.. : CCDS16 HSGPFESKFKKEPALTAGRLLGFEANGANGSKAVARTARKRKPSPEPEGEVGPPKINGEA 320 330 340 350 360 370 400 410 420 430 pF1KB9 QQQ---------------RHWVAP----GGPYSAET--PGVP----SPIAALKNVAEALG : .:.: ..:.: .: : . ::.::: ::. : CCDS16 QPWLSTSTEGLKIPMTPTSSFVSPPPPTASPHSNRTTPPEAAQNGQSPMAALILVADNAG 380 390 400 410 420 430 440 450 460 470 480 490 pF1KB9 --HSPKDPGGGGGPVRAGGASPAASSTAQPPTQHRLVARN-GEAEVSPTAGAEAVSGGG- :. :: . . .: .. :: . :. . :.:: :. : .. :.: : : .. CCDS16 GSHASKDANQVHSTTRRNSNSPPSPSSMN---QRRLGPREVGGQGAGNTGGLEPVHPASL 440 450 460 470 480 490 500 510 520 530 540 550 pF1KB9 SGTGATPGAPLCCTLCRERLEDTHFVQCPSVPGHKFCFPCSREFIKAQGPAGEVYCPSGD .. . .::::::::.:::::::::::::::.:::::::::. :: :: .::::::::. CCDS16 PDSSLATSAPLCCTLCHERLEDTHFVQCPSVPSHKFCFPCSRQSIKQQGASGEVYCPSGE 500 510 520 530 540 550 560 570 580 pF1KB9 KCPLVGSSVPWAFMQGEIATILAGDIKVKKERDP :::::::.:::::::::::::::::.::::::: CCDS16 KCPLVGSNVPWAFMQGEIATILAGDVKVKKERDS 560 570 580 >>CCDS41475.1 IRF2BP2 gene_id:359948|Hs108|chr1 (571 aa) initn: 1066 init1: 566 opt: 648 Z-score: 408.6 bits: 85.5 E(32554): 1.9e-16 Smith-Waterman score: 1009; 37.8% identity (55.7% similar) in 625 aa overlap (1-583:5-570) 10 20 30 40 50 pF1KB9 MASVQASRRQWCYLCDLPKMPWAMVWDFSEAVCRGCVNFEGADRIELLIDAARQLK .: . ::::: :::::::.:::::.:::.: :::::::.:::::.:..:..::::: CCDS41 MAAAVAVAAASRRQSCYLCDLPRMPWAMIWDFTEPVCRGCVNYEGADRVEFVIETARQLK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 RSH-VLPEGRSPGPPALKHPATKDLAAAAAQGPQLPPPQA--QPQPSGTGGGVSGQDRYD :.: .:::::: : : :.:::. : : . : : . :: . : CCDS41 RAHGCFPEGRSP-PGAA--------ASAAAKPPPLSAKDILLQQQQQLGHGGPEAAPRAP 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 RATSSGRLPLPSPALEYTLGSRLANGLGREEAVAEGARRALLGSMPGLMPPGLLAAAVSG .: : :: . : . ::.. .: . .: :.. : .:: . . : . CCDS41 QALE--RYPLAAAAER---PPRLGSDFGSSRPAAS------LAQPPTPQPPPVNGILVPN 120 130 140 150 160 180 190 200 210 220 230 pF1KB9 LGSRGLTLAPGLSPARPLFGSDFEKEKQQRNADCLAELNEAMRGRAEEWHGRPKAVREQL : : : :. : . .:. : : : : : :. CCDS41 -GFSKLEEPPELNRQSP---------NPRRGHAVPPTLVPLMNGSATPL---PTALG--- 170 180 190 200 240 250 260 270 280 290 pF1KB9 LALSACAPFNVRFKKDHGLVGRVFAFD--ATARPPGYEFELKLFTEYPCGSGNVYAGVLA :. : : . . . .: . : : :: . . : .. : CCDS41 LGGRAAASLAAVSGTAAASLGSAQPTDLGAHKRPASVSSSAAVEHEQREAA--------A 210 220 230 240 250 300 310 320 330 340 pF1KB9 VARQMFHDALREPGKALASS-GFKYLEYE---RRHGSGE--WRQLGELLTDGVRSFREPA .: : : :. .:... : : : . .:::: : . . . : . .... . CCDS41 KEKQPPPPAHRGPADSLSTAAGAAELSAEGAGKSRGSGEQDWVNRPKTVRDTLLALHQHG 260 270 280 290 300 310 350 360 370 380 390 400 pF1KB9 PAEALPQQYP-EPAPAALCGPPPRAPSRNLAPTPRRRKASPEPEGEAAG-KMTTEEQQQ- . . ... ::: .:. : : :.:: :::::::.. :.. : : CCDS41 HSGPFESKFKKEPALTAV------------ARTARKRKPSPEPEGEVGPPKINGEAQPWL 320 330 340 350 360 410 420 430 pF1KB9 --------------RHWVAP----GGPYSAET--PGVP----SPIAALKNVAEALG--HS .:.: ..:.: .: : . ::.::: ::. : :. CCDS41 STSTEGLKIPMTPTSSFVSPPPPTASPHSNRTTPPEAAQNGQSPMAALILVADNAGGSHA 370 380 390 400 410 420 440 450 460 470 480 490 pF1KB9 PKDPGGGGGPVRAGGASPAASSTAQPPTQHRLVARN-GEAEVSPTAGAEAVSGGG-SGTG :: . . .: .. :: . :. . :.:: :. : .. :.: : : .. .. CCDS41 SKDANQVHSTTRRNSNSPPSPSSMN---QRRLGPREVGGQGAGNTGGLEPVHPASLPDSS 430 440 450 460 470 480 500 510 520 530 540 550 pF1KB9 ATPGAPLCCTLCRERLEDTHFVQCPSVPGHKFCFPCSREFIKAQGPAGEVYCPSGDKCPL . .::::::::.:::::::::::::::.:::::::::. :: :: .::::::::.:::: CCDS41 LATSAPLCCTLCHERLEDTHFVQCPSVPSHKFCFPCSRQSIKQQGASGEVYCPSGEKCPL 490 500 510 520 530 540 560 570 580 pF1KB9 VGSSVPWAFMQGEIATILAGDIKVKKERDP :::.:::::::::::::::::.::::::: CCDS41 VGSNVPWAFMQGEIATILAGDVKVKKERDS 550 560 570 >>CCDS9854.1 IRF2BPL gene_id:64207|Hs108|chr14 (796 aa) initn: 1584 init1: 577 opt: 616 Z-score: 387.4 bits: 82.1 E(32554): 3e-15 Smith-Waterman score: 1462; 45.9% identity (66.2% similar) in 604 aa overlap (68-584:207-796) 40 50 60 70 80 90 pF1KB9 NFEGADRIELLIDAARQLKRSHVLPEGRSPGPPAL--KHPATKDLAAAAA--QGPQLPPP ::: : . : ... ::..: .: . CCDS98 PVSLGSSSHTARLPNGLGGPNGFPKPTPEEGPPELNRQSPNSSSAAASVASRRGTHGGLV 180 190 200 210 220 230 100 110 120 130 140 pF1KB9 QAQPQPSGTGG-------GVSGQDRYDRATSSGRLPLPSPALEYTLGSRLANGLGREEAV . :.:.: :: .. : . .:.. :: : : ..:::: : . CCDS98 TGLPNPGGGGGPQLTVPPNLLPQTLLNGPASAAVLPPPPP---HALGSR-----GPPTPA 240 250 260 270 280 150 160 170 180 190 200 pF1KB9 AEGARR--ALLGSMPGLMPPGLLAAAVSGLGSRGLTLAPGLSPARP--LFGSDFEKE--K :: : ::. ::. . ..: :. .: .. : . :: . ..: :.: . CCDS98 PPGAPGGPACLGGTPGVSATS--SSASSSTSSSVAEVGVGAGGKRPGSVSSTDQERELKE 290 300 310 320 330 340 210 220 230 240 250 260 pF1KB9 QQRNADCLAELNEAMRGRAEEWHGRPKAVREQLLALSACAPFNVRFKKDHGLVGRVFAFD .::::. ::::.:..:.::::: ..:: ::. ::.:..:.:..:::::::.:.::::::: CCDS98 KQRNAEALAELSESLRNRAEEWASKPKMVRDTLLTLAGCTPYEVRFKKDHSLLGRVFAFD 350 360 370 380 390 400 270 280 290 300 310 320 pF1KB9 ATARPPGYEFELKLFTEYPCGSGNVYAGVLAVARQMFHDALREPGKALASSGFKYLEYER :...: :...::::: ::: ::::::... .::.::..: ... :..: ::::::::::. CCDS98 AVSKP-GMDYELKLFIEYPTGSGNVYSSASGVAKQMYQDCMKDFGRGL-SSGFKYLEYEK 410 420 430 440 450 460 330 340 350 360 pF1KB9 RHGSGEWRQLGELLTDGVRSFREPAP-AEALPQQYPE---P-----------APAALCGP .::::.:: ::.:: ..:: :.: .: :. ::: : . : ::.: : CCDS98 KHGSGDWRLLGDLLPEAVRFFKEGVPGADMLPQPYLDASCPMLPTALVSLSRAPSAPPGT 470 480 490 500 510 520 370 380 390 400 pF1KB9 ---PPRAPS-RNLAPTPRRRKASPEPEGEAAGKMTT-EEQQQRHWVA------------- :: ::: :. : . :.::::::: : : . ::::...:.: CCDS98 GALPPAAPSGRGAAASLRKRKASPEPPDSAEGALKLGEEQQRQQWMANQSEALKLTMSAG 530 540 550 560 570 580 410 420 430 440 pF1KB9 ----PG-------------GPYSAET-P------GVPSPIAALKNVAEALG--HSPKDPG :: ::.: .: : . :::.::: .::..:: ::::: . CCDS98 GFAAPGHAAGGPPPPPPPLGPHSNRTTPPESAPQNGPSPMAALMSVADTLGTAHSPKDGS 590 600 610 620 630 640 450 460 470 480 490 pF1KB9 G---GGGPVRAGGASPAASSTAQPPTQHRLVARNGE-----AEVSPTA--GAEAVSGGG- . . .: ...::. : :. : :.::..:::. : :.: : . : . CCDS98 SVHSTTASARRNSSSPV--SPASVPGQRRLASRNGDLNLQVAPPPPSAHPGMDQVHPQNI 650 660 670 680 690 700 500 510 520 530 540 550 pF1KB9 SGTGATPGAPLCCTLCRERLEDTHFVQCPSVPGHKFCFPCSREFIKAQGPAGEVYCPSGD . . ..:::::.:.:::::::::::::::.:::::::::: ::::: .::::::::. CCDS98 PDSPMANSGPLCCTICHERLEDTHFVQCPSVPSHKFCFPCSRESIKAQGATGEVYCPSGE 710 720 730 740 750 760 560 570 580 pF1KB9 KCPLVGSSVPWAFMQGEIATILAGDIKVKKERDP :::::::.:::::::::::::::::.:::::::: CCDS98 KCPLVGSNVPWAFMQGEIATILAGDVKVKKERDP 770 780 790 584 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 20:15:06 2016 done: Fri Nov 4 20:15:07 2016 Total Scan time: 3.660 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]