FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7715, 426 aa 1>>>pF1KB7715 426 - 426 aa - 426 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5148+/-0.000692; mu= 16.7074+/- 0.042 mean_var=71.2645+/-14.202, 0's: 0 Z-trim(110.6): 22 B-trim: 525 in 1/49 Lambda= 0.151928 statistics sampled from 11717 (11736) to 11717 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.738), E-opt: 0.2 (0.361), width: 16 Scan time: 3.240 The best scores are: opt bits E(32554) CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 ( 426) 2959 657.4 7.7e-189 CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 ( 393) 678 157.4 2.3e-38 CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 ( 451) 638 148.6 1.1e-35 CCDS12775.1 IRF3 gene_id:3661|Hs108|chr19 ( 427) 476 113.1 5.2e-25 CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 ( 349) 398 96.0 6.2e-20 CCDS55681.1 IRF6 gene_id:3664|Hs108|chr1 ( 372) 396 95.6 8.8e-20 CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 ( 325) 395 95.3 9.2e-20 CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 ( 467) 391 94.5 2.3e-19 CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 ( 498) 390 94.3 2.8e-19 CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 ( 412) 384 93.0 6e-19 CCDS43645.1 IRF5 gene_id:3663|Hs108|chr7 ( 514) 384 93.0 7.2e-19 CCDS59409.1 IRF3 gene_id:3661|Hs108|chr19 ( 452) 374 90.8 2.9e-18 CCDS56099.1 IRF3 gene_id:3661|Hs108|chr19 ( 300) 294 73.2 4e-13 >>CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 (426 aa) initn: 2959 init1: 2959 opt: 2959 Z-score: 3503.8 bits: 657.4 E(32554): 7.7e-189 Smith-Waterman score: 2959; 100.0% identity (100.0% similar) in 426 aa overlap (1-426:1-426) 10 20 30 40 50 60 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 AVFKGKFKEGDKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVPEEEQKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 AVFKGKFKEGDKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVPEEEQKC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KLGVATAGCVNEVTEMECGRSEIDELIKEPSVDDYMGMIKRSPSPPEACRSQLLPDWWAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KLGVATAGCVNEVTEMECGRSEIDELIKEPSVDDYMGMIKRSPSPPEACRSQLLPDWWAQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 QPSTGVPLVTGYTTYDAHHSAFSQMVISFYYGGKLVGQATTTCPEGCRLSLSQPGLPGTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QPSTGVPLVTGYTTYDAHHSAFSQMVISFYYGGKLVGQATTTCPEGCRLSLSQPGLPGTK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 LYGPEGLELVRFPPADAIPSERQRQVTRKLFGHLERGVLLHSSRQGVFVKRLCQGRVFCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LYGPEGLELVRFPPADAIPSERQRQVTRKLFGHLERGVLLHSSRQGVFVKRLCQGRVFCS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 GNAVVCKGRPNKLERDEVVQVFDTSQFFRELQQFYNSQGRLPDGRVVLCFGEEFPDMAPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GNAVVCKGRPNKLERDEVVQVFDTSQFFRELQQFYNSQGRLPDGRVVLCFGEEFPDMAPL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 RSKLILVQIEQLYVRQLAEEAGKSCGAGSVMQAPEEPPPDQVFRMFPDICASHQRSFFRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RSKLILVQIEQLYVRQLAEEAGKSCGAGSVMQAPEEPPPDQVFRMFPDICASHQRSFFRE 370 380 390 400 410 420 pF1KB7 NQQITV :::::: CCDS10 NQQITV >>CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 (393 aa) initn: 728 init1: 525 opt: 678 Z-score: 802.3 bits: 157.4 E(32554): 2.3e-38 Smith-Waterman score: 739; 34.3% identity (64.9% similar) in 396 aa overlap (8-387:10-388) 10 20 30 40 50 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFK :.::.:..::..:...::. :.. :.:::::::::::::. .. ::..:: CCDS96 MASGRARCTRKLRNWVVEQVESGQFPGVCWDDTAKTMFRIPWKHAGKQDFREDQDAAFFK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 AWAVFKGKFKEGDKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVPEEEQ :::.::::.:::: . ::.:::::::::::: .:.:: .:...:..::::::...: CCDS96 AWAIFKGKYKEGDTGGPAVWKTRLRCALNKSSEFKEVPERGRMDVAEPYKVYQLLPPGIV 70 80 90 100 110 120 120 130 140 150 160 pF1KB7 KCKLGVATAGCVNEVTEMECGRSEIDELIKE----PSV-DDYMGMIKRSPSPPE------ . . :. . . . . :.: .. ... ::: .: .. ... : CCDS96 SGQPGTQKVPSKRQHSSVSSERKEEEDAMQNCTLSPSVLQDSLNNEEEGASGGAVHSDIG 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 ACRSQLLPDWWAQQPSTGVPLVTGYTTYD---AHHSAFSQMVISFYYGGKLVGQATTTCP . :. :. .: .:. . . . .: ....: :.:..::.: . CCDS96 SSSSSSSPEPQEVTDTTEAPFQGDQRSLEFLLPPEPDYS-LLLTFIYNGRVVGEAQVQSL 190 200 210 220 230 230 240 250 260 270 280 pF1KB7 EGCRLSLSQPGLPGTKLYGPEGLELVRFP-PADAIPSERQRQVTRKLFGHLERGVLLHSS . ::: ...:. :.. ..: : :: :. :..: :...::::.:. :. CCDS96 D-CRL-VAEPS--GSE----SSMEQVLFPKPGPLEPTQR-------LLSQLERGILVASN 240 250 260 270 280 290 300 310 320 330 340 pF1KB7 RQGVFVKRLCQGRV-FCSGNAVVCKGRPNKLERDEVVQVFDTSQFFRELQQFYNSQGRLP .:.::.::: . . . .: : :. : .: :..: :. : :.: ..... : : CCDS96 PRGLFVQRLCPIPISWNAPQAPPGPG-PHLLPSNECVELFRTAYFCRDLVRYFQGLGPPP 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB7 DGRVVLCFGEEFPDMAPLRSKLILVQIEQLYVRQLAEEAGKSCGAGSVMQAPEEPPPDQV .:.: : :: . ..:: :..:: ..: : :.. .. .: CCDS96 KFQVTLNFWEESHGSSHTPQNLITVKMEQAFARYLLEQTPEQQAAILSLV 350 360 370 380 390 410 420 pF1KB7 FRMFPDICASHQRSFFRENQQITV >>CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 (451 aa) initn: 1103 init1: 388 opt: 638 Z-score: 754.0 bits: 148.6 E(32554): 1.1e-35 Smith-Waterman score: 1040; 45.6% identity (63.7% similar) in 421 aa overlap (6-386:20-422) 10 20 30 40 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQ :. .::::::.::::. ::::.:::::::.::::::::::: CCDS44 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 DYNQEVDASIFKAWAVFKGKFKEG-DKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISE :::.: ::..:::::.:::::.:: :: .: ::::::::::::: ::::...:::::::. CCDS44 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD 70 80 90 100 110 120 110 120 130 140 150 pF1KB7 PYKVYRIVPEEEQKCKLGVATAGCVNEVTEMECGRSEIDELIKEPS--VDDYM------- :::::::::: .: :. . : . . :. : .:: CCDS44 PYKVYRIVPEGAKK---GAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRS 130 140 150 160 170 160 170 180 190 pF1KB7 --GMIKRSPSP--PEACRSQLLP---DW---------------WAQQP----STGVPLVT .. .: : : : . : : .: : . ::: : CCDS44 WRDYVPDQPHPEIPYQCPMTFGPRGHHWQGPACENGCQVTGTFYACAPPESQAPGVP--T 180 190 200 210 220 230 200 210 220 230 240 pF1KB7 GYTTYDAHHSAFS--QMVISFYYGGKLVGQATTTCPEGCRLSLSQPGLPGTKLYGPEGLE . .:. ::: .. : .:: :: . ::. :::::.: .. : .:. CCDS44 EPSIRSAEALAFSDCRLHICLYYREILVKELTTSSPEGCRISHGHT-------YDASNLD 240 250 260 270 280 250 260 270 280 290 300 pF1KB7 LVRFP-PADAIPSERQRQVTRKLFGHLERGVLLHSSRQGVFVKRLCQGRVFCSGNAVVCK : :: : : . ::. .::..::::::.: . .:...:::::.:.. .: ..:. CCDS44 QVLFPYPED----NGQRKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRIYWDGPLALCN 290 300 310 320 330 340 310 320 330 340 350 360 pF1KB7 GRPNKLERDEVVQVFDTSQFFRELQQFYNSQGRLPDGRVVLCFGEEFPDMAPLRS-KLIL ::::::::.. ..:::.::. ::: : . :: .:.::::::::: : :. ::: CCDS44 DRPNKLERDQTCKLFDTQQFLSELQAFAHHGRSLPRFQVTLCFGEEFPD--PQRQRKLIT 350 360 370 380 390 400 370 380 390 400 410 420 pF1KB7 VQIEQLYVRQLAEEAGKSCGAGSVMQAPEEPPPDQVFRMFPDICASHQRSFFRENQQITV ...: : .::: : .. : CCDS44 AHVEPLLARQLYYFAQQNSGHFLRGYDLPEHISNPEDYHRSIRHSSIQE 410 420 430 440 450 >>CCDS12775.1 IRF3 gene_id:3661|Hs108|chr19 (427 aa) initn: 263 init1: 196 opt: 476 Z-score: 562.5 bits: 113.1 E(32554): 5.2e-25 Smith-Waterman score: 480; 28.1% identity (54.3% similar) in 409 aa overlap (9-390:7-387) 10 20 30 40 50 60 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW :. ::. :.: .. :. : :. .. :::::::. .:: .:: : .::.:: CCDS12 MGTPKPRILPWLVSQLDLGQLEGVAWVNKSRTRFRIPWKHGLRQDAQQE-DFGIFQAW 10 20 30 40 50 70 80 90 100 110 pF1KB7 AVFKGKFKEG-DKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVPEEEQK : : . : :: . ::: .: :::.. .. . :::. : .:.:.:..: CCDS12 AEATGAYVPGRDKPDLPTWKRNFRSALNRKEGLRLAEDRSK-DPHDPHKIYEFVNS---- 60 70 80 90 100 110 120 130 140 150 160 pF1KB7 CKLGVATAGCVNEVTEMECGRSEIDELIKEPSVDDYMGMIKRSPSP----------PEAC ::. . . . . : : : .: .:. .: . .: : :: : CCDS12 ---GVGDFSQPDTSPDTNGGGSTSDT--QEDILDELLGNMVLAPLPDPGPPSLAVAPEPC 120 130 140 150 160 170 180 190 200 210 220 pF1KB7 RSQLLPDWWAQQPSTGVPLVTGYTTYDAHHSAFSQMVI---------SFYYGGKLVGQAT . : ..:: : : . . .. ...... . .: :. : : : CCDS12 PQPL------RSPSLDNP--TPFPNLGPSENPLKRLLVPGEEWEFEVTAFYRGRQVFQQT 170 180 190 200 210 230 240 250 260 270 pF1KB7 TTCPEGCRLSLSQPG---LPGTKLYGPEGLELVRFPPADAIPSERQRQVTRKLFGHLERG .:::: :: :. : ::: . :. :. .. .. . .:.... : : CCDS12 ISCPEGLRLVGSEVGDRTLPGWPVTLPD--------PGMSLTDRGVMSYVRHVLSCLGGG 220 230 240 250 260 270 280 290 300 310 320 330 pF1KB7 VLLHSSRQGVFVKRL--CQGRVFCSGNAVVCKGR-PN-KLERDEVVQVFDTSQFFRELQQ . : . : ....:: :. : . . .:. :. .. .:. ::: . :. .: CCDS12 LALWRAGQWLWAQRLGHCHTYWAVSEELLPNSGHGPDGEVPKDKEGGVFDLGPFIVDLIT 280 290 300 310 320 330 340 350 360 370 380 390 pF1KB7 FYNSQGRLPDGRVVLCFGEEFPDMAPLRSKLILVQIEQLYVRQLAEEAGKSCGAGSVMQA : ...:: : . .: :: .:. : ..:..:.. .: :.: : . ::.:. CCDS12 FTEGSGRSPRYALWFCVGESWPQDQPWTKRLVMVKVVPTCLRALVEMA-RVGGASSLENT 340 350 360 370 380 390 400 410 420 pF1KB7 PEEPPPDQVFRMFPDICASHQRSFFRENQQITV CCDS12 VDLHISNSHPLSLTSDQYKAYLQDLVEGMDFQGPGES 400 410 420 >>CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 (349 aa) initn: 403 init1: 221 opt: 398 Z-score: 471.4 bits: 96.0 E(32554): 6.2e-20 Smith-Waterman score: 398; 46.6% identity (72.4% similar) in 116 aa overlap (9-123:7-122) 10 20 30 40 50 60 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW :.: :: :::.:. ::: : :.::..:.::: ::... .. : :: .:. : CCDS38 MPVERMRMRPWLEEQINSNTIPGLKWLNKEKKIFQIPWMHAARHGWDVEKDAPLFRNW 10 20 30 40 50 70 80 90 100 110 pF1KB7 AVFKGKFKEG-DKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVPEEEQK :. :: . : :: .: :::. .:::.:. ::.::: :.: .. ..:::..: :. CCDS38 AIHTGKHQPGVDKPDPKTWKANFRCAMNSLPDIEEVKDKSIKKGNNAFRVYRMLPLSERP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 CKLGVATAGCVNEVTEMECGRSEIDELIKEPSVDDYMGMIKRSPSPPEACRSQLLPDWWA : : CCDS38 SKKGKKPKTEKEDKVKHIKQEPVESSLGLSNGVSDLSPEYAVLTSTIKNEVDSTVNIIVV 120 130 140 150 160 170 >>CCDS55681.1 IRF6 gene_id:3664|Hs108|chr1 (372 aa) initn: 323 init1: 189 opt: 396 Z-score: 468.6 bits: 95.6 E(32554): 8.8e-20 Smith-Waterman score: 408; 30.2% identity (58.5% similar) in 328 aa overlap (106-402:12-337) 80 90 100 110 120 130 pF1KB7 ATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRI--VPEEEQKCKLGVATAGCV--- : :.:.. .:. : .. ...: . CCDS55 MYDGTKEVPMNPVKIYQVCDIPQP-QGSIINPGSTGSAPWD 10 20 30 40 140 150 160 170 pF1KB7 ---NEVTEMECGRSEIDELIKEPSVDDYMGM--IKRSPSPPEA---CR-SQLLPD--WWA :.: : : ..:.:. .. ..: . . :. :: : . : .. :. : CCDS55 EKDNDVDE-EDEEDELDQSQHHVPIQDTFPFLNINGSPMAPASVGNCSVGNCSPEAVWPK 50 60 70 80 90 180 190 200 210 220 230 pF1KB7 QQP----STGVPLVTGYTTYDAHHSAF--SQMVISFYYGGKLVGQA-TTTCPEGCRLSLS .: .:. :.. . :.. ... :.: : :: ::. :.. :.:::: . CCDS55 TEPLEMEVPQAPIQPFYSSPELWISSLPMTDLDIKFQYRGKEYGQTMTVSNPQGCRLFYG 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB7 QPG-LPGTK-LYGPEGLELVRFPPADAIPSERQRQVTRKLFGHLERGVLLHSSRQGVFVK . : .: . :.:: .:: :.:: . : .:.:. : ::. ..::..:. : ..... CCDS55 DLGPMPDQEELFGPVSLEQVKFPGPEHITNEKQKLFTSKLLDVMDRGLILEVSGHAIYAI 160 170 180 190 200 210 300 310 320 330 340 pF1KB7 RLCQGRVFCSGNAVVCKGRPNKLERDEVVQVFDTSQFFRELQQFYNSQ-GRLPDGRVVLC :::: .:. :: . :: .::.. :..: :. .: ..: . : .. :: CCDS55 RLCQCKVYWSGPCAPSLVAPNLIERQKKVKLFCLETFLSDLIAHQKGQIEKQPPFEIYLC 220 230 240 250 260 270 350 360 370 380 390 400 pF1KB7 FGEEFPDMAPLRSKLILVQIEQLYVRQLAEE-AG---KSCGAGSV-MQAPEEPPPDQVFR ::::.:: ::. ::::::. . .:.. : .: .: .::: .: :.. CCDS55 FGEEWPDGKPLERKLILVQVIPVVARMIYEMFSGDFTRSFDSGSVRLQISTPDIKDNIVA 280 290 300 310 320 330 410 420 pF1KB7 MFPDICASHQRSFFRENQQITV CCDS55 QLKQLYRILQTQESWQPMQPTPSMQLPPALPPQ 340 350 360 370 >>CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 (325 aa) initn: 455 init1: 235 opt: 395 Z-score: 468.3 bits: 95.3 E(32554): 9.2e-20 Smith-Waterman score: 408; 31.6% identity (58.3% similar) in 266 aa overlap (9-243:7-270) 10 20 30 40 50 60 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW :.: :: ::.:.. ::::: :.:. .:.::::::.:. .. . :: .:..: CCDS41 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSW 10 20 30 40 50 70 80 90 100 110 pF1KB7 AVFKGKFKEGDKA-EPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVP---EE :. :..: :.: .: :::. .:::.:. ::.::: :.:. : .:::..: .. CCDS41 AIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKN 60 70 80 90 100 110 120 130 140 150 160 pF1KB7 EQKCKLGVATAGCVNEVTEMECGRSEIDEL---IKEPSVDD---------YMG--MIKRS ..: . . .. ... . :: : : . .. .. : :: .... CCDS41 QRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQDLEVEQA 120 130 140 150 160 170 170 180 190 200 210 pF1KB7 PSPPEA-CR-SQLLPDWWAQQPSTGVPLVTG--YTTYDAHHSAFSQMVISFYYGGKL--- .: . : :. :::: . : :: :. :. . . :. . . ::: CCDS41 LTPALSPCAVSSTLPDW--HIPVEVVPDSTSDLYNFQVSPMPSTSEATTDEDEEGKLPED 180 190 200 210 220 230 220 230 240 250 260 pF1KB7 ----VGQAT--TTCPEGCRLSLSQPGLPGTKLYGPEGLELVRFPPADAIPSERQRQVTRK . :. : .: :..::. :..:: CCDS41 IMKLLEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDIGLSLQRVFT 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB7 LFGHLERGVLLHSSRQGVFVKRLCQGRVFCSGNAVVCKGRPNKLERDEVVQVFDTSQFFR CCDS41 DLKNMDATWLDSLLTPVRLPSIQAIPCAP 300 310 320 >>CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 (467 aa) initn: 688 init1: 264 opt: 391 Z-score: 461.2 bits: 94.5 E(32554): 2.3e-19 Smith-Waterman score: 757; 34.5% identity (62.9% similar) in 426 aa overlap (9-402:9-432) 10 20 30 40 50 60 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW ::. ::. :.::..:::::: ..... :.:::::: ... .:: . .::::: CCDS14 MALHPRRVRLKPWLVAQVDSGLYPGLIWLHRDSKRFQIPWKHATRHSPQQEEENTIFKAW 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 AVFKGKFKEG-DKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRI--VPEEE :: ::..:: : .:: ::..:::::::: .:. . : .. .: :.:.. .:. CCDS14 AVETGKYQEGVDDPDPAKWKAQLRCALNKSREFNLMYDGTKEVPMNPVKIYQVCDIPQP- 70 80 90 100 110 120 130 140 150 160 pF1KB7 QKCKLGVATAGCV------NEVTEMECGRSEIDELIKEPSVDDYMGM--IKRSPSPPEA- : .. ...: . :.: : : ..:.:. .. ..: . . :. :: : . CCDS14 QGSIINPGSTGSAPWDEKDNDVDE-EDEEDELDQSQHHVPIQDTFPFLNINGSPMAPASV 120 130 140 150 160 170 170 180 190 200 210 pF1KB7 --CR-SQLLPD--WWAQQP----STGVPLVTGYTTYDAHHSAF--SQMVISFYYGGKLVG : .. :. : .: .:. :.. . :.. ... :.: : :: : CCDS14 GNCSVGNCSPEAVWPKTEPLEMEVPQAPIQPFYSSPELWISSLPMTDLDIKFQYRGKEYG 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB7 QA-TTTCPEGCRLSLSQPG-LPGTK-LYGPEGLELVRFPPADAIPSERQRQVTRKLFGHL :. :.. :.:::: .. : .: . :.:: .:: :.:: . : .:.:. : ::. . CCDS14 QTMTVSNPQGCRLFYGDLGPMPDQEELFGPVSLEQVKFPGPEHITNEKQKLFTSKLLDVM 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB7 ERGVLLHSSRQGVFVKRLCQGRVFCSGNAVVCKGRPNKLERDEVVQVFDTSQFFRELQQF .::..:. : ..... :::: .:. :: . :: .::.. :..: :. .: CCDS14 DRGLILEVSGHAIYAIRLCQCKVYWSGPCAPSLVAPNLIERQKKVKLFCLETFLSDLIAH 300 310 320 330 340 350 340 350 360 370 380 pF1KB7 YNSQ-GRLPDGRVVLCFGEEFPDMAPLRSKLILVQIEQLYVRQLAEE-AG---KSCGAGS ..: . : .. ::::::.:: ::. ::::::. . .:.. : .: .: .:: CCDS14 QKGQIEKQPPFEIYLCFGEEWPDGKPLERKLILVQVIPVVARMIYEMFSGDFTRSFDSGS 360 370 380 390 400 410 390 400 410 420 pF1KB7 V-MQAPEEPPPDQVFRMFPDICASHQRSFFRENQQITV : .: :.. CCDS14 VRLQISTPDIKDNIVAQLKQLYRILQTQESWQPMQPTPSMQLPPALPPQ 420 430 440 450 460 >>CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 (498 aa) initn: 675 init1: 246 opt: 390 Z-score: 459.6 bits: 94.3 E(32554): 2.8e-19 Smith-Waterman score: 711; 34.1% identity (57.7% similar) in 449 aa overlap (9-409:16-461) 10 20 30 40 50 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVD ::. ::. :..: .:::: : : ::..: :::.:: .. .:. : CCDS58 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ASIFKAWAVFKGKFKEG-DKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRI .:::::: ::. :: :.:.:: ::. :::::::: ::. . : . .:::.:.. CCDS58 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV 70 80 90 100 110 120 120 130 140 150 pF1KB7 -----VPEEEQKCKLGVATAGCVNEVTE----MECGRSEIDEL----------IKEPSVD .: . : . :: .: : : . : ... .. :... CCDS58 CSNGPAPTDSQPPEDYSFGAGEEEEEEEELQRMLPSLSLTEDVKWPPTLQPPTLRPPTLQ 130 140 150 160 170 180 160 170 180 190 pF1KB7 D-------YMGMIKRSPSP-------PEACR---SQLL-PDWW-AQQPSTGVPLVTGYTT .: .::: : . : :..: : :. : .: :. CCDS58 PPTLQPPVVLGPPAPDPSPLAPPPGNPAGFRELLSEVLEPGPLPASLPPAGEQLLPDLLI 190 200 210 220 230 240 200 210 220 230 240 250 pF1KB7 YDAHHSAFSQMVISFYYGGKLVGQATTTCPEGCRLSLSQPGLPGTK----LYGPEGLELV . : .... :.: : :. : . :.:::: :: : .:. :.:: .:: : CCDS58 -SPHMLPLTDLEIKFQYRGRPPRALTISNPHGCRLFYSQ--LEATQEQVELFGPISLEQV 250 260 270 280 290 260 270 280 290 300 pF1KB7 RFPPADAIPSERQRQVTRKLFGHLERGVLLHSSRQGVFVKRLCQGRVFCSGN-AVVCKGR ::: . :::..:: : .:. :.::..:. . : ... :::: .:: :: : . . CCDS58 RFPSPEDIPSDKQRFYTNQLLDVLDRGLILQLQGQDLYAIRLCQCKVFWSGPCASAHDSC 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB7 PNKLERDEVVQVFDTSQFFRELQQFYNSQGRLPDG-RVVLCFGEEFPDMAPLRSKLILVQ :: ..:. ...:. .:. :: : ..: : .. .:::::.:: : ..::: :: CCDS58 PNPIQREVKTKLFSLEHFLNELILFQKGQTNTPPPFEIFFCFGEEWPDRKPREKKLITVQ 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB7 IEQLYVRQLAEE-AGK-SCGAGSV-MQAPEEPPPDQVFRMFPDICASHQRSFFRENQQIT . . .: : : .:. : .: :. .: . :.. ..: .. CCDS58 VVPVAARLLLEMFSGELSWSADSIRLQISNPDLKDRMVEQFKELHHIWQSQQRLQPVAQA 420 430 440 450 460 470 pF1KB7 V CCDS58 PPGAGLGVGQGPWPMHPAGMQ 480 490 >>CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 (412 aa) initn: 675 init1: 246 opt: 384 Z-score: 453.7 bits: 93.0 E(32554): 6e-19 Smith-Waterman score: 685; 35.0% identity (56.7% similar) in 420 aa overlap (9-415:16-384) 10 20 30 40 50 pF1KB7 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVD ::. ::. :..: .:::: : : ::..: :::.:: .. .:. : CCDS56 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ASIFKAWAVFKGKFKEG-DKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRI .:::::: ::. :: :.:.:: ::. :::::::: ::. . : . .:::.:.. CCDS56 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 VPEEEQKCKLGVATAGCVNEVTEMECGRSEIDELIKEPSVDDYMGMIKRSPSPPEACRSQ : : : . : ..: : .: .. : : CCDS56 ----------------CSN-------GPAPTD---SQPPEDYSFGAGEEEEEEEELQR-- 130 140 150 180 190 200 210 220 230 pF1KB7 LLPDWWAQQPSTGVPLVTGYTTYDAHHSAFSQMVISFYYGGKLVGQATTTCPEGCRLSLS .::. . :. : . :.: : :. : . :.:::: : CCDS56 MLPS-------------LSLTVTD--------LEIKFQYRGRPPRALTISNPHGCRLFYS 160 170 180 190 240 250 260 270 280 pF1KB7 QPGLPGTK----LYGPEGLELVRFPPADAIPSERQRQVTRKLFGHLERGVLLHSSRQGVF : : .:. :.:: .:: :::: . :::..:: : .:. :.::..:. . : .. CCDS56 Q--LEATQEQVELFGPISLEQVRFPSPEDIPSDKQRFYTNQLLDVLDRGLILQLQGQDLY 200 210 220 230 240 290 300 310 320 330 340 pF1KB7 VKRLCQGRVFCSGN-AVVCKGRPNKLERDEVVQVFDTSQFFRELQQFYNSQGRLPDG-RV . :::: .:: :: : . . :: ..:. ...:. .:. :: : ..: : .. CCDS56 AIRLCQCKVFWSGPCASAHDSCPNPIQREVKTKLFSLEHFLNELILFQKGQTNTPPPFEI 250 260 270 280 290 300 350 360 370 380 390 400 pF1KB7 VLCFGEEFPDMAPLRSKLILVQIEQLYVRQLAEE-AGK-SCGAGSV-MQAPEEPPPDQVF .:::::.:: : ..::: ::. . .: : : .:. : .: :. .: . :.. CCDS56 FFCFGEEWPDRKPREKKLITVQVVPVAARLLLEMFSGELSWSADSIRLQISNPDLKDRMV 310 320 330 340 350 360 410 420 pF1KB7 RMFPD---ICASHQRSFFRENQQITV ..: . : :.:: CCDS56 EQFKELHHIWQSQQRLQPVAQAPPGAGLGVGQGPWPMHPAGMQ 370 380 390 400 410 426 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 09:14:43 2016 done: Fri Nov 4 09:14:43 2016 Total Scan time: 3.240 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]