FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7986, 325 aa 1>>>pF1KB7986 325 - 325 aa - 325 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0419+/-0.000794; mu= 7.9806+/- 0.048 mean_var=109.5141+/-21.509, 0's: 0 Z-trim(111.2): 18 B-trim: 0 in 0/51 Lambda= 0.122557 statistics sampled from 12196 (12214) to 12196 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.753), E-opt: 0.2 (0.375), width: 16 Scan time: 2.860 The best scores are: opt bits E(32554) CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 ( 325) 2245 407.3 8.6e-114 CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 ( 349) 722 138.0 1.1e-32 CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 ( 426) 395 80.2 3.2e-15 CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 ( 451) 382 77.9 1.7e-14 CCDS43645.1 IRF5 gene_id:3663|Hs108|chr7 ( 514) 382 78.0 1.9e-14 CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 ( 412) 377 77.0 2.8e-14 CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 ( 498) 377 77.1 3.3e-14 CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 ( 467) 360 74.0 2.5e-13 CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 ( 393) 350 72.2 7.4e-13 >>CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 (325 aa) initn: 2245 init1: 2245 opt: 2245 Z-score: 2156.4 bits: 407.3 E(32554): 8.6e-114 Smith-Waterman score: 2245; 100.0% identity (100.0% similar) in 325 aa overlap (1-325:1-325) 10 20 30 40 50 60 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSWAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSWAI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 HTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKNQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 HTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKNQR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQDLEVEQALT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 KERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQDLEVEQALT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 PALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTSEATTDEDEEGKLPEDIMKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTSEATTDEDEEGKLPEDIMKL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 LEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDIGLSLQRVFTDLKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDIGLSLQRVFTDLKN 250 260 270 280 290 300 310 320 pF1KB7 MDATWLDSLLTPVRLPSIQAIPCAP ::::::::::::::::::::::::: CCDS41 MDATWLDSLLTPVRLPSIQAIPCAP 310 320 >>CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 (349 aa) initn: 718 init1: 675 opt: 722 Z-score: 700.5 bits: 138.0 E(32554): 1.1e-32 Smith-Waterman score: 760; 46.7% identity (67.6% similar) in 272 aa overlap (1-259:1-265) 10 20 30 40 50 60 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSWAI ::. ::::::::: ::::: :::: :.:::. :::::: :::.::::..::: :::.::: CCDS38 MPVERMRMRPWLEEQINSNTIPGLKWLNKEKKIFQIPWMHAARHGWDVEKDAPLFRNWAI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 HTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKNQR :::... : .:::::::::::::::::::::::::.: .::..: ::::::: . .. CCDS38 HTGKHQPGVDKPDPKTWKANFRCAMNSLPDIEEVKDKSIKKGNNAFRVYRMLPLSERPSK 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 KERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYT------VPGYMQDLE : .: :. .. : : .. .:: .:.:.:. : ... : : . .. . CCDS38 KGKKPKTEKEDKVKHIKQEPVESSLG-LSNGVSD--LSPEYAVLTSTIKNEVDSTVNIIV 130 140 150 160 170 180 190 200 210 220 pF1KB7 VEQA-LTPALSPCAVSSTLPDWHIPVEVV------PDSTSDLYNFQVSPMPSTSEATTDE : :. : . . .. :: :::. : : :.:: .:.::. : .:. : . CCDS38 VGQSHLDSNIENQEIVTNPPDICQVVEVTTESDEQPVSMSELYPLQISPVSSYAESETTD 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB7 DEEGKLPEDIMKLLEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDI . .: : . . .:. :..:: :: : CCDS38 S----VPSDEESAEGRPHWRKRNIEGKQYLSNMGTRGSYLLPGMASFVTSNKPDLQVTIK 240 250 260 270 280 290 290 300 310 320 pF1KB7 GLSLQRVFTDLKNMDATWLDSLLTPVRLPSIQAIPCAP CCDS38 EESNPVPYNSSWPPFQDLPLSSSMTPASSSSRPDRETRASVIKKTSDITQARVKSC 300 310 320 330 340 >>CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 (426 aa) initn: 455 init1: 235 opt: 395 Z-score: 386.7 bits: 80.2 E(32554): 3.2e-15 Smith-Waterman score: 408; 31.2% identity (57.5% similar) in 266 aa overlap (7-270:9-243) 10 20 30 40 50 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSW :.: :: ::.:.. ::::: :.:. .:.::::::.:. .. . :: .:..: CCDS10 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQDYNQEVDASIFKAW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 AIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKN :. :..: :.: .: :::. .:::.:. ::.::: :.:. : .:::..: .. CCDS10 AVFKGKFKEGDKA-EPATWKTRLRCALNKSPDFEEVTDRSQLDISEPYKVYRIVP---EE 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 QRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQDLEVEQA ..: . . .. ... . :: : : . .. .. : :: .... CCDS10 EQKCKLGVATAGCVNEVTEMECGRSEIDEL---IKEPSVDD---------YMG--MIKRS 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 LTPALSPCAVSSTLPDW--HIPVEVVPDSTSDLYNFQVSPMPSTSEATTDEDEEGKLPED .: : :. :::: . : :: :. :. . . :. . . ::: CCDS10 PSPP-EACR-SQLLPDWWAQQPSTGVPLVTG--YTTYDAHHSAFSQMVISFYYGGKLV-- 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 IMKLLEQSEWQPTNVDGKGYLLNEPGVQPTSVYGDFSCKEEPEIDSPGGDIGLSLQRVFT .. : .: :..::. :..:: CCDS10 -------GQATTTCPEGCRLSLSQPGLPGTKLYGPEGLELVRFPPADAIPSERQRQVTRK 220 230 240 250 260 300 310 320 pF1KB7 DLKNMDATWLDSLLTPVRLPSIQAIPCAP CCDS10 LFGHLERGVLLHSSRQGVFVKRLCQGRVFCSGNAVVCKGRPNKLERDEVVQVFDTSQFFR 270 280 290 300 310 320 >>CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 (451 aa) initn: 406 init1: 382 opt: 382 Z-score: 373.9 bits: 77.9 E(32554): 1.7e-14 Smith-Waterman score: 382; 43.1% identity (75.9% similar) in 116 aa overlap (7-122:23-138) 10 20 30 40 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKH ..: :: ::.:.. :::.: :.:. ::.::::::.:. CCDS44 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 GWDINKDACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSS .. ..:: ::..::. :... : .::: :::. .:::.:. :.::. ..:. :. CCDS44 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 AVRVYRMLPPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSY .:::..: .:. :. CCDS44 PYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWRD 130 140 150 160 170 180 >>CCDS43645.1 IRF5 gene_id:3663|Hs108|chr7 (514 aa) initn: 376 init1: 324 opt: 382 Z-score: 373.0 bits: 78.0 E(32554): 1.9e-14 Smith-Waterman score: 385; 28.7% identity (52.5% similar) in 341 aa overlap (2-322:11-322) 10 20 30 40 50 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKD : :.:..::: :.:: : ::: :.: :. .: :::.::..:: . . : CCDS43 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRM .:..:: .::.: : : :: ::::.:::.:. :.. . : :. . ..:.. CCDS43 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV 70 80 90 100 110 120 120 130 140 150 160 pF1KB7 LPPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSS--YTVPGY .: :. .: . : .. . . .. : : .: : .: . .: CCDS43 ----CSNGPAPTDSQPPEDYSFGAGEE---EEEEEELQRMLPSLSLTDAVQSGPHMTPYS 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 M--QDLEVEQALTP-ALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTS----E . .:.. .: : .: : ... : . :: . : . . ..: :.. : CCDS43 LLKEDVKWPPTLQPPTLRPPTLQP--PTLQPPVVLGPPAPDP---SPLAPPPGNPAGFRE 180 190 200 210 220 230 240 250 260 270 pF1KB7 ATTDEDEEGKLPEDIMKLLEQSEWQPTNVDGKGYLLNEPGVQP-TSVYGDFSCKEEPE-- .. : : :: .. :: : :: : . : :.. :. . .: CCDS43 LLSEVLEPGPLPASLPPAGEQ--LLPD-------LLISPHMLPLTDLEIKFQYRGRPPRA 230 240 250 260 270 280 290 300 310 320 pF1KB7 --IDSPGGDIGLSLQRVFTDLKNMDATWLD-SLLTP-----VRLPSIQAIPCAP :..: : :.: ....:: . :. : ::.:: . :: CCDS43 LTISNPHG------CRLF--YSQLEATQEQVELFGPISLEQVRFPSPEDIPSDKQRFYTN 280 290 300 310 320 330 CCDS43 QLLDVLDRGLILQLQGQDLYAIRLCQCKVFWSGPCASAHDSCPNPIQREVKTKLFSLEHF 340 350 360 370 380 390 >>CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 (412 aa) initn: 374 init1: 324 opt: 377 Z-score: 369.8 bits: 77.0 E(32554): 2.8e-14 Smith-Waterman score: 377; 40.9% identity (64.6% similar) in 127 aa overlap (2-125:11-137) 10 20 30 40 50 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKD : :.:..::: :.:: : ::: :.: :. .: :::.::..:: . . : CCDS56 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRM .:..:: .::.: : : :: ::::.:::.:. :.. . : :. . ..:.. CCDS56 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV 70 80 90 100 110 120 120 130 140 150 160 pF1KB7 L---PPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPG : : .: : : CCDS56 CSNGPAPTDSQPPEDYSFGAGEEEEEEEELQRMLPSLSLTVTDLEIKFQYRGRPPRALTI 130 140 150 160 170 180 >>CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 (498 aa) initn: 427 init1: 375 opt: 377 Z-score: 368.5 bits: 77.1 E(32554): 3.3e-14 Smith-Waterman score: 377; 40.9% identity (64.6% similar) in 127 aa overlap (2-125:11-137) 10 20 30 40 50 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKD : :.:..::: :.:: : ::: :.: :. .: :::.::..:: . . : CCDS58 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRHGPSQDGD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRM .:..:: .::.: : : :: ::::.:::.:. :.. . : :. . ..:.. CCDS58 NTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFRLIYDGPRDMPPQPYKIYEV 70 80 90 100 110 120 120 130 140 150 160 pF1KB7 L---PPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPG : : .: : : CCDS58 CSNGPAPTDSQPPEDYSFGAGEEEEEEEELQRMLPSLSLTEDVKWPPTLQPPTLRPPTLQ 130 140 150 160 170 180 >>CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 (467 aa) initn: 366 init1: 315 opt: 360 Z-score: 352.7 bits: 74.0 E(32554): 2.5e-13 Smith-Waterman score: 372; 28.1% identity (56.0% similar) in 352 aa overlap (5-325:7-329) 10 20 30 40 50 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFRSW :.:..::: :..:. :::::.... ::::::::..:. . ... .:..: CCDS14 MALHPRRVRLKPWLVAQVDSGLYPGLIWLHRDSKRFQIPWKHATRHSPQQEEENTIFKAW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 AIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPPLTKN :..::.:. : .::: :::..:::.:. ... . : ... . :..:.. . . CCDS14 AVETGKYQEGVDDPDPAKWKAQLRCALNKSREFNLMYDGTKEVPMNPVKIYQVCD-IPQP 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 QRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSYTVPGYMQD----LE : . . :. .: : . : . . : : :.:.. :: .:: :. CCDS14 QGSIINPGSTGSAPWDEKDN---DVDEEDEEDEL-------DQSQHHVP--IQDTFPFLN 120 130 140 150 160 180 190 200 210 220 pF1KB7 VEQA-LTPA-LSPCAVSSTLPD--WHI--PVEV-VPDSTSDLYNFQVSP-MPSTSEATTD .. . ..:: .. :.:.. :. : :.:. ::.. . : :: . .: :: CCDS14 INGSPMAPASVGNCSVGNCSPEAVWPKTEPLEMEVPQAP--IQPFYSSPELWISSLPMTD 170 180 190 200 210 220 230 240 250 260 270 280 pF1KB7 ED----EEGKLPEDIMKLLEQSEWQPTNVDGKGYLLNEPGVQPTS--VYGDFSCKEEPEI : .:: . : . .: .: . .. : .: . ..: : .. . CCDS14 LDIKFQYRGKEYGQTMTV--------SNPQGCRLFYGDLGPMPDQEELFGPVSLEQ---V 230 240 250 260 270 290 300 310 320 pF1KB7 DSPGGD-IGLSLQRVFTDLKNMDATWLD-SLLTPVRLPSIQAI-----------PCAP :: . : :..::. : .:. .: .:. : .: :: :::: CCDS14 KFPGPEHITNEKQKLFTS-KLLDV--MDRGLILEVSGHAIYAIRLCQCKVYWSGPCAPSL 280 290 300 310 320 330 CCDS14 VAPNLIERQKKVKLFCLETFLSDLIAHQKGQIEKQPPFEIYLCFGEEWPDGKPLERKLIL 340 350 360 370 380 390 >>CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 (393 aa) initn: 306 init1: 177 opt: 350 Z-score: 344.3 bits: 72.2 E(32554): 7.4e-13 Smith-Waterman score: 350; 34.0% identity (69.9% similar) in 156 aa overlap (7-154:11-165) 10 20 30 40 50 pF1KB7 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKHGWDINKDACLFR ..: :. :..:.:.::. : . . .:.::::::.:. . ..:: .:. CCDS96 MASGRARCTRKLRNWVVEQVESGQFPGVCWDDTAKTMFRIPWKHAGKQDFREDQDAAFFK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 SWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSSAVRVYRMLPP-L .::: :.:: :. : .::. .:::.:. ...:: ...: . .::..::: . CCDS96 AWAIFKGKYKEGDT-GGPAVWKTRLRCALNKSSEFKEVPERGRMDVAEPYKVYQLLPPGI 70 80 90 100 110 120 130 140 150 160 pF1KB7 TKNQRKERKSKSSRDAKS-KAKRKSCGDS------SPDTFSDGLSSSTLPDDHSSYTVPG ...: .: :.:. .: ...:: :. ::....:.:.. CCDS96 VSGQPGTQKVPSKRQHSSVSSERKEEEDAMQNCTLSPSVLQDSLNNEEEGASGGAVHSDI 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 YMQDLEVEQALTPALSPCAVSSTLPDWHIPVEVVPDSTSDLYNFQVSPMPSTSEATTDED CCDS96 GSSSSSSSPEPQEVTDTTEAPFQGDQRSLEFLLPPEPDYSLLLTFIYNGRVVGEAQVQSL 180 190 200 210 220 230 325 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 14:51:22 2016 done: Sat Nov 5 14:51:22 2016 Total Scan time: 2.860 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]