FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4822, 451 aa 1>>>pF1KB4822 451 - 451 aa - 451 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9161+/-0.000867; mu= 16.4904+/- 0.052 mean_var=115.7686+/-22.708, 0's: 0 Z-trim(110.8): 28 B-trim: 0 in 0/52 Lambda= 0.119201 statistics sampled from 11856 (11881) to 11856 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.735), E-opt: 0.2 (0.365), width: 16 Scan time: 3.210 The best scores are: opt bits E(32554) CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 ( 451) 3222 565.0 5.7e-161 CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 ( 467) 667 125.6 1.1e-28 CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 ( 426) 638 120.6 3.2e-27 CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 ( 393) 525 101.1 2.1e-21 CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 ( 498) 421 83.3 6.1e-16 CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 ( 349) 406 80.6 2.8e-15 CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 ( 325) 382 76.4 4.7e-14 CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 ( 412) 378 75.8 9e-14 CCDS43645.1 IRF5 gene_id:3663|Hs108|chr7 ( 514) 378 75.9 1.1e-13 CCDS55681.1 IRF6 gene_id:3664|Hs108|chr1 ( 372) 353 71.5 1.6e-12 CCDS56099.1 IRF3 gene_id:3661|Hs108|chr19 ( 300) 347 70.4 2.9e-12 CCDS12775.1 IRF3 gene_id:3661|Hs108|chr19 ( 427) 347 70.5 3.7e-12 CCDS59409.1 IRF3 gene_id:3661|Hs108|chr19 ( 452) 347 70.5 3.9e-12 >>CCDS4469.1 IRF4 gene_id:3662|Hs108|chr6 (451 aa) initn: 3222 init1: 3222 opt: 3222 Z-score: 3003.5 bits: 565.0 E(32554): 5.7e-161 Smith-Waterman score: 3222; 100.0% identity (100.0% similar) in 451 aa overlap (1-451:1-451) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 PYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWRD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 YVPDQPHPEIPYQCPMTFGPRGHHWQGPACENGCQVTGTFYACAPPESQAPGVPTEPSIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YVPDQPHPEIPYQCPMTFGPRGHHWQGPACENGCQVTGTFYACAPPESQAPGVPTEPSIR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 SAEALAFSDCRLHICLYYREILVKELTTSSPEGCRISHGHTYDASNLDQVLFPYPEDNGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SAEALAFSDCRLHICLYYREILVKELTTSSPEGCRISHGHTYDASNLDQVLFPYPEDNGQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 RKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRIYWDGPLALCNDRPNKLERDQTCKLFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRIYWDGPLALCNDRPNKLERDQTCKLFD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 TQQFLSELQAFAHHGRSLPRFQVTLCFGEEFPDPQRQRKLITAHVEPLLARQLYYFAQQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TQQFLSELQAFAHHGRSLPRFQVTLCFGEEFPDPQRQRKLITAHVEPLLARQLYYFAQQN 370 380 390 400 410 420 430 440 450 pF1KB4 SGHFLRGYDLPEHISNPEDYHRSIRHSSIQE ::::::::::::::::::::::::::::::: CCDS44 SGHFLRGYDLPEHISNPEDYHRSIRHSSIQE 430 440 450 >>CCDS1492.1 IRF6 gene_id:3664|Hs108|chr1 (467 aa) initn: 675 init1: 397 opt: 667 Z-score: 628.6 bits: 125.6 E(32554): 1.1e-28 Smith-Waterman score: 803; 33.9% identity (60.9% similar) in 445 aa overlap (23-438:9-427) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ .:. ::. :.::: ::::.: ..... :.:::::: .. CCDS14 MALHPRRVRLKPWLVAQVDSGLYPGLIWLHRDSKRFQIPWKHATRH 10 20 30 40 70 80 90 100 110 120 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD . ..::. ..:::::. ::..::.: ::: ::..:::::::: .:. . . .. . CCDS14 SPQQEEENTIFKAWAVETGKYQEGVDDPDPAKWKAQLRCALNKSREFNLMYDGTKEVPMN 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB4 PYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWRD : :.:.. . .:: :. .: . : : .. : .:. .. CCDS14 PVKIYQVC-----------DIPQPQGSIINPGST----GSAPWDEKDN----DVDEEDEE 110 120 130 140 190 200 210 220 230 pF1KB4 YVPDQPHPEIPYQCPMTFGPRGHHWQGPA----CENG-CQVTGTFYACAPPESQAPGVPT :: . ..: : . : . ..:: : : :. ... : : ..: .: CCDS14 DELDQSQHHVPIQDTFPFLNINGSPMAPASVGNCSVGNCSPEAVWPKTEPLEMEVPQAPI 150 160 170 180 190 200 240 250 260 270 280 pF1KB4 EPSIRSAE----ALAFSDCRLHICLYYR-EILVKELTTSSPEGCRISHG---------HT .: : : .: ..: : : . :: . . .:.:.:.:::. .: . CCDS14 QPFYSSPELWISSLPMTD--LDIKFQYRGKEYGQTMTVSNPQGCRLFYGDLGPMPDQEEL 210 220 230 240 250 260 290 300 310 320 330 pF1KB4 YDASNLDQVLFPYPE---DNGQRKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRIYWDG . .:.:: :: :: .. :. :::. ..::..: .. ..:: :::: ..::.: CCDS14 FGPVSLEQVKFPGPEHITNEKQKLFTSKLLDVMDRGLILEVSGHAIYAIRLCQCKVYWSG 270 280 290 300 310 320 340 350 360 370 380 390 pF1KB4 PLALCNDRPNKLERDQTCKLFDTQQFLSELQAFAHHGRSL---PRFQVTLCFGEEFPDPQ : : :: .::.. ::: . :::.: .::. .. : :.. ::::::.:: . CCDS14 PCAPSLVAPNLIERQKKVKLFCLETFLSDL--IAHQKGQIEKQPPFEIYLCFGEEWPDGK 330 340 350 360 370 380 400 410 420 430 440 450 pF1KB4 R-QRKLITAHVEPLLARQLYYFAQQNSGHFLRGYD---LPEHISNPEDYHRSIRHSSIQE .:::: ..: :..::..: .. :: : :..: . .::.:. CCDS14 PLERKLILVQVIPVVARMIY---EMFSGDFTRSFDSGSVRLQISTPDIKDNIVAQLKQLY 390 400 410 420 430 440 CCDS14 RILQTQESWQPMQPTPSMQLPPALPPQ 450 460 >>CCDS10956.1 IRF8 gene_id:3394|Hs108|chr16 (426 aa) initn: 1103 init1: 388 opt: 638 Z-score: 602.2 bits: 120.6 E(32554): 3.2e-27 Smith-Waterman score: 1040; 45.6% identity (63.7% similar) in 421 aa overlap (20-422:6-386) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ :. .::::::.::::. ::::.:::::::.::::::::::: CCDS10 MCDRNGGRRLRQWLIEQIDSSMYPGLIWENEEKSMFRIPWKHAGKQ 10 20 30 40 70 80 90 100 110 120 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD :::.: ::..:::::.:::::.:: :: .: ::::::::::::: ::::...:::::::. CCDS10 DYNQEVDASIFKAWAVFKGKFKEG-DKAEPATWKTRLRCALNKSPDFEEVTDRSQLDISE 50 60 70 80 90 100 130 140 150 160 170 pF1KB4 PYKVYRIVPEGAKK---GAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRS :::::::::: .: :. . : . . :. : .:: CCDS10 PYKVYRIVPEEEQKCKLGVATAGCVNEVTEMECGRSEIDELIKEPS--VDDYM------- 110 120 130 140 150 180 190 200 210 220 230 pF1KB4 WRDYVPDQPHPEIPYQCPMTFGPRGHHWQGPACENGCQVTGTFYACAPPESQAPGVP--T .. .: : : : . : : .: : . ::: : CCDS10 --GMIKRSPSP--PEACRSQLLP---DW---------------WAQQP----STGVPLVT 160 170 180 190 240 250 260 270 280 pF1KB4 EPSIRSAEALAFSDCRLHICLYYREILVKELTTSSPEGCRISHGHT-------YDASNLD . .:. ::: .. : .:: :: . ::. :::::.: .. : .:. CCDS10 GYTTYDAHHSAFS--QMVISFYYGGKLVGQATTTCPEGCRLSLSQPGLPGTKLYGPEGLE 200 210 220 230 240 290 300 310 320 330 340 pF1KB4 QVLFPYPED----NGQRKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRIYWDGPLALCN : :: : : . ::. .::..::::::.: . .:...:::::.:.. .: ..:. CCDS10 LVRFP-PADAIPSERQRQVTRKLFGHLERGVLLHSSRQGVFVKRLCQGRVFCSGNAVVCK 250 260 270 280 290 300 350 360 370 380 390 400 pF1KB4 DRPNKLERDQTCKLFDTQQFLSELQAFAHHGRSLPRFQVTLCFGEEFPD--PQRQRKLIT ::::::::.. ..:::.::. ::: : . :: .:.::::::::: : :. ::: CCDS10 GRPNKLERDEVVQVFDTSQFFRELQQFYNSQGRLPDGRVVLCFGEEFPDMAPLRS-KLIL 310 320 330 340 350 360 410 420 430 440 450 pF1KB4 AHVEPLLARQLYYFAQQNSGHFLRGYDLPEHISNPEDYHRSIRHSSIQE ...: : .::: : .. : CCDS10 VQIEQLYVRQLAEEAGKSCGAGSVMQAPEEPPPDQVFRMFPDICASHQRSFFRENQQITV 370 380 390 400 410 420 >>CCDS9615.1 IRF9 gene_id:10379|Hs108|chr14 (393 aa) initn: 741 init1: 328 opt: 525 Z-score: 497.6 bits: 101.1 E(32554): 2.1e-21 Smith-Waterman score: 738; 34.4% identity (61.3% similar) in 395 aa overlap (23-413:11-378) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ :::.:...:..::..::. :.. :..::::::::::: CCDS96 MASGRARCTRKLRNWVVEQVESGQFPGVCWDDTAKTMFRIPWKHAGKQ 10 20 30 40 70 80 90 100 110 120 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD :. ...:::.:::::.::::..:: : : .::::::::::::..:.:. ::...:... CCDS96 DFREDQDAAFFKAWAIFKGKYKEG-DTGGPAVWKTRLRCALNKSSEFKEVPERGRMDVAE 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB4 PYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWRD :::::...: : .: .: :. ..:... :. . . .: CCDS96 PYKVYQLLPPGIVSG--------------QPGTQ-----KVPSKRQHSSVSSE-RKEEED 110 120 130 140 190 200 210 220 230 pF1KB4 YVPDQPHPEIPYQCPMTFGPRGHHWQGPACENGCQVTGTFYACAPPE-SQAPGVPTEPSI . . : .. .: .: : .. ... . : : ... .: . . CCDS96 AMQNCTLSPSVLQDSLNNEEEGA--SGGAVHSDIGSSSSSSSPEPQEVTDTTEAPFQGDQ 150 160 170 180 190 200 240 250 260 270 280 290 pF1KB4 RSAEAL--AFSDCRLHICLYYREILVKELTTSSPEGCRISHGHTYDASNLDQVLFPYPED :: : : : : . . : .: : ..: . ::. . . :...::::: : CCDS96 RSLEFLLPPEPDYSLLLTFIYNGRVVGEAQVQSLD-CRLVAEPSGSESSMEQVLFPKP-- 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB4 NGQRKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRIYWDGPLALCNDRPNKLERDQTCK : . ..:::.::::... : ::...::: : :..: : . :. : .. . CCDS96 -GPLEPTQRLLSQLERGILVASNPRGLFVQRLCPIPISWNAPQAPPGPGPHLLPSNECVE 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB4 LFDTQQFLSELQAFAHHGRSLPRFQVTLCFGEE-FPDPQRQRKLITAHVEPLLARQLYYF :: : : .: . . :.::::: : :: . . ..:::...: .:: : CCDS96 LFRTAYFCRDLVRYFQGLGPPPKFQVTLNFWEESHGSSHTPQNLITVKMEQAFARYLLEQ 330 340 350 360 370 380 420 430 440 450 pF1KB4 AQQNSGHFLRGYDLPEHISNPEDYHRSIRHSSIQE CCDS96 TPEQQAAILSLV 390 >>CCDS5808.1 IRF5 gene_id:3663|Hs108|chr7 (498 aa) initn: 730 init1: 377 opt: 421 Z-score: 399.7 bits: 83.3 E(32554): 6.1e-16 Smith-Waterman score: 767; 33.5% identity (56.4% similar) in 454 aa overlap (23-446:16-457) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ .:. ::. :..: .:::: : : ::..: :::.:: .. CCDS58 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRH 10 20 30 40 50 70 80 90 100 110 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDIS- ... : ..::::: ::. ::.:. :: ::. :::::::: ::. :. . :. CCDS58 GPSQDGDNTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFR-LIYDGPRDMPP 60 70 80 90 100 110 120 130 140 150 160 pF1KB4 DPYKVYRIV-----------PEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHN .:::.:.. :: . :: . :. ... : : . : CCDS58 QPYKIYEVCSNGPAPTDSQPPEDYSFGAGEEEEEEEELQRMLPSLSLTEDVKWPPTLQPP 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB4 YMMPPLDRSWRDYVPDQPHPEIPYQCPMTFGPRGHHWQGPACENGCQVTGTFYACAPP-- . :: . : : : :.. : :. . : . : :: CCDS58 TLRPPTLQPPTLQPPVVLGPPAPDPSPLA-PPPGNPAGFRELLSEVLEPGPLPASLPPAG 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB4 ESQAPGVPTEPSIRSAEALAFSDCRLHICLYYREILVKELTTSSPEGCRISHGHT----- :. : . : . : ..: :.: . :: . :: :.:.:::. ... CCDS58 EQLLPDLLISPHM-----LPLTD--LEIKFQYRGRPPRALTISNPHGCRLFYSQLEATQE 240 250 260 270 280 290 300 310 320 330 pF1KB4 ----YDASNLDQVLFPYPED---NGQRKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRI . .:.:: :: ::: . :: ..::. :.::..: . . ::: :::: .. CCDS58 QVELFGPISLEQVRFPSPEDIPSDKQRFYTNQLLDVLDRGLILQLQGQDLYAIRLCQCKV 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB4 YWDGPLALCNDR-PNKLERDQTCKLFDTQQFLSELQAFAH-HGRSLPRFQVTLCFGEEFP .:.:: : .: :: ..:. :::. ..::.:: : . . . : :.. .:::::.: CCDS58 FWSGPCASAHDSCPNPIQREVKTKLFSLEHFLNELILFQKGQTNTPPPFEIFFCFGEEWP 350 360 370 380 390 400 400 410 420 430 440 450 pF1KB4 DPQ-RQRKLITAHVEPLLARQLYYFAQQNSGHFLRGYD-LPEHISNPEDYHRSIRHSSIQ : . :..::::..: :. :: : .. ::.. . : . .::::. : ... CCDS58 DRKPREKKLITVQVVPVAARLLL---EMFSGELSWSADSIRLQISNPDLKDRMVEQFKEL 410 420 430 440 450 460 pF1KB4 E CCDS58 HHIWQSQQRLQPVAQAPPGAGLGVGQGPWPMHPAGMQ 470 480 490 >>CCDS3835.1 IRF2 gene_id:3660|Hs108|chr4 (349 aa) initn: 398 init1: 398 opt: 406 Z-score: 387.7 bits: 80.6 E(32554): 2.8e-15 Smith-Waterman score: 406; 43.3% identity (73.2% similar) in 127 aa overlap (23-146:7-133) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ ..: :: .::.:. ::: : :.::.::.::: ::... CCDS38 MPVERMRMRPWLEEQINSNTIPGLKWLNKEKKIFQIPWMHAARH 10 20 30 40 70 80 90 100 110 120 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD .. :.:: ::. ::. :: . :.::::: :::. .:::.:. :.::. ..: .. CCDS38 GWDVEKDAPLFRNWAIHTGKHQPGVDKPDPKTWKANFRCAMNSLPDIEEVKDKSIKKGNN 50 60 70 80 90 100 130 140 150 160 170 pF1KB4 PYKVYRIVP---EGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRS ..:::..: . .::: : : .. .. CCDS38 AFRVYRMLPLSERPSKKGKKPKTEKEDKVKHIKQEPVESSLGLSNGVSDLSPEYAVLTST 110 120 130 140 150 160 >>CCDS4155.1 IRF1 gene_id:3659|Hs108|chr5 (325 aa) initn: 406 init1: 382 opt: 382 Z-score: 365.8 bits: 76.4 E(32554): 4.7e-14 Smith-Waterman score: 382; 43.1% identity (75.9% similar) in 116 aa overlap (23-138:7-122) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ ..: :: ::.:.. :::.: :.:. ::.::::::.:. CCDS41 MPITRMRMRPWLEMQINSNQIPGLIWINKEEMIFQIPWKHAAKH 10 20 30 40 70 80 90 100 110 120 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDISD .. ..:: ::..::. :... : .::: :::. .:::.:. :.::. ..:. :. CCDS41 GWDINKDACLFRSWAIHTGRYKAGEKEPDPKTWKANFRCAMNSLPDIEEVKDQSRNKGSS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB4 PYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWRD .:::..: .:. :. CCDS41 AVRVYRMLPPLTKNQRKERKSKSSRDAKSKAKRKSCGDSSPDTFSDGLSSSTLPDDHSSY 110 120 130 140 150 160 >>CCDS56512.1 IRF5 gene_id:3663|Hs108|chr7 (412 aa) initn: 730 init1: 377 opt: 378 Z-score: 360.7 bits: 75.8 E(32554): 9e-14 Smith-Waterman score: 642; 32.4% identity (54.2% similar) in 441 aa overlap (23-446:16-371) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ .:. ::. :..: .:::: : : ::..: :::.:: .. CCDS56 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRH 10 20 30 40 50 70 80 90 100 110 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDIS- ... : ..::::: ::. ::.:. :: ::. :::::::: ::. :. . :. CCDS56 GPSQDGDNTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFR-LIYDGPRDMPP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB4 DPYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTPYPSLPAQQVHNYMMPPLDRSWR .:::.:.. .: : :. .: :: : : CCDS56 QPYKIYEVCSNG-------------------------PAPT-DSQ-------PPEDYS-- 120 130 180 190 200 210 220 230 pF1KB4 DYVPDQPHPEIPYQCPMTFGPRGHHWQGPACENGCQVTGTFYACAPPESQAPGVPTEPSI :: : :. .. . ::. CCDS56 ------------------FGA------GEEEEEEEELQRML----------------PSL 140 150 240 250 260 270 280 290 pF1KB4 RSAEALAFSDCRLHICLYYREILVKELTTSSPEGCRISHGHT---------YDASNLDQV .:. .: :.: . :: . :: :.:.:::. ... . .:.:: CCDS56 ----SLTVTD--LEIKFQYRGRPPRALTISNPHGCRLFYSQLEATQEQVELFGPISLEQV 160 170 180 190 200 210 300 310 320 330 340 pF1KB4 LFPYPED---NGQRKNIEKLLSHLERGVVLWMAPDGLYAKRLCQSRIYWDGPLALCNDR- :: ::: . :: ..::. :.::..: . . ::: :::: ...:.:: : .: CCDS56 RFPSPEDIPSDKQRFYTNQLLDVLDRGLILQLQGQDLYAIRLCQCKVFWSGPCASAHDSC 220 230 240 250 260 270 350 360 370 380 390 400 pF1KB4 PNKLERDQTCKLFDTQQFLSELQAFAH-HGRSLPRFQVTLCFGEEFPDPQ-RQRKLITAH :: ..:. :::. ..::.:: : . . . : :.. .:::::.:: . :..::::.. CCDS56 PNPIQREVKTKLFSLEHFLNELILFQKGQTNTPPPFEIFFCFGEEWPDRKPREKKLITVQ 280 290 300 310 320 330 410 420 430 440 450 pF1KB4 VEPLLARQLYYFAQQNSGHFLRGYD-LPEHISNPEDYHRSIRHSSIQE : :. :: : .. ::.. . : . .::::. : ... CCDS56 VVPVAARLLL---EMFSGELSWSADSIRLQISNPDLKDRMVEQFKELHHIWQSQQRLQPV 340 350 360 370 380 CCDS56 AQAPPGAGLGVGQGPWPMHPAGMQ 390 400 410 >>CCDS43645.1 IRF5 gene_id:3663|Hs108|chr7 (514 aa) initn: 730 init1: 377 opt: 378 Z-score: 359.5 bits: 75.9 E(32554): 1.1e-13 Smith-Waterman score: 761; 33.7% identity (58.4% similar) in 466 aa overlap (23-446:16-473) 10 20 30 40 50 60 pF1KB4 MNLEGGGRGGEFGMSAVSCGNGKLRQWLIDQIDSGKYPGLVWENEEKSIFRIPWKHAGKQ .:. ::. :..: .:::: : : ::..: :::.:: .. CCDS43 MNQSIPVAPTPPRRVRLKPWLVAQVNSCQYPGLQWVNGEKKLFCIPWRHATRH 10 20 30 40 50 70 80 90 100 110 pF1KB4 DYNREEDAALFKAWALFKGKFREGIDKPDPPTWKTRLRCALNKSNDFEELVERSQLDIS- ... : ..::::: ::. ::.:. :: ::. :::::::: ::. :. . :. CCDS43 GPSQDGDNTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFR-LIYDGPRDMPP 60 70 80 90 100 110 120 130 140 150 160 pF1KB4 DPYKVYRIV-----------PEGAKKGAKQLTLEDPQMSMSHP-YTMTTPYPSLPAQQVH .:::.:.. :: . :: . :. ... : ..: : : .. CCDS43 QPYKIYEVCSNGPAPTDSQPPEDYSFGAGEEEEEEEELQRMLPSLSLTDAVQSGP--HMT 120 130 140 150 160 170 170 180 190 200 210 pF1KB4 NYMMPPLDRSWRDYV-PDQPHP---EIP-YQCPMTFGPRGHHWQG----PACENGC-QVT : . : .: . : .: . : : :...:: . . :. : .. CCDS43 PYSLLKEDVKWPPTLQPPTLRPPTLQPPTLQPPVVLGPPAPDPSPLAPPPGNPAGFRELL 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB4 GTFYACAP-PESQAP-GVPTEPSIR-SAEALAFSDCRLHICLYYREILVKELTTSSPEGC . .: : : : : :.. : . : ..: :.: . :: . :: :.:.:: CCDS43 SEVLEPGPLPASLPPAGEQLLPDLLISPHMLPLTD--LEIKFQYRGRPPRALTISNPHGC 240 250 260 270 280 280 290 300 310 320 pF1KB4 RISHGHT---------YDASNLDQVLFPYPED---NGQRKNIEKLLSHLERGVVLWMAPD :. ... . .:.:: :: ::: . :: ..::. :.::..: . . CCDS43 RLFYSQLEATQEQVELFGPISLEQVRFPSPEDIPSDKQRFYTNQLLDVLDRGLILQLQGQ 290 300 310 320 330 340 330 340 350 360 370 380 pF1KB4 GLYAKRLCQSRIYWDGPLALCNDR-PNKLERDQTCKLFDTQQFLSELQAFAH-HGRSLPR ::: :::: ...:.:: : .: :: ..:. :::. ..::.:: : . . . : CCDS43 DLYAIRLCQCKVFWSGPCASAHDSCPNPIQREVKTKLFSLEHFLNELILFQKGQTNTPPP 350 360 370 380 390 400 390 400 410 420 430 pF1KB4 FQVTLCFGEEFPDPQ-RQRKLITAHVEPLLARQLYYFAQQNSGHFLRGYD-LPEHISNPE :.. .:::::.:: . :..::::..: :. :: : .. ::.. . : . .::::. CCDS43 FEIFFCFGEEWPDRKPREKKLITVQVVPVAARLLL---EMFSGELSWSADSIRLQISNPD 410 420 430 440 450 460 440 450 pF1KB4 DYHRSIRHSSIQE : ... CCDS43 LKDRMVEQFKELHHIWQSQQRLQPVAQAPPGAGLGVGQGPWPMHPAGMQ 470 480 490 500 510 >>CCDS55681.1 IRF6 gene_id:3664|Hs108|chr1 (372 aa) initn: 338 init1: 188 opt: 353 Z-score: 338.1 bits: 71.5 E(32554): 1.6e-12 Smith-Waterman score: 446; 31.3% identity (56.9% similar) in 339 aa overlap (128-438:8-332) 100 110 120 130 140 150 pF1KB4 RCALNKSNDFEELVERSQLDISDPYKVYRIVPEGAKKGAKQLTLEDPQMSMSHPYTMTTP :: . : . . .:: :. .: . CCDS55 MYDGTKEVPMNPVKIYQVCDIPQPQGSIINPGSTG-- 10 20 30 160 170 180 190 200 210 pF1KB4 YPSLPAQQVHNYMMPPLDRSWRDYVPDQPHPEIPYQCPMTFGPRGHHWQGPA----CENG : : .. : .:. .. :: . ..: : . : . ..:: : : CCDS55 --SAPWDEKDN----DVDEEDEEDELDQSQHHVPIQDTFPFLNINGSPMAPASVGNCSVG 40 50 60 70 80 220 230 240 250 260 pF1KB4 -CQVTGTFYACAPPESQAPGVPTEPSIRSAE----ALAFSDCRLHICLYYR-EILVKELT :. ... : : ..: .: .: : : .: ..: : : . :: . . .: CCDS55 NCSPEAVWPKTEPLEMEVPQAPIQPFYSSPELWISSLPMTD--LDIKFQYRGKEYGQTMT 90 100 110 120 130 140 270 280 290 300 310 pF1KB4 TSSPEGCRISHG---------HTYDASNLDQVLFPYPE---DNGQRKNIEKLLSHLERGV .:.:.:::. .: . . .:.:: :: :: .. :. :::. ..::. CCDS55 VSNPQGCRLFYGDLGPMPDQEELFGPVSLEQVKFPGPEHITNEKQKLFTSKLLDVMDRGL 150 160 170 180 190 200 320 330 340 350 360 370 pF1KB4 VLWMAPDGLYAKRLCQSRIYWDGPLALCNDRPNKLERDQTCKLFDTQQFLSELQAFAHHG .: .. ..:: :::: ..::.:: : :: .::.. ::: . :::.: : ..: CCDS55 ILEVSGHAIYAIRLCQCKVYWSGPCAPSLVAPNLIERQKKVKLFCLETFLSDLIAH-QKG 210 220 230 240 250 260 380 390 400 410 420 pF1KB4 R--SLPRFQVTLCFGEEFPDPQR-QRKLITAHVEPLLARQLYYFAQQNSGHFLRGYD--- . . : :.. ::::::.:: . .:::: ..: :..::..: .. :: : :..: CCDS55 QIEKQPPFEIYLCFGEEWPDGKPLERKLILVQVIPVVARMIY---EMFSGDFTRSFDSGS 270 280 290 300 310 320 430 440 450 pF1KB4 LPEHISNPEDYHRSIRHSSIQE . .::.:. CCDS55 VRLQISTPDIKDNIVAQLKQLYRILQTQESWQPMQPTPSMQLPPALPPQ 330 340 350 360 370 451 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 03:15:27 2016 done: Fri Nov 4 03:15:27 2016 Total Scan time: 3.210 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]