FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9782, 209 aa 1>>>pF1KB9782 209 - 209 aa - 209 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5882+/-0.000321; mu= 8.7458+/- 0.020 mean_var=118.3953+/-23.906, 0's: 0 Z-trim(119.1): 46 B-trim: 1845 in 1/51 Lambda= 0.117871 statistics sampled from 32706 (32754) to 32706 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.384), width: 16 Scan time: 6.610 The best scores are: opt bits E(85289) NP_001189442 (OMIM: 600021) max dimerization prote ( 220) 623 116.1 4.4e-26 NP_002348 (OMIM: 600021) max dimerization protein ( 221) 621 115.8 5.5e-26 NP_005953 (OMIM: 176807,600020) max-interacting pr ( 228) 529 100.1 2.9e-21 NP_569157 (OMIM: 176807,600020) max-interacting pr ( 295) 529 100.2 3.6e-21 NP_001008541 (OMIM: 176807,600020) max-interacting ( 182) 470 90.0 2.6e-18 NP_001136407 (OMIM: 609450) max dimerization prote ( 193) 455 87.5 1.6e-17 NP_112590 (OMIM: 609450) max dimerization protein ( 206) 454 87.4 1.9e-17 NP_001189443 (OMIM: 600021) max dimerization prote ( 211) 439 84.8 1.1e-16 >>NP_001189442 (OMIM: 600021) max dimerization protein 1 (220 aa) initn: 606 init1: 495 opt: 623 Z-score: 589.3 bits: 116.1 E(85289): 4.4e-26 Smith-Waterman score: 623; 53.5% identity (80.0% similar) in 200 aa overlap (5-196:8-200) 10 20 30 40 50 pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF---DGDFAREKTKAAGLVRKAPNN .. .:::::.:::::.:::::::::.::. : : ....:. .. .. NP_001 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSK---KNNSSS 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 RSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALS ::.:::.::.:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:. NP_001 RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVH 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 IKEQLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE--VDIEGMEFGPGE .:::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. :. NP_001 QIDQLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREIDVDVESTDYLTGD 120 130 140 150 160 170 180 190 200 pF1KB9 LD-SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS :: : .: ::.:.. :.:: :.: :. NP_001 LDWSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL 180 190 200 210 220 >>NP_002348 (OMIM: 600021) max dimerization protein 1 is (221 aa) initn: 559 init1: 519 opt: 621 Z-score: 587.5 bits: 115.8 E(85289): 5.5e-26 Smith-Waterman score: 621; 53.2% identity (79.6% similar) in 201 aa overlap (5-196:8-201) 10 20 30 40 50 pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF---DGDFAREKTKAAGLVRKAPNN .. .:::::.:::::.:::::::::.::. : : ....:. .. .. NP_002 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSK---KNNSSS 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 RSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALS ::.:::.::.:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:. NP_002 RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVH 60 70 80 90 100 110 120 130 140 150 160 pF1KB9 IKEQLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPG .:::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. : NP_002 QIDQLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTG 120 130 140 150 160 170 170 180 190 200 pF1KB9 ELD-SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS .:: : .: ::.:.. :.:: :.: :. NP_002 DLDWSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL 180 190 200 210 220 >>NP_005953 (OMIM: 176807,600020) max-interacting protei (228 aa) initn: 626 init1: 346 opt: 529 Z-score: 502.7 bits: 100.1 E(85289): 2.9e-21 Smith-Waterman score: 614; 51.4% identity (73.4% similar) in 214 aa overlap (9-203:12-224) 10 20 30 40 pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGD-----------FAREKTKAAG ::::::.::::.:: :::::: .: . ..: . ...: NP_005 MERVKMINVQRLLEAAEFLERRERECEHGYASSFPSMPSPRLQHSKPPRRLSRAQKHSSG 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB9 LVRKAPNNRSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLE . :::.::::::.:::.::: ::.:: :.::::: ::::::.::..::.:::::: NP_005 SSNTSTANRSTHNELEKNRRAHLRLCLERLKVLIPLGPDCTRHTTLGLLNKAKAHIKKLE 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB9 EQDRRALSIKEQLQQEHRFLKRRLEQLS-VQSVERVRTDSTGSAVSTD--DSEQE---VD : .:.. :.:..:.:::: :::::. : .::.: :: ::..:.: :::.: :: NP_005 EAERKSQHQLENLEREQRFLKWRLEQLQGPQEMERIRMDSIGSTISSDRSDSEREEIEVD 130 140 150 160 170 180 170 180 190 200 pF1KB9 IEGMEFGPGELDSVGSSS--DADDHYSLQSGTGGDSGFGPHCRRLGRPALS .:. ::. ::.:.....: : ::: :: : :.: :.. .: NP_005 VESTEFSHGEVDNISTTSISDIDDHSSLPS-IGSDEGYSSASVKLSFTS 190 200 210 220 >>NP_569157 (OMIM: 176807,600020) max-interacting protei (295 aa) initn: 615 init1: 346 opt: 529 Z-score: 501.2 bits: 100.2 E(85289): 3.6e-21 Smith-Waterman score: 585; 48.4% identity (72.2% similar) in 223 aa overlap (3-203:70-291) 10 20 pF1KB9 MELNSLLILLEAAEYLE---RRDREAEHGYAS :... :::::: ::: ..... :::::: NP_569 EDPAGAKPRCPFSDIFNTSENSMEKHINTFLQNVQILLEAASYLEQIEKENKKCEHGYAS 40 50 60 70 80 90 30 40 50 60 70 pF1KB9 VLPFDGD-----------FAREKTKAAGLVRKAPNNRSSHNELEKHRRAKLRLYLEQLKQ .: . ..: . ...: . :::.::::::.:::.::: ::.:: NP_569 SFPSMPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRSTHNELEKNRRAHLRLCLERLKV 100 110 120 130 140 150 80 90 100 110 120 130 pF1KB9 LVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQQEHRFLKRRLEQLS-VQS :.::::: ::::::.::..::.::::::: .:.. :.:..:.:::: :::::. : NP_569 LIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGPQE 160 170 180 190 200 210 140 150 160 170 180 190 pF1KB9 VERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELDSVGSSS--DADDHYSLQSGT .::.: :: ::..:.: :::.: ::.:. ::. ::.:.....: : ::: :: : NP_569 MERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPS-I 220 230 240 250 260 270 200 pF1KB9 GGDSGFGPHCRRLGRPALS :.: :.. .: NP_569 GSDEGYSSASVKLSFTS 280 290 >>NP_001008541 (OMIM: 176807,600020) max-interacting pro (182 aa) initn: 468 init1: 285 opt: 470 Z-score: 449.9 bits: 90.0 E(85289): 2.6e-18 Smith-Waterman score: 470; 50.9% identity (73.9% similar) in 165 aa overlap (47-203:15-178) 20 30 40 50 60 70 pF1KB9 ERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSSHNELEKHRRAKLRLYLEQL : : .. .: : .:::.::: ::.: NP_001 MPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRRAHLRLCLERL 10 20 30 40 80 90 100 110 120 130 pF1KB9 KQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKEQLQQEHRFLKRRLEQLS-V : :.::::: ::::::.::..::.::::::: .:.. :.:..:.:::: :::::. NP_001 KVLIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGP 50 60 70 80 90 100 140 150 160 170 180 pF1KB9 QSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELDSVGSSS--DADDHYSLQS : .::.: :: ::..:.: :::.: ::.:. ::. ::.:.....: : ::: :: : NP_001 QEMERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPS 110 120 130 140 150 160 190 200 pF1KB9 GTGGDSGFGPHCRRLGRPALS :.: :.. .: NP_001 -IGSDEGYSSASVKLSFTS 170 180 >>NP_001136407 (OMIM: 609450) max dimerization protein 3 (193 aa) initn: 418 init1: 304 opt: 455 Z-score: 435.7 bits: 87.5 E(85289): 1.6e-17 Smith-Waterman score: 455; 42.6% identity (73.9% similar) in 188 aa overlap (4-184:6-193) 10 20 30 40 50 pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF--DGDFAREKTKAAGLVRKAPNNRS ... .::.:::.::::.:::::::::. : : . :.: . ..:: NP_001 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPHRSPGPIHRRKKRPPQAPGAQDSGRS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 SHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIK ::::::.:::.:. ::.::: .::: : .:.::::::.::..::.:::.:..:: ..: NP_001 VHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRARQLK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB9 EQLQQEHRFLKRRLEQL----SVQSVERVRTDSTGSA-VSTDDSEQEVDIEGMEFGPGEL :.:..... :.:.:::: .. ::.:.:: :. .:.. :... . . . : . NP_001 ERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQVLPNENGGTPNH 130 140 150 160 170 180 180 190 200 pF1KB9 DSVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS .: ... ..:. NP_001 RPTGRGNNISSHH 190 >>NP_112590 (OMIM: 609450) max dimerization protein 3 is (206 aa) initn: 462 init1: 304 opt: 454 Z-score: 434.4 bits: 87.4 E(85289): 1.9e-17 Smith-Waterman score: 484; 45.5% identity (73.5% similar) in 200 aa overlap (4-191:6-203) 10 20 30 40 50 pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPF--DGDFAREKTKAAGLVRKAPNNRS ... .::.:::.::::.:::::::::. : : . :.: . ..:: NP_112 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPHRSPGPIHRRKKRPPQAPGAQDSGRS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 SHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIK ::::::.:::.:. ::.::: .::: : .:.::::::.::..::.:::.:..:: ..: NP_112 VHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRARQLK 70 80 90 100 110 120 120 130 140 150 160 pF1KB9 EQLQQEHRFLKRRLEQL----SVQSVERVRTDSTGSA-VSTD--DSEQE---VDIEGMEF :.:..... :.:.:::: .. ::.:.:: :. .:.. ::.:: ::.:.. : NP_112 ERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQEELEVDVESLVF 130 140 150 160 170 180 170 180 190 200 pF1KB9 GPGELDSVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS : :: . . . ...: : . : : NP_112 G-GEAELLRGFVAGQEH-SYSHGGGAWL 190 200 >>NP_001189443 (OMIM: 600021) max dimerization protein 1 (211 aa) initn: 512 init1: 338 opt: 439 Z-score: 420.5 bits: 84.8 E(85289): 1.1e-16 Smith-Waterman score: 562; 52.5% identity (75.8% similar) in 198 aa overlap (5-196:8-191) 10 20 30 40 50 pF1KB9 MELNSLLILLEAAEYLERRDREAEHGYASVLPFDGDFAREKTKAAGLVRKAPNNRSS .. .:::::.:::::.:::::::::.::... :. : . .: :: :: NP_001 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNK-DRDALKRRNKSKK--NNSSS 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 HNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALSIKE :::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:. . NP_001 -------RRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 QLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPGELD :::.:.: :::.::.: ..::.: :: ::.::.. ::..: ::.:. .. :.:: NP_001 QLQREQRHLKRQLEKL---GIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLD 120 130 140 150 160 180 190 200 pF1KB9 -SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS : .: ::.:.. :.:: :.: :. NP_001 WSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL 170 180 190 200 210 209 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:53:53 2016 done: Fri Nov 4 18:53:54 2016 Total Scan time: 6.610 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]