FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9749, 559 aa 1>>>pF1KB9749 559 - 559 aa - 559 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 15.0998+/-0.00109; mu= -24.1879+/- 0.067 mean_var=527.6723+/-108.272, 0's: 0 Z-trim(117.2): 21 B-trim: 3 in 1/53 Lambda= 0.055833 statistics sampled from 17924 (17939) to 17924 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.803), E-opt: 0.2 (0.551), width: 16 Scan time: 4.040 The best scores are: opt bits E(32554) CCDS12160.1 MLLT1 gene_id:4298|Hs108|chr19 ( 559) 3736 315.1 1.4e-85 CCDS6494.1 MLLT3 gene_id:4300|Hs108|chr9 ( 568) 1805 159.6 9.4e-39 CCDS69579.1 MLLT3 gene_id:4300|Hs108|chr9 ( 565) 1799 159.1 1.3e-38 >>CCDS12160.1 MLLT1 gene_id:4298|Hs108|chr19 (559 aa) initn: 3736 init1: 3736 opt: 3736 Z-score: 1650.0 bits: 315.1 E(32554): 1.4e-85 Smith-Waterman score: 3736; 100.0% identity (100.0% similar) in 559 aa overlap (1-559:1-559) 10 20 30 40 50 60 pF1KB9 MDNQCTVQVRLELGHRAQLRKKPTTEGFTHDWMVFVRGPEQCDIQHFVEKVVFWLHDSFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MDNQCTVQVRLELGHRAQLRKKPTTEGFTHDWMVFVRGPEQCDIQHFVEKVVFWLHDSFP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 KPRRVCKEPPYKVEESGYAGFIMPIEVHFKNKEEPRKVCFTYDLFLNLEGNPPVNHLRCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KPRRVCKEPPYKVEESGYAGFIMPIEVHFKNKEEPRKVCFTYDLFLNLEGNPPVNHLRCE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 KLTFNNPTTEFRYKLLRAGGVMVMPEGADTVSRPSPDYPMLPTIPLSAFSDPKKTKPSHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KLTFNNPTTEFRYKLLRAGGVMVMPEGADTVSRPSPDYPMLPTIPLSAFSDPKKTKPSHG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 SKDANKESSKTSKPHKVTKEHRERPRKDSESKSSSKELEREQAKSSKDTSRKLGEGRLPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SKDANKESSKTSKPHKVTKEHRERPRKDSESKSSSKELEREQAKSSKDTSRKLGEGRLPK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 EEKAPPPKAAFKEPKMALKETKLESTSPKGGPPPPPPPPPRASSKRPATADSPKPSAKKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EEKAPPPKAAFKEPKMALKETKLESTSPKGGPPPPPPPPPRASSKRPATADSPKPSAKKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 KKSSSKGSRSAPGTSPRTSSSSSFSDKKPAKDKSSTRGEKVKAESEPREAKKALEVEESN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KKSSSKGSRSAPGTSPRTSSSSSFSDKKPAKDKSSTRGEKVKAESEPREAKKALEVEESN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 SEDEASFKSESAQSSPSNSSSSSDSSSDSDFEPSQNHSQGPLRSMVEDLQSEESDEDDSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SEDEASFKSESAQSSPSNSSSSSDSSSDSDFEPSQNHSQGPLRSMVEDLQSEESDEDDSS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 SGEEAAGKTNPGRDSRLSFSDSESDNSADSSLPSREPPPPQKPPPPNSKVSGRRSPESCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SGEEAAGKTNPGRDSRLSFSDSESDNSADSSLPSREPPPPQKPPPPNSKVSGRRSPESCS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 KPEKILKKGTYDKAYTDELVELHRRLMALRERNVLQQIVNLIEETGHFNVTNTTFDFDLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KPEKILKKGTYDKAYTDELVELHRRLMALRERNVLQQIVNLIEETGHFNVTNTTFDFDLF 490 500 510 520 530 540 550 pF1KB9 SLDETTVRKLQSCLEAVAT ::::::::::::::::::: CCDS12 SLDETTVRKLQSCLEAVAT 550 >>CCDS6494.1 MLLT3 gene_id:4300|Hs108|chr9 (568 aa) initn: 1407 init1: 844 opt: 1805 Z-score: 809.3 bits: 159.6 E(32554): 9.4e-39 Smith-Waterman score: 1806; 54.5% identity (74.5% similar) in 580 aa overlap (1-559:1-567) 10 20 30 40 50 60 pF1KB9 MDNQCTVQVRLELGHRAQLRKKPTTEGFTHDWMVFVRGPEQCDIQHFVEKVVFWLHDSFP : ..:.:::.::::::::.:::::.:::::::::::::::. .:::::::::: ::.::: CCDS64 MASSCAVQVKLELGHRAQVRKKPTVEGFTHDWMVFVRGPEHSNIQHFVEKVVFHLHESFP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 KPRRVCKEPPYKVEESGYAGFIMPIEVHFKNKEEPRKVCFTYDLFLNLEGNPPVNHLRCE .:.::::.::::::::::::::.::::.:::::::::: : :::::.:::.::::::::: CCDS64 RPKRVCKDPPYKVEESGYAGFILPIEVYFKNKEEPRKVRFDYDLFLHLEGHPPVNHLRCE 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 KLTFNNPTTEFRYKLLRAGG--VMVMPEGADTVSRPSPDYPMLPTIPLSAFSDPKKTKPS :::::::: .:: :::.::: . .... : : . . :. :. .... : CCDS64 KLTFNNPTEDFRRKLLKAGGDPNRSIHTSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB9 HGSKDANKESSKTSKPHKVTKEHRERPRKDS-ESKSSSKELEREQAKSSKDTSRKLGEGR .:..... :.. :::::. :::.:.: ::: : ::. :: :.. ::::..:.: :.. CCDS64 SSSSSSSSSSTSFSKPHKLMKEHKEKPSKDSREHKSAFKEPSRDHNKSSKESSKKPKENK 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB9 LPKEEKAPPPKAAFKEPKMALKETKLEST--SPKGGPPPPPPPPPRASSKRPATADSPKP :::: : : :::::: :: : .:. . .: : :::: .:: . CCDS64 PLKEEKIVP-KMAFKEPKPMSKEPKPDSNLLTITSGQDKKAP------SKRPPISDSEEL 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 SAKKQKKSSSKGSRSAPGTSPRTSSSSSFSDKKPAKDKSSTRGEKVKAESEPREAKKA-- ::::.:::::.. .. ...: . : .::: :::: .. ::: ::: : ::. CCDS64 SAKKRKKSSSEALFKSFSSAPPLILTCS-ADKKQIKDKSHVKMGKVKIESETSEKKKSTL 300 310 320 330 340 350 360 370 380 390 400 pF1KB9 ------LEVEESNSEDEASFKSESAQSSPSNSSSSSDSSSDSDFEPSQNHSQGPLRSMVE .. ..:. :.. : ::.: : ::..:::::.:: : :::...::::::... CCDS64 PPFDDIVDPNDSDVEENISSKSDSEQPSPASSSSSSSSS----FTPSQTRQQGPLRSIMK 360 370 380 390 400 410 420 430 440 450 pF1KB9 DLQS----EESDE-DDSSSGEEAAGKTNPG--RDSRLSFSD-SESDNSADSSLPSREPPP ::.: ::::: .:... : .: : :. :.:.:: :.:..:. :: .:::: CCDS64 DLHSDDNEEESDEVEDNDNDSEMERPVNRGGSRSRRVSLSDGSDSESSSASSPLHHEPPP 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB9 PQKPPPPNSKVSGRRSPESCSKPEKILKKGTYDKAYTDELVELHRRLMALRERNVLQQIV : :... .:: . :: .: .:.: :::: :::::::::::.::::..::::: CCDS64 PLLKTN-NNQILEVKSPIKQSKSDKQIKNGECDKAYLDELVELHRRLMTLRERHILQQIV 470 480 490 500 510 520 520 530 540 550 pF1KB9 NLIEETGHFNVTNTTFDFDLFSLDETTVRKLQSCLEAVAT :::::::::..::::::::: :::.:::::::: ::. .: CCDS64 NLIEETGHFHITNTTFDFDLCSLDKTTVRKLQSYLETSGTS 530 540 550 560 >>CCDS69579.1 MLLT3 gene_id:4300|Hs108|chr9 (565 aa) initn: 1401 init1: 838 opt: 1799 Z-score: 806.7 bits: 159.1 E(32554): 1.3e-38 Smith-Waterman score: 1800; 54.7% identity (74.5% similar) in 576 aa overlap (5-559:2-564) 10 20 30 40 50 60 pF1KB9 MDNQCTVQVRLELGHRAQLRKKPTTEGFTHDWMVFVRGPEQCDIQHFVEKVVFWLHDSFP :.:::.::::::::.:::::.:::::::::::::::. .:::::::::: ::.::: CCDS69 MCAVQVKLELGHRAQVRKKPTVEGFTHDWMVFVRGPEHSNIQHFVEKVVFHLHESFP 10 20 30 40 50 70 80 90 100 110 120 pF1KB9 KPRRVCKEPPYKVEESGYAGFIMPIEVHFKNKEEPRKVCFTYDLFLNLEGNPPVNHLRCE .:.::::.::::::::::::::.::::.:::::::::: : :::::.:::.::::::::: CCDS69 RPKRVCKDPPYKVEESGYAGFILPIEVYFKNKEEPRKVRFDYDLFLHLEGHPPVNHLRCE 60 70 80 90 100 110 130 140 150 160 170 pF1KB9 KLTFNNPTTEFRYKLLRAGG--VMVMPEGADTVSRPSPDYPMLPTIPLSAFSDPKKTKPS :::::::: .:: :::.::: . .... : : . . :. :. .... : CCDS69 KLTFNNPTEDFRRKLLKAGGDPNRSIHTSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 HGSKDANKESSKTSKPHKVTKEHRERPRKDS-ESKSSSKELEREQAKSSKDTSRKLGEGR .:..... :.. :::::. :::.:.: ::: : ::. :: :.. ::::..:.: :.. CCDS69 SSSSSSSSSSTSFSKPHKLMKEHKEKPSKDSREHKSAFKEPSRDHNKSSKESSKKPKENK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 LPKEEKAPPPKAAFKEPKMALKETKLEST--SPKGGPPPPPPPPPRASSKRPATADSPKP :::: : : :::::: :: : .:. . .: : :::: .:: . CCDS69 PLKEEKIVP-KMAFKEPKPMSKEPKPDSNLLTITSGQDKKAP------SKRPPISDSEEL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 SAKKQKKSSSKGSRSAPGTSPRTSSSSSFSDKKPAKDKSSTRGEKVKAESEPREAKKA-- ::::.:::::.. .. ...: . : .::: :::: .. ::: ::: : ::. CCDS69 SAKKRKKSSSEALFKSFSSAPPLILTCS-ADKKQIKDKSHVKMGKVKIESETSEKKKSTL 300 310 320 330 340 360 370 380 390 400 pF1KB9 ------LEVEESNSEDEASFKSESAQSSPSNSSSSSDSSSDSDFEPSQNHSQGPLRSMVE .. ..:. :.. : ::.: : ::..:::::.:: : :::...::::::... CCDS69 PPFDDIVDPNDSDVEENISSKSDSEQPSPASSSSSSSSS----FTPSQTRQQGPLRSIMK 350 360 370 380 390 400 410 420 430 440 450 pF1KB9 DLQS----EESDE-DDSSSGEEAAGKTNPG--RDSRLSFSD-SESDNSADSSLPSREPPP ::.: ::::: .:... : .: : :. :.:.:: :.:..:. :: .:::: CCDS69 DLHSDDNEEESDEVEDNDNDSEMERPVNRGGSRSRRVSLSDGSDSESSSASSPLHHEPPP 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB9 PQKPPPPNSKVSGRRSPESCSKPEKILKKGTYDKAYTDELVELHRRLMALRERNVLQQIV : :... .:: . :: .: .:.: :::: :::::::::::.::::..::::: CCDS69 PLLKTN-NNQILEVKSPIKQSKSDKQIKNGECDKAYLDELVELHRRLMTLRERHILQQIV 470 480 490 500 510 520 520 530 540 550 pF1KB9 NLIEETGHFNVTNTTFDFDLFSLDETTVRKLQSCLEAVAT :::::::::..::::::::: :::.:::::::: ::. .: CCDS69 NLIEETGHFHITNTTFDFDLCSLDKTTVRKLQSYLETSGTS 530 540 550 560 559 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:40:59 2016 done: Fri Nov 4 18:41:00 2016 Total Scan time: 4.040 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]