FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3497, 1437 aa 1>>>pF1KB3497 1437 - 1437 aa - 1437 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.7389+/-0.00106; mu= 4.8861+/- 0.065 mean_var=256.7960+/-50.397, 0's: 0 Z-trim(112.2): 65 B-trim: 6 in 1/52 Lambda= 0.080035 statistics sampled from 12925 (12977) to 12925 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.719), E-opt: 0.2 (0.399), width: 16 Scan time: 4.700 The best scores are: opt bits E(32554) CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437) 9958 1164.2 0 CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 ( 645) 4086 485.9 1.6e-136 CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365) 2691 325.1 8.7e-88 CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427) 2608 315.7 1e-84 CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696) 2608 315.7 1.1e-84 CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564) 672 92.2 2.1e-17 CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964) 658 90.6 7.4e-17 CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 ( 629) 560 78.8 5.6e-14 CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 ( 647) 560 78.8 5.7e-14 >>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437 aa) initn: 9958 init1: 9958 opt: 9958 Z-score: 6224.0 bits: 1164.2 E(32554): 0 Smith-Waterman score: 9958; 100.0% identity (100.0% similar) in 1437 aa overlap (1-1437:1-1437) 10 20 30 40 50 60 pF1KB3 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB3 LQVGFGKQVDSPSATADADVSDVQSMDSSLSRRGTGMSKKDTVCQICESSGDSLIPCEGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LQVGFGKQVDSPSATADADVSDVQSMDSSLSRRGTGMSKKDTVCQICESSGDSLIPCEGE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB3 CCKHFHLECLGLASLPDSKFICMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CCKHFHLECLGLASLPDSKFICMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB3 KFPTAIFESKGFRCPQHCCSACSMEKDIHKASKGRMMRCLRCPVAYHSGDACIAAGSMLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KFPTAIFESKGFRCPQHCCSACSMEKDIHKASKGRMMRCLRCPVAYHSGDACIAAGSMLV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB3 SSYILICSNHSKRSSNSSAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SSYILICSNHSKRSSNSSAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB3 LMKLPMIPSSSASKKKCEKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LMKLPMIPSSSASKKKCEKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHY 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB3 KQIVWVKLGNYRWWPAEICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KQIVWVKLGNYRWWPAEICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYV 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB3 EGDKSFAEGQTSINKTFKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EGDKSFAEGQTSINKTFKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANK 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB3 VIGKVQIQVADLSEIPRCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VIGKVQIQVADLSEIPRCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFT 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB3 KRLYPDAEIIKTERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KRLYPDAEIIKTERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFY 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB3 MLTVTKDRIIDAGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MLTVTKDRIIDAGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFN 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB3 YNLDCLGNGRTECHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 YNLDCLGNGRTECHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMH 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB3 EDYCFQCGDGGELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EDYCFQCGDGGELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEF 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 pF1KB3 CPHSFCKDHEKGALVPSALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 CPHSFCKDHEKGALVPSALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE 1390 1400 1410 1420 1430 >>CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 (645 aa) initn: 4188 init1: 4086 opt: 4086 Z-score: 2564.6 bits: 485.9 E(32554): 1.6e-136 Smith-Waterman score: 4086; 99.5% identity (100.0% similar) in 622 aa overlap (1-622:1-622) 10 20 30 40 50 60 pF1KB3 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD :::::::::::::::::::... CCDS61 KEQVETVPQATVKTGLQKGSADRGVQGSVRFSDSSVSAAIEETVD 610 620 630 640 >>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365 aa) initn: 3744 init1: 1867 opt: 2691 Z-score: 1689.5 bits: 325.1 E(32554): 8.7e-88 Smith-Waterman score: 4037; 46.6% identity (69.3% similar) in 1354 aa overlap (98-1409:66-1327) 70 80 90 100 110 120 pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H :: :. : :.: . :.. : .: : CCDS33 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA . . : ..: .. : :.:::::::::::: .::. :::::.::: .:. CCDS33 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE ::.. .: :.. ...::.: :.:: . . . .... :.: . CCDS33 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI 160 170 180 190 200 250 260 270 280 290 300 pF1KB3 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN :. :: : . . .:..:::::::::. :::::::::.:: :. .::.. CCDS33 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK 210 220 230 240 250 310 320 330 340 350 pF1KB3 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP ..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. :: CCDS33 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB3 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT . ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . . CCDS33 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM 320 330 340 350 360 370 420 430 440 450 460 470 pF1KB3 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA . .: . .:.: .:. : ::. . .::: : : . ::: CCDS33 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA 380 390 400 410 420 480 490 500 510 520 530 pF1KB3 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G : :... . .: .... . . ... :: : :. : : CCDS33 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQ-------KHRDEVVAEHPDASG 430 440 450 460 470 480 540 550 560 570 580 pF1KB3 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK .. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .: CCDS33 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED 490 500 510 520 530 590 600 610 620 630 pF1KB3 S-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKPLK . .: .:.:... .. .:. . :..:. : .....::.::::: CCDS33 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK 540 550 560 570 580 590 640 650 660 670 680 690 pF1KB3 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQ-VDSPSATADADVSDVQSMDSSL ::.:::: . . . ...: : : .... . : . .:: .:: ..: :..:. CCDS33 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEV-SVSSKK 600 610 620 630 640 650 700 710 720 730 740 750 pF1KB3 SRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQH :.::. .::. :::.::. : ::. ::: :: ::: ::::. :...: : :: .: : CCDS33 SERGV-TAKKEYVCQLCEKPG-SLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIH 660 670 680 690 700 710 760 770 780 790 800 pF1KB3 PCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSACSMEKDIH- :: :: : ::::: : ::::::::::.:.: ..:::.::::: : : .: . . CCDS33 SCFVCKESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNP 720 730 740 750 760 770 810 820 830 840 850 860 pF1KB3 KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH---SKRSSNSSAVNVGFCF . :::.::::.::::::::::::.::: ...: .::. : : . . . :::..:: CCDS33 RPSKGKMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCF 780 790 800 810 820 830 870 880 890 900 910 920 pF1KB3 VCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKCEKGGRLLCC ::. ::: :::: CCDS33 VCS-------------------------------------------------KGGSLLCC 840 930 940 950 960 970 980 pF1KB3 ESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAEICNPRSVPL :::::.:::.::.::::.: : ::::.::::::...:.:::::::::::::.:.:..:: CCDS33 ESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPP 850 860 870 880 890 900 990 1000 1010 1020 1030 1040 pF1KB3 NIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDK-SFAEGQTSINKTFKKALEEAA ::: .::..:.::::::::.::::.::.:::::.:::. : .: .:...::.::.:: CCDS33 NIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAE 910 920 930 940 950 960 1050 1060 1070 1080 1090 1100 pF1KB3 KRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADE ::.:.: :::..:. : : ::::::::::.:: ::::: .::.::::.:::::.:: CCDS33 ARFREIKLQREARETQESE---RKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDE 970 980 990 1000 1010 1020 1110 1120 1130 1140 1150 1160 pF1KB3 NPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSI ::::..::::::::..::::::::::. ::::::::: ::...::::. .:::: .::.: CCDS33 NPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDI 1030 1040 1050 1060 1070 1080 1170 1180 1190 1200 1210 1220 pF1KB3 KKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHS .:::::::::::::::::: :::.::::..:.:::::. :::::::::::::::::::: CCDS33 RKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHS 1090 1100 1110 1120 1130 1140 1230 1240 1250 1260 1270 1280 pF1KB3 CNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLG :.::::: :::::::.::::::.:::::: ::::::::::::: .: :.:::.::::::: CCDS33 CQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLG 1150 1160 1170 1180 1190 1200 1290 1300 1310 1320 1330 1340 pF1KB3 VRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAY :::.. . ..:::.:..: : .::. : : :.. :: ::.:::::.::.::.: : ::: CCDS33 DRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAY 1210 1220 1230 1240 1250 1260 1350 1360 1370 1380 1390 1400 pF1KB3 HLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVPSALEGRLCC :: ::.: . :.::::::::.:: :.. ..:::..::.::::.:. :. . .:: : CCDS33 HLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYC 1270 1280 1290 1300 1310 1320 1410 1420 1430 pF1KB3 SEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE ::: CCDS33 CEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK 1330 1340 1350 1360 >>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427 aa) initn: 3361 init1: 1938 opt: 2608 Z-score: 1634.2 bits: 315.7 E(32554): 1e-84 Smith-Waterman score: 3268; 39.3% identity (63.3% similar) in 1427 aa overlap (39-1413:606-1941) 10 20 30 40 50 60 pF1KB3 QGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYPATTEDLPP :....: . : . : :. :.... : CCDS44 KTRDSSDIETAVVKHVLSELKELSYRSLGEDVSDSGTSKPSKPLL---FS-SASSQNHIP 580 590 600 610 620 630 70 80 90 100 110 pF1KB3 LTNGYPSSI------SVYETQTKYQSYNQYPN---GSANGFGAVRNFSPTDYYHSEIPNT . : : ......:: : : . : : . ::. . . . CCDS44 IEPDYKFSTLLMMLKDMHDSKTKEQRLMTAQNLVSYRSPGRGDCSTNSPVGVSKVLVSGG 640 650 660 670 680 690 120 130 140 150 160 170 pF1KB3 RPHEILEKPSPPQPP--PPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFES----SLC :. .: . : : :: .... : :.. .. ... :.: : : : CCDS44 STHNSEKKGDGTQNSANPSPSGGDSAL-----SGELSASLPGLLSDKRDLPASGKSRSDC 700 710 720 730 740 180 190 200 210 220 230 pF1KB3 GDLLNEVQASEHTKSKHESRKEKRKKSNKHDSSRSE-ERKSHKIPKLEPEEQNRPNERVD : ... .: . . :.. .. . ..: .:: ...:.. . . ... CCDS44 VTRRNCGRSKPSSKLRDAFSAQMVKNTVNRKALKTERKRKLNQLPSVTLDAVLQGDRERG 750 760 770 780 790 800 240 250 260 270 280 290 pF1KB3 TVSEKPREEPVLKEEAPVQPILSSVPTTEVS--TGVKFQVGDLVWSKVGTYPWWPCMVSS . :.: ..: :.: :.. . . . . . :.:. . . : : . CCDS44 GSLRGGAEDP--SKEDPLQ-IMGHLTSEDGDHFSDVHFD-SKVKQSDPGKISEKGLSFEN 810 820 830 840 850 860 300 310 320 330 340 pF1KB3 DPQLEVHTKINTRGAREYHVQFFSNQ--PERAW--VHEKRVREYKGHKQYEELLAEATKQ :. . .:... . : :: :.. : ....:.. : ....: :. CCDS44 GKGPELDSVMNSENDELNGV----NQVVPKKRWQRLNQRRTKPRKRMNRFKE------KE 870 880 890 900 910 350 360 370 380 390 400 pF1KB3 ASNHSEKQKIRKPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQA :. . . . . :. : .. : . .. .: :: .:. . :. CCDS44 NSECAFRVLLPSDPVQEGRDEFP---EHRTPSASILEEPLTEQNHADCLDSAGPR-LNVC 920 930 940 950 960 410 420 430 440 450 460 pF1KB3 KKSVASKTEVKKTRRPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEP--P :: :: ...: .: .. . : :.. : : . ..:. :. .:: . CCDS44 DKSSASIGDMEK--EP-GIPSLTP-QAELPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFA 970 980 990 1000 1010 1020 470 480 490 500 510 pF1KB3 PVKIAWKT------AAARKSLPASITMHKGSLDLQKCNMSPVVKI-EQVFALQNATGDGK : : :. ...: . .. ..: . .. . . ... :. .:. .. CCDS44 PKKKQKKVQEQVHKVSSRCEEESLLARGRSSAQNKQVDENSLISTKEEPPVLER---EAP 1030 1040 1050 1060 1070 1080 520 530 540 550 560 570 pF1KB3 FIDQFVYSTKGIGNKTEISVRGQDRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQ :.. . ... :...:. .: .:.: . .: .. : : . :. :.:.: CCDS44 FLEGPLAQSELGGGHAELP-----QLTLSVPVAPEVSPRPALESEELLVKTPGNYESKRQ 1090 1100 1110 1120 1130 580 590 600 610 620 pF1KB3 RRSIRTRSESEK-STEVVPKKK---IKKE-----QVETVPQATVKTGLQK----GASEIS :. . ::. . .::: ..:. ..:. . :. .: :...: CCDS44 RKPTKKLLESNDLDPGFMPKKGDLGLSKKCYEAGHLENGITESCATSYSKDFGGGTTKIF 1140 1150 1160 1170 1180 1190 630 640 650 660 670 680 pF1KB3 DSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQ : :: :.. . . ..: . .. ..: :. .. . . ::. :.. : CCDS44 D--KPRKRKRQRHAAAKMQCKKVKNDDSSKEIPGSEGELMPHRTATSPKETVEEGVEHDP 1200 1210 1220 1230 1240 1250 690 700 710 720 730 740 pF1KB3 SMDSS---LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFI .: .: ..:: : . :..::: ::. :. :. ::..:: ::::::::. .: .::: CCDS44 GMPASKKMQGERGGGAALKENVCQNCEKLGELLL-CEAQCCGAFHLECLGLTEMPRGKFI 1260 1270 1280 1290 1300 1310 750 760 770 780 790 800 pF1KB3 CMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSA : ::.:: : :: :: ::.::::: . ::::::: ::.:.: .....::::: : : . CCDS44 CNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEECVQKYPPTVMQNKGFRCSLHICIT 1320 1330 1340 1350 1360 1370 810 820 830 840 850 pF1KB3 CSMEKDIH-KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH--SKRSS-NS : . . .:::::.:::.:::::::..: :.:::: ...: .:: :: .:. : CCDS44 CHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILASNSIICPNHFTPRRGCRNH 1380 1390 1400 1410 1420 1430 860 870 880 890 900 910 pF1KB3 SAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKC :::..::::. CCDS44 EHVNVSWCFVCS------------------------------------------------ 1440 920 930 940 950 960 970 pF1KB3 EKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAE .:: ::::.::::.:: :::.:..::: : ::::::::: ::..:::::.: ::::::: CCDS44 -EGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAE 1450 1460 1470 1480 1490 1500 980 990 1000 1010 1020 1030 pF1KB3 ICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQ-TSINKT ::.::.:: ::. ..::.:.:::.::::.:: :.::.:::::.::: : . . ... : CCDS44 ICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGT 1510 1520 1530 1540 1550 1560 1040 1050 1060 1070 1080 1090 pF1KB3 FKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIP .::::.::: ::.:::::.: .. : .::..:::::::::.:. ::.::: .::::::: CCDS44 YKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIP 1570 1580 1590 1600 1610 1620 1100 1110 1120 1130 1140 1150 pF1KB3 RCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRG ::::: .::::::..:::.:::: ::::: ::::: :::::::.:: ::..::..: .:: CCDS44 RCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRG 1630 1640 1650 1660 1670 1680 1160 1170 1180 1190 1200 1210 pF1KB3 WGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKG :::::: .::::::::::::::::::::: ::. :.:...:::::::. ::::::::::: CCDS44 WGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKG 1690 1700 1710 1720 1730 1740 1220 1230 1240 1250 1260 1270 pF1KB3 NYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCG ::.::::: :.::::::::.::::.::::::: :: :: ::::::::.:::::.: :.:: CCDS44 NYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCG 1750 1760 1770 1780 1790 1800 1280 1290 1300 1310 1320 1330 pF1KB3 ADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMC : :::::::::::. .:.:.. : : .: .:. . : . .:: ::.:::.:.:: : CCDS44 APNCSGFLGVRPKNQPIATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSC 1810 1820 1830 1840 1850 1860 1340 1350 1360 1370 1380 1390 pF1KB3 DKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVP : :::.:: :::::. : ::::::::::: :.. :.::::.:: ::::.:..: : CCDS44 KKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFI 1870 1880 1890 1900 1910 1920 1400 1410 1420 1430 pF1KB3 SALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE : :.::: :.:::: .: CCDS44 SKLDGRLSCTEHDPCGPNPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDK 1930 1940 1950 1960 1970 1980 >>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696 aa) initn: 3440 init1: 1938 opt: 2608 Z-score: 1633.6 bits: 315.7 E(32554): 1.1e-84 Smith-Waterman score: 3268; 39.3% identity (63.3% similar) in 1427 aa overlap (39-1413:875-2210) 10 20 30 40 50 60 pF1KB3 QGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYPATTEDLPP :....: . : . : :. :.... : CCDS44 KTRDSSDIETAVVKHVLSELKELSYRSLGEDVSDSGTSKPSKPLL---FS-SASSQNHIP 850 860 870 880 890 900 70 80 90 100 110 pF1KB3 LTNGYPSSI------SVYETQTKYQSYNQYPN---GSANGFGAVRNFSPTDYYHSEIPNT . : : ......:: : : . : : . ::. . . . CCDS44 IEPDYKFSTLLMMLKDMHDSKTKEQRLMTAQNLVSYRSPGRGDCSTNSPVGVSKVLVSGG 910 920 930 940 950 960 120 130 140 150 160 170 pF1KB3 RPHEILEKPSPPQPP--PPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFES----SLC :. .: . : : :: .... : :.. .. ... :.: : : : CCDS44 STHNSEKKGDGTQNSANPSPSGGDSAL-----SGELSASLPGLLSDKRDLPASGKSRSDC 970 980 990 1000 1010 180 190 200 210 220 230 pF1KB3 GDLLNEVQASEHTKSKHESRKEKRKKSNKHDSSRSE-ERKSHKIPKLEPEEQNRPNERVD : ... .: . . :.. .. . ..: .:: ...:.. . . ... CCDS44 VTRRNCGRSKPSSKLRDAFSAQMVKNTVNRKALKTERKRKLNQLPSVTLDAVLQGDRERG 1020 1030 1040 1050 1060 1070 240 250 260 270 280 290 pF1KB3 TVSEKPREEPVLKEEAPVQPILSSVPTTEVS--TGVKFQVGDLVWSKVGTYPWWPCMVSS . :.: ..: :.: :.. . . . . . :.:. . . : : . CCDS44 GSLRGGAEDP--SKEDPLQ-IMGHLTSEDGDHFSDVHFD-SKVKQSDPGKISEKGLSFEN 1080 1090 1100 1110 1120 1130 300 310 320 330 340 pF1KB3 DPQLEVHTKINTRGAREYHVQFFSNQ--PERAW--VHEKRVREYKGHKQYEELLAEATKQ :. . .:... . : :: :.. : ....:.. : ....: :. CCDS44 GKGPELDSVMNSENDELNGV----NQVVPKKRWQRLNQRRTKPRKRMNRFKE------KE 1140 1150 1160 1170 1180 350 360 370 380 390 400 pF1KB3 ASNHSEKQKIRKPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQA :. . . . . :. : .. : . .. .: :: .:. . :. CCDS44 NSECAFRVLLPSDPVQEGRDEFP---EHRTPSASILEEPLTEQNHADCLDSAGPR-LNVC 1190 1200 1210 1220 1230 410 420 430 440 450 460 pF1KB3 KKSVASKTEVKKTRRPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEP--P :: :: ...: .: .. . : :.. : : . ..:. :. .:: . CCDS44 DKSSASIGDMEK--EP-GIPSLTP-QAELPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFA 1240 1250 1260 1270 1280 1290 470 480 490 500 510 pF1KB3 PVKIAWKT------AAARKSLPASITMHKGSLDLQKCNMSPVVKI-EQVFALQNATGDGK : : :. ...: . .. ..: . .. . . ... :. .:. .. CCDS44 PKKKQKKVQEQVHKVSSRCEEESLLARGRSSAQNKQVDENSLISTKEEPPVLER---EAP 1300 1310 1320 1330 1340 1350 520 530 540 550 560 570 pF1KB3 FIDQFVYSTKGIGNKTEISVRGQDRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQ :.. . ... :...:. .: .:.: . .: .. : : . :. :.:.: CCDS44 FLEGPLAQSELGGGHAELP-----QLTLSVPVAPEVSPRPALESEELLVKTPGNYESKRQ 1360 1370 1380 1390 1400 580 590 600 610 620 pF1KB3 RRSIRTRSESEK-STEVVPKKK---IKKE-----QVETVPQATVKTGLQK----GASEIS :. . ::. . .::: ..:. ..:. . :. .: :...: CCDS44 RKPTKKLLESNDLDPGFMPKKGDLGLSKKCYEAGHLENGITESCATSYSKDFGGGTTKIF 1410 1420 1430 1440 1450 1460 630 640 650 660 670 680 pF1KB3 DSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQ : :: :.. . . ..: . .. ..: :. .. . . ::. :.. : CCDS44 D--KPRKRKRQRHAAAKMQCKKVKNDDSSKEIPGSEGELMPHRTATSPKETVEEGVEHDP 1470 1480 1490 1500 1510 1520 690 700 710 720 730 740 pF1KB3 SMDSS---LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFI .: .: ..:: : . :..::: ::. :. :. ::..:: ::::::::. .: .::: CCDS44 GMPASKKMQGERGGGAALKENVCQNCEKLGELLL-CEAQCCGAFHLECLGLTEMPRGKFI 1530 1540 1550 1560 1570 1580 750 760 770 780 790 800 pF1KB3 CMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSA : ::.:: : :: :: ::.::::: . ::::::: ::.:.: .....::::: : : . CCDS44 CNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEECVQKYPPTVMQNKGFRCSLHICIT 1590 1600 1610 1620 1630 1640 810 820 830 840 850 pF1KB3 CSMEKDIH-KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH--SKRSS-NS : . . .:::::.:::.:::::::..: :.:::: ...: .:: :: .:. : CCDS44 CHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILASNSIICPNHFTPRRGCRNH 1650 1660 1670 1680 1690 1700 860 870 880 890 900 910 pF1KB3 SAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKC :::..::::. CCDS44 EHVNVSWCFVCS------------------------------------------------ 1710 920 930 940 950 960 970 pF1KB3 EKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAE .:: ::::.::::.:: :::.:..::: : ::::::::: ::..:::::.: ::::::: CCDS44 -EGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAE 1720 1730 1740 1750 1760 1770 980 990 1000 1010 1020 1030 pF1KB3 ICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQ-TSINKT ::.::.:: ::. ..::.:.:::.::::.:: :.::.:::::.::: : . . ... : CCDS44 ICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGT 1780 1790 1800 1810 1820 1830 1040 1050 1060 1070 1080 1090 pF1KB3 FKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIP .::::.::: ::.:::::.: .. : .::..:::::::::.:. ::.::: .::::::: CCDS44 YKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIP 1840 1850 1860 1870 1880 1890 1100 1110 1120 1130 1140 1150 pF1KB3 RCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRG ::::: .::::::..:::.:::: ::::: ::::: :::::::.:: ::..::..: .:: CCDS44 RCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRG 1900 1910 1920 1930 1940 1950 1160 1170 1180 1190 1200 1210 pF1KB3 WGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKG :::::: .::::::::::::::::::::: ::. :.:...:::::::. ::::::::::: CCDS44 WGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKG 1960 1970 1980 1990 2000 2010 1220 1230 1240 1250 1260 1270 pF1KB3 NYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCG ::.::::: :.::::::::.::::.::::::: :: :: ::::::::.:::::.: :.:: CCDS44 NYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCG 2020 2030 2040 2050 2060 2070 1280 1290 1300 1310 1320 1330 pF1KB3 ADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMC : :::::::::::. .:.:.. : : .: .:. . : . .:: ::.:::.:.:: : CCDS44 APNCSGFLGVRPKNQPIATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSC 2080 2090 2100 2110 2120 2130 1340 1350 1360 1370 1380 1390 pF1KB3 DKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVP : :::.:: :::::. : ::::::::::: :.. :.::::.:: ::::.:..: : CCDS44 KKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFI 2140 2150 2160 2170 2180 2190 1400 1410 1420 1430 pF1KB3 SALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE : :.::: :.:::: .: CCDS44 SKLDGRLSCTEHDPCGPNPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDK 2200 2210 2220 2230 2240 2250 >>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564 aa) initn: 843 init1: 587 opt: 672 Z-score: 425.8 bits: 92.2 E(32554): 2.1e-17 Smith-Waterman score: 672; 35.8% identity (66.2% similar) in 293 aa overlap (1021-1313:1433-1712) 1000 1010 1020 1030 1040 1050 pF1KB3 LKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQTSINKTFKKALEEAAKRFQE .:. : :.. .. . . .:..: CCDS27 PLKKRRQEIESDSESDGELQDRKKVRVEVEQGETSVPPGSALVGPSCVMDDFRDPQRWKE 1410 1420 1430 1440 1450 1460 1060 1070 1080 1090 1100 1110 pF1KB3 LKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADENPCGL : . ... ... :. :... : ..: . . ::. : . : :: CCDS27 CAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRMQCECTPLSKDERAQ----GEIACG- 1470 1480 1490 1500 1510 1120 1130 1140 1150 1160 1170 pF1KB3 ESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSIKKGEF .::::.:. :: . :: :: :.:. : .. . :.:.: ::..:::::. ... .. : CCDS27 -EDCLNRLLMIECSSR-CPNGDYCSNRRFQRKQHADVEVILTEKKGWGLRAAKDLPSNTF 1520 1530 1540 1550 1560 1570 1180 1190 1200 1210 1220 1230 pF1KB3 VNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHSCNPNC : :: ::..:..: . :.:. .:. ..:.... .:.:::: ::: ::::::::.::: CCDS27 VLEYCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCSRFMNHSCEPNC 1580 1590 1600 1610 1620 1630 1240 1250 1260 1270 1280 1290 pF1KB3 ETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLGVRPKS :::::::::..:::.:. .:.: ::::.:... :. .: ::. :: :.:: . . CCDS27 ETQKWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQKCFCGSANCRGYLGGENRV 1640 1650 1660 1670 1680 1690 1300 1310 1320 1330 1340 1350 pF1KB3 ACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAYHLLCL . .: ..:.:..: . : CCDS27 SI------RAAGGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLMVRIETLE 1700 1710 1720 1730 1740 >>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964 aa) initn: 500 init1: 332 opt: 658 Z-score: 416.1 bits: 90.6 E(32554): 7.4e-17 Smith-Waterman score: 658; 38.3% identity (69.0% similar) in 261 aa overlap (1068-1321:2062-2316) 1040 1050 1060 1070 1080 1090 pF1KB3 KKALEEAAKRFQELKAQRESKEALEIEKNSRKP--PPYKHIKANKVIGKVQIQVADLS-- .:: : ::.:..: : ..: :: CCDS11 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY 2040 2050 2060 2070 2080 1100 1110 1120 1130 1140 1150 pF1KB3 EIPRCNCK-PADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDA-EIIK : :::: : :.. : ..:::::. :: :..:: :..: :: . .. . . : .. CCDS11 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR 2090 2100 2110 2120 2130 2140 1160 1170 1180 1190 1200 1210 pF1KB3 TERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIID .:..:::.:::. .: :.:. ::.::...:.: : :. . ..: .. : :.. . .:: CCDS11 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNH-SDHYCLNLDSGMVID 2150 2160 2170 2180 2190 2200 1220 1230 1240 1250 1260 1270 pF1KB3 AGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRT . :: .::.::::.:::: :::.::: :.::.:: :.::: :::..::. .. . CCDS11 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ 2210 2220 2230 2240 2250 2260 1280 1290 1300 1310 1320 1330 pF1KB3 E-CHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDG . :.:: ..: :..: . . . . :. .... ..: . : . :. :. CCDS11 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS 2270 2280 2290 2300 2310 2320 1340 1350 1360 1370 1380 1390 pF1KB3 GELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHE CCDS11 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS 2330 2340 2350 2360 2370 2380 >>CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 (629 aa) initn: 776 init1: 323 opt: 560 Z-score: 364.4 bits: 78.8 E(32554): 5.6e-14 Smith-Waterman score: 772; 31.1% identity (59.3% similar) in 604 aa overlap (98-663:66-628) 70 80 90 100 110 120 pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H :: :. : :.: . :.. : .: : CCDS46 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA . . : ..: .. : :.:::::::::::: .::. :::::.::: .:. CCDS46 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE ::.. .: :.. ...::.: :.:: . . . .... :.: . CCDS46 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI 160 170 180 190 200 250 260 270 280 290 pF1KB3 PVLKEEAPVQPILSSVPTT--EVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTK :. :: : :.: . . .:..:::::::::. :::::::::.:: :. .:: CCDS46 PAKKE---------SCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTK 210 220 230 240 250 300 310 320 330 340 350 pF1KB3 IN--TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIR .. ..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. CCDS46 LKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLL 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB3 KPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVK :: . ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . CCDS46 KPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLG 320 330 340 350 360 370 420 430 440 450 460 470 pF1KB3 KTRRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWK . . .: . .:.: .:. : ::. . .::: : : . : CCDS46 EMAESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQK 380 390 400 410 420 480 490 500 510 520 pF1KB3 TAAA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI :: : :... . .: .... . . ... :: .. :. : CCDS46 TAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDA 430 440 450 460 470 530 540 550 560 570 580 pF1KB3 -GNKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSES :.. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. . CCDS46 SGEEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPT 480 490 500 510 520 530 590 600 610 620 pF1KB3 EKS-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKP : . .: .:.:... .. .:. . :..:. : .....::.::: CCDS46 EDAEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKP 540 550 560 570 580 590 630 640 650 660 670 680 pF1KB3 LKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQSMDSS ::::.:::: . .:. . :.: : .:.. .: CCDS46 LKKRNRASTAA--SSALGFSKSSSPSASLTENEVK 600 610 620 690 700 710 720 730 740 pF1KB3 LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQ >>CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 (647 aa) initn: 776 init1: 323 opt: 560 Z-score: 364.2 bits: 78.8 E(32554): 5.7e-14 Smith-Waterman score: 769; 31.0% identity (58.6% similar) in 594 aa overlap (98-655:66-622) 70 80 90 100 110 120 pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H :: :. : :.: . :.. : .: : CCDS33 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA . . : ..: .. : :.:::::::::::: .::. :::::.::: .:. CCDS33 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE ::.. .: :.. ...::.: :.:: . . . .... :.: . CCDS33 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI 160 170 180 190 200 250 260 270 280 290 300 pF1KB3 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN :. :: : . . .:..:::::::::. :::::::::.:: :. .::.. CCDS33 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK 210 220 230 240 250 310 320 330 340 350 pF1KB3 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP ..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. :: CCDS33 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB3 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT . ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . . CCDS33 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM 320 330 340 350 360 370 420 430 440 450 460 470 pF1KB3 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA . .: . .:.: .:. : ::. . .::: : : . ::: CCDS33 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA 380 390 400 410 420 480 490 500 510 520 530 pF1KB3 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G : :... . .: .... . . ... :: : :. : : CCDS33 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFC-------QKHRDEVVAEHPDASG 430 440 450 460 470 480 540 550 560 570 580 pF1KB3 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK .. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .: CCDS33 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED 490 500 510 520 530 590 600 610 620 630 pF1KB3 S-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKPLK . .: .:.:... .. .:. . :..:. : .....::.::::: CCDS33 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK 540 550 560 570 580 590 640 650 660 670 680 690 pF1KB3 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQSMDSSLS ::.:::: . . . ...: : : CCDS33 KRNRASTAASSALGFSKSSSPSASLTENELLWEPTPVKLDLNPAALYCT 600 610 620 630 640 1437 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 22:46:59 2016 done: Wed Nov 2 22:47:00 2016 Total Scan time: 4.700 Total Display time: 0.370 Function used was FASTA [36.3.4 Apr, 2011]