FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3497, 1437 aa
1>>>pF1KB3497 1437 - 1437 aa - 1437 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.7389+/-0.00106; mu= 4.8861+/- 0.065
mean_var=256.7960+/-50.397, 0's: 0 Z-trim(112.2): 65 B-trim: 6 in 1/52
Lambda= 0.080035
statistics sampled from 12925 (12977) to 12925 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.719), E-opt: 0.2 (0.399), width: 16
Scan time: 4.700
The best scores are: opt bits E(32554)
CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437) 9958 1164.2 0
CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 ( 645) 4086 485.9 1.6e-136
CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365) 2691 325.1 8.7e-88
CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427) 2608 315.7 1e-84
CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696) 2608 315.7 1.1e-84
CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564) 672 92.2 2.1e-17
CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964) 658 90.6 7.4e-17
CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 ( 629) 560 78.8 5.6e-14
CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 ( 647) 560 78.8 5.7e-14
>>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437 aa)
initn: 9958 init1: 9958 opt: 9958 Z-score: 6224.0 bits: 1164.2 E(32554): 0
Smith-Waterman score: 9958; 100.0% identity (100.0% similar) in 1437 aa overlap (1-1437:1-1437)
10 20 30 40 50 60
pF1KB3 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB3 LQVGFGKQVDSPSATADADVSDVQSMDSSLSRRGTGMSKKDTVCQICESSGDSLIPCEGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LQVGFGKQVDSPSATADADVSDVQSMDSSLSRRGTGMSKKDTVCQICESSGDSLIPCEGE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB3 CCKHFHLECLGLASLPDSKFICMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CCKHFHLECLGLASLPDSKFICMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVR
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB3 KFPTAIFESKGFRCPQHCCSACSMEKDIHKASKGRMMRCLRCPVAYHSGDACIAAGSMLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KFPTAIFESKGFRCPQHCCSACSMEKDIHKASKGRMMRCLRCPVAYHSGDACIAAGSMLV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB3 SSYILICSNHSKRSSNSSAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SSYILICSNHSKRSSNSSAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB3 LMKLPMIPSSSASKKKCEKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LMKLPMIPSSSASKKKCEKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHY
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB3 KQIVWVKLGNYRWWPAEICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KQIVWVKLGNYRWWPAEICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYV
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB3 EGDKSFAEGQTSINKTFKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EGDKSFAEGQTSINKTFKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANK
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB3 VIGKVQIQVADLSEIPRCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VIGKVQIQVADLSEIPRCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFT
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB3 KRLYPDAEIIKTERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KRLYPDAEIIKTERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFY
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB3 MLTVTKDRIIDAGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MLTVTKDRIIDAGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFN
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB3 YNLDCLGNGRTECHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 YNLDCLGNGRTECHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMH
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB3 EDYCFQCGDGGELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EDYCFQCGDGGELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEF
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430
pF1KB3 CPHSFCKDHEKGALVPSALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CPHSFCKDHEKGALVPSALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
1390 1400 1410 1420 1430
>>CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 (645 aa)
initn: 4188 init1: 4086 opt: 4086 Z-score: 2564.6 bits: 485.9 E(32554): 1.6e-136
Smith-Waterman score: 4086; 99.5% identity (100.0% similar) in 622 aa overlap (1-622:1-622)
10 20 30 40 50 60
pF1KB3 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MDFSFSFMQGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 ATTEDLPPLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYHSEIPNTR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PHEILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 QASEHTKSKHESRKEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPRE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 EPVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 NTRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKPR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKTR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 RPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEPPPVKIAWKTAAARKSLP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 ASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGIGNKTEISVRGQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 DRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQRRSIRTRSESEKSTEVVPKKKIK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 KEQVETVPQATVKTGLQKGASEISDSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSD
:::::::::::::::::::...
CCDS61 KEQVETVPQATVKTGLQKGSADRGVQGSVRFSDSSVSAAIEETVD
610 620 630 640
>>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365 aa)
initn: 3744 init1: 1867 opt: 2691 Z-score: 1689.5 bits: 325.1 E(32554): 8.7e-88
Smith-Waterman score: 4037; 46.6% identity (69.3% similar) in 1354 aa overlap (98-1409:66-1327)
70 80 90 100 110 120
pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
:: :. : :.: . :.. : .: :
CCDS33 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
40 50 60 70 80 90
130 140 150 160 170 180
pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
. . : ..: .. : :.:::::::::::: .::. :::::.::: .:.
CCDS33 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
100 110 120 130 140 150
190 200 210 220 230 240
pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
::.. .: :.. ...::.: :.:: . . . .... :.: .
CCDS33 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
160 170 180 190 200
250 260 270 280 290 300
pF1KB3 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
:. :: : . . .:..:::::::::. :::::::::.:: :. .::..
CCDS33 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
210 220 230 240 250
310 320 330 340 350
pF1KB3 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. ::
CCDS33 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
260 270 280 290 300 310
360 370 380 390 400 410
pF1KB3 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
. ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . .
CCDS33 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
320 330 340 350 360 370
420 430 440 450 460 470
pF1KB3 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
. .: . .:.: .:. : ::. . .::: : : . :::
CCDS33 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
380 390 400 410 420
480 490 500 510 520 530
pF1KB3 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G
: :... . .: .... . . ... :: : :. : :
CCDS33 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQ-------KHRDEVVAEHPDASG
430 440 450 460 470 480
540 550 560 570 580
pF1KB3 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
.. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .:
CCDS33 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
490 500 510 520 530
590 600 610 620 630
pF1KB3 S-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKPLK
. .: .:.:... .. .:. . :..:. : .....::.:::::
CCDS33 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
540 550 560 570 580 590
640 650 660 670 680 690
pF1KB3 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQ-VDSPSATADADVSDVQSMDSSL
::.:::: . . . ...: : : .... . : . .:: .:: ..: :..:.
CCDS33 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEV-SVSSKK
600 610 620 630 640 650
700 710 720 730 740 750
pF1KB3 SRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQH
:.::. .::. :::.::. : ::. ::: :: ::: ::::. :...: : :: .: :
CCDS33 SERGV-TAKKEYVCQLCEKPG-SLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIH
660 670 680 690 700 710
760 770 780 790 800
pF1KB3 PCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSACSMEKDIH-
:: :: : ::::: : ::::::::::.:.: ..:::.::::: : : .: . .
CCDS33 SCFVCKESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNP
720 730 740 750 760 770
810 820 830 840 850 860
pF1KB3 KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH---SKRSSNSSAVNVGFCF
. :::.::::.::::::::::::.::: ...: .::. : : . . . :::..::
CCDS33 RPSKGKMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCF
780 790 800 810 820 830
870 880 890 900 910 920
pF1KB3 VCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKCEKGGRLLCC
::. ::: ::::
CCDS33 VCS-------------------------------------------------KGGSLLCC
840
930 940 950 960 970 980
pF1KB3 ESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAEICNPRSVPL
:::::.:::.::.::::.: : ::::.::::::...:.:::::::::::::.:.:..::
CCDS33 ESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPP
850 860 870 880 890 900
990 1000 1010 1020 1030 1040
pF1KB3 NIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDK-SFAEGQTSINKTFKKALEEAA
::: .::..:.::::::::.::::.::.:::::.:::. : .: .:...::.::.::
CCDS33 NIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAE
910 920 930 940 950 960
1050 1060 1070 1080 1090 1100
pF1KB3 KRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADE
::.:.: :::..:. : : ::::::::::.:: ::::: .::.::::.:::::.::
CCDS33 ARFREIKLQREARETQESE---RKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDE
970 980 990 1000 1010 1020
1110 1120 1130 1140 1150 1160
pF1KB3 NPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSI
::::..::::::::..::::::::::. ::::::::: ::...::::. .:::: .::.:
CCDS33 NPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDI
1030 1040 1050 1060 1070 1080
1170 1180 1190 1200 1210 1220
pF1KB3 KKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHS
.:::::::::::::::::: :::.::::..:.:::::. ::::::::::::::::::::
CCDS33 RKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHS
1090 1100 1110 1120 1130 1140
1230 1240 1250 1260 1270 1280
pF1KB3 CNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLG
:.::::: :::::::.::::::.:::::: ::::::::::::: .: :.:::.:::::::
CCDS33 CQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLG
1150 1160 1170 1180 1190 1200
1290 1300 1310 1320 1330 1340
pF1KB3 VRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAY
:::.. . ..:::.:..: : .::. : : :.. :: ::.:::::.::.::.: : :::
CCDS33 DRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAY
1210 1220 1230 1240 1250 1260
1350 1360 1370 1380 1390 1400
pF1KB3 HLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVPSALEGRLCC
:: ::.: . :.::::::::.:: :.. ..:::..::.::::.:. :. . .:: :
CCDS33 HLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYC
1270 1280 1290 1300 1310 1320
1410 1420 1430
pF1KB3 SEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
:::
CCDS33 CEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
1330 1340 1350 1360
>>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427 aa)
initn: 3361 init1: 1938 opt: 2608 Z-score: 1634.2 bits: 315.7 E(32554): 1e-84
Smith-Waterman score: 3268; 39.3% identity (63.3% similar) in 1427 aa overlap (39-1413:606-1941)
10 20 30 40 50 60
pF1KB3 QGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYPATTEDLPP
:....: . : . : :. :.... :
CCDS44 KTRDSSDIETAVVKHVLSELKELSYRSLGEDVSDSGTSKPSKPLL---FS-SASSQNHIP
580 590 600 610 620 630
70 80 90 100 110
pF1KB3 LTNGYPSSI------SVYETQTKYQSYNQYPN---GSANGFGAVRNFSPTDYYHSEIPNT
. : : ......:: : : . : : . ::. . . .
CCDS44 IEPDYKFSTLLMMLKDMHDSKTKEQRLMTAQNLVSYRSPGRGDCSTNSPVGVSKVLVSGG
640 650 660 670 680 690
120 130 140 150 160 170
pF1KB3 RPHEILEKPSPPQPP--PPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFES----SLC
:. .: . : : :: .... : :.. .. ... :.: : : :
CCDS44 STHNSEKKGDGTQNSANPSPSGGDSAL-----SGELSASLPGLLSDKRDLPASGKSRSDC
700 710 720 730 740
180 190 200 210 220 230
pF1KB3 GDLLNEVQASEHTKSKHESRKEKRKKSNKHDSSRSE-ERKSHKIPKLEPEEQNRPNERVD
: ... .: . . :.. .. . ..: .:: ...:.. . . ...
CCDS44 VTRRNCGRSKPSSKLRDAFSAQMVKNTVNRKALKTERKRKLNQLPSVTLDAVLQGDRERG
750 760 770 780 790 800
240 250 260 270 280 290
pF1KB3 TVSEKPREEPVLKEEAPVQPILSSVPTTEVS--TGVKFQVGDLVWSKVGTYPWWPCMVSS
. :.: ..: :.: :.. . . . . . :.:. . . : : .
CCDS44 GSLRGGAEDP--SKEDPLQ-IMGHLTSEDGDHFSDVHFD-SKVKQSDPGKISEKGLSFEN
810 820 830 840 850 860
300 310 320 330 340
pF1KB3 DPQLEVHTKINTRGAREYHVQFFSNQ--PERAW--VHEKRVREYKGHKQYEELLAEATKQ
:. . .:... . : :: :.. : ....:.. : ....: :.
CCDS44 GKGPELDSVMNSENDELNGV----NQVVPKKRWQRLNQRRTKPRKRMNRFKE------KE
870 880 890 900 910
350 360 370 380 390 400
pF1KB3 ASNHSEKQKIRKPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQA
:. . . . . :. : .. : . .. .: :: .:. . :.
CCDS44 NSECAFRVLLPSDPVQEGRDEFP---EHRTPSASILEEPLTEQNHADCLDSAGPR-LNVC
920 930 940 950 960
410 420 430 440 450 460
pF1KB3 KKSVASKTEVKKTRRPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEP--P
:: :: ...: .: .. . : :.. : : . ..:. :. .:: .
CCDS44 DKSSASIGDMEK--EP-GIPSLTP-QAELPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFA
970 980 990 1000 1010 1020
470 480 490 500 510
pF1KB3 PVKIAWKT------AAARKSLPASITMHKGSLDLQKCNMSPVVKI-EQVFALQNATGDGK
: : :. ...: . .. ..: . .. . . ... :. .:. ..
CCDS44 PKKKQKKVQEQVHKVSSRCEEESLLARGRSSAQNKQVDENSLISTKEEPPVLER---EAP
1030 1040 1050 1060 1070 1080
520 530 540 550 560 570
pF1KB3 FIDQFVYSTKGIGNKTEISVRGQDRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQ
:.. . ... :...:. .: .:.: . .: .. : : . :. :.:.:
CCDS44 FLEGPLAQSELGGGHAELP-----QLTLSVPVAPEVSPRPALESEELLVKTPGNYESKRQ
1090 1100 1110 1120 1130
580 590 600 610 620
pF1KB3 RRSIRTRSESEK-STEVVPKKK---IKKE-----QVETVPQATVKTGLQK----GASEIS
:. . ::. . .::: ..:. ..:. . :. .: :...:
CCDS44 RKPTKKLLESNDLDPGFMPKKGDLGLSKKCYEAGHLENGITESCATSYSKDFGGGTTKIF
1140 1150 1160 1170 1180 1190
630 640 650 660 670 680
pF1KB3 DSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQ
: :: :.. . . ..: . .. ..: :. .. . . ::. :.. :
CCDS44 D--KPRKRKRQRHAAAKMQCKKVKNDDSSKEIPGSEGELMPHRTATSPKETVEEGVEHDP
1200 1210 1220 1230 1240 1250
690 700 710 720 730 740
pF1KB3 SMDSS---LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFI
.: .: ..:: : . :..::: ::. :. :. ::..:: ::::::::. .: .:::
CCDS44 GMPASKKMQGERGGGAALKENVCQNCEKLGELLL-CEAQCCGAFHLECLGLTEMPRGKFI
1260 1270 1280 1290 1300 1310
750 760 770 780 790 800
pF1KB3 CMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSA
: ::.:: : :: :: ::.::::: . ::::::: ::.:.: .....::::: : : .
CCDS44 CNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEECVQKYPPTVMQNKGFRCSLHICIT
1320 1330 1340 1350 1360 1370
810 820 830 840 850
pF1KB3 CSMEKDIH-KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH--SKRSS-NS
: . . .:::::.:::.:::::::..: :.:::: ...: .:: :: .:. :
CCDS44 CHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILASNSIICPNHFTPRRGCRNH
1380 1390 1400 1410 1420 1430
860 870 880 890 900 910
pF1KB3 SAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKC
:::..::::.
CCDS44 EHVNVSWCFVCS------------------------------------------------
1440
920 930 940 950 960 970
pF1KB3 EKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAE
.:: ::::.::::.:: :::.:..::: : ::::::::: ::..:::::.: :::::::
CCDS44 -EGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAE
1450 1460 1470 1480 1490 1500
980 990 1000 1010 1020 1030
pF1KB3 ICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQ-TSINKT
::.::.:: ::. ..::.:.:::.::::.:: :.::.:::::.::: : . . ... :
CCDS44 ICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGT
1510 1520 1530 1540 1550 1560
1040 1050 1060 1070 1080 1090
pF1KB3 FKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIP
.::::.::: ::.:::::.: .. : .::..:::::::::.:. ::.::: .:::::::
CCDS44 YKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIP
1570 1580 1590 1600 1610 1620
1100 1110 1120 1130 1140 1150
pF1KB3 RCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRG
::::: .::::::..:::.:::: ::::: ::::: :::::::.:: ::..::..: .::
CCDS44 RCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRG
1630 1640 1650 1660 1670 1680
1160 1170 1180 1190 1200 1210
pF1KB3 WGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKG
:::::: .::::::::::::::::::::: ::. :.:...:::::::. :::::::::::
CCDS44 WGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKG
1690 1700 1710 1720 1730 1740
1220 1230 1240 1250 1260 1270
pF1KB3 NYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCG
::.::::: :.::::::::.::::.::::::: :: :: ::::::::.:::::.: :.::
CCDS44 NYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCG
1750 1760 1770 1780 1790 1800
1280 1290 1300 1310 1320 1330
pF1KB3 ADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMC
: :::::::::::. .:.:.. : : .: .:. . : . .:: ::.:::.:.:: :
CCDS44 APNCSGFLGVRPKNQPIATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSC
1810 1820 1830 1840 1850 1860
1340 1350 1360 1370 1380 1390
pF1KB3 DKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVP
: :::.:: :::::. : ::::::::::: :.. :.::::.:: ::::.:..: :
CCDS44 KKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFI
1870 1880 1890 1900 1910 1920
1400 1410 1420 1430
pF1KB3 SALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
: :.::: :.:::: .:
CCDS44 SKLDGRLSCTEHDPCGPNPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDK
1930 1940 1950 1960 1970 1980
>>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696 aa)
initn: 3440 init1: 1938 opt: 2608 Z-score: 1633.6 bits: 315.7 E(32554): 1.1e-84
Smith-Waterman score: 3268; 39.3% identity (63.3% similar) in 1427 aa overlap (39-1413:875-2210)
10 20 30 40 50 60
pF1KB3 QGIMGNTIQQPPQLIDSANIRQEDAFDNNSDIAEDGGQTPYEATLQQGFQYPATTEDLPP
:....: . : . : :. :.... :
CCDS44 KTRDSSDIETAVVKHVLSELKELSYRSLGEDVSDSGTSKPSKPLL---FS-SASSQNHIP
850 860 870 880 890 900
70 80 90 100 110
pF1KB3 LTNGYPSSI------SVYETQTKYQSYNQYPN---GSANGFGAVRNFSPTDYYHSEIPNT
. : : ......:: : : . : : . ::. . . .
CCDS44 IEPDYKFSTLLMMLKDMHDSKTKEQRLMTAQNLVSYRSPGRGDCSTNSPVGVSKVLVSGG
910 920 930 940 950 960
120 130 140 150 160 170
pF1KB3 RPHEILEKPSPPQPP--PPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFES----SLC
:. .: . : : :: .... : :.. .. ... :.: : : :
CCDS44 STHNSEKKGDGTQNSANPSPSGGDSAL-----SGELSASLPGLLSDKRDLPASGKSRSDC
970 980 990 1000 1010
180 190 200 210 220 230
pF1KB3 GDLLNEVQASEHTKSKHESRKEKRKKSNKHDSSRSE-ERKSHKIPKLEPEEQNRPNERVD
: ... .: . . :.. .. . ..: .:: ...:.. . . ...
CCDS44 VTRRNCGRSKPSSKLRDAFSAQMVKNTVNRKALKTERKRKLNQLPSVTLDAVLQGDRERG
1020 1030 1040 1050 1060 1070
240 250 260 270 280 290
pF1KB3 TVSEKPREEPVLKEEAPVQPILSSVPTTEVS--TGVKFQVGDLVWSKVGTYPWWPCMVSS
. :.: ..: :.: :.. . . . . . :.:. . . : : .
CCDS44 GSLRGGAEDP--SKEDPLQ-IMGHLTSEDGDHFSDVHFD-SKVKQSDPGKISEKGLSFEN
1080 1090 1100 1110 1120 1130
300 310 320 330 340
pF1KB3 DPQLEVHTKINTRGAREYHVQFFSNQ--PERAW--VHEKRVREYKGHKQYEELLAEATKQ
:. . .:... . : :: :.. : ....:.. : ....: :.
CCDS44 GKGPELDSVMNSENDELNGV----NQVVPKKRWQRLNQRRTKPRKRMNRFKE------KE
1140 1150 1160 1170 1180
350 360 370 380 390 400
pF1KB3 ASNHSEKQKIRKPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQA
:. . . . . :. : .. : . .. .: :: .:. . :.
CCDS44 NSECAFRVLLPSDPVQEGRDEFP---EHRTPSASILEEPLTEQNHADCLDSAGPR-LNVC
1190 1200 1210 1220 1230
410 420 430 440 450 460
pF1KB3 KKSVASKTEVKKTRRPRSVLNTQPEQTNAGEVASSLSSTEIRRHSQRRHTSAEEEEP--P
:: :: ...: .: .. . : :.. : : . ..:. :. .:: .
CCDS44 DKSSASIGDMEK--EP-GIPSLTP-QAELPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFA
1240 1250 1260 1270 1280 1290
470 480 490 500 510
pF1KB3 PVKIAWKT------AAARKSLPASITMHKGSLDLQKCNMSPVVKI-EQVFALQNATGDGK
: : :. ...: . .. ..: . .. . . ... :. .:. ..
CCDS44 PKKKQKKVQEQVHKVSSRCEEESLLARGRSSAQNKQVDENSLISTKEEPPVLER---EAP
1300 1310 1320 1330 1340 1350
520 530 540 550 560 570
pF1KB3 FIDQFVYSTKGIGNKTEISVRGQDRLIISTPNQRNEKPTQSVSSPEATSGSTGSVEKKQQ
:.. . ... :...:. .: .:.: . .: .. : : . :. :.:.:
CCDS44 FLEGPLAQSELGGGHAELP-----QLTLSVPVAPEVSPRPALESEELLVKTPGNYESKRQ
1360 1370 1380 1390 1400
580 590 600 610 620
pF1KB3 RRSIRTRSESEK-STEVVPKKK---IKKE-----QVETVPQATVKTGLQK----GASEIS
:. . ::. . .::: ..:. ..:. . :. .: :...:
CCDS44 RKPTKKLLESNDLDPGFMPKKGDLGLSKKCYEAGHLENGITESCATSYSKDFGGGTTKIF
1410 1420 1430 1440 1450 1460
630 640 650 660 670 680
pF1KB3 DSCKPLKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQ
: :: :.. . . ..: . .. ..: :. .. . . ::. :.. :
CCDS44 D--KPRKRKRQRHAAAKMQCKKVKNDDSSKEIPGSEGELMPHRTATSPKETVEEGVEHDP
1470 1480 1490 1500 1510 1520
690 700 710 720 730 740
pF1KB3 SMDSS---LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFI
.: .: ..:: : . :..::: ::. :. :. ::..:: ::::::::. .: .:::
CCDS44 GMPASKKMQGERGGGAALKENVCQNCEKLGELLL-CEAQCCGAFHLECLGLTEMPRGKFI
1530 1540 1550 1560 1570 1580
750 760 770 780 790 800
pF1KB3 CMECKTGQHPCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSA
: ::.:: : :: :: ::.::::: . ::::::: ::.:.: .....::::: : : .
CCDS44 CNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEECVQKYPPTVMQNKGFRCSLHICIT
1590 1600 1610 1620 1630 1640
810 820 830 840 850
pF1KB3 CSMEKDIH-KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH--SKRSS-NS
: . . .:::::.:::.:::::::..: :.:::: ...: .:: :: .:. :
CCDS44 CHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILASNSIICPNHFTPRRGCRNH
1650 1660 1670 1680 1690 1700
860 870 880 890 900 910
pF1KB3 SAVNVGFCFVCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKC
:::..::::.
CCDS44 EHVNVSWCFVCS------------------------------------------------
1710
920 930 940 950 960 970
pF1KB3 EKGGRLLCCESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAE
.:: ::::.::::.:: :::.:..::: : ::::::::: ::..:::::.: :::::::
CCDS44 -EGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAE
1720 1730 1740 1750 1760 1770
980 990 1000 1010 1020 1030
pF1KB3 ICNPRSVPLNIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQ-TSINKT
::.::.:: ::. ..::.:.:::.::::.:: :.::.:::::.::: : . . ... :
CCDS44 ICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGT
1780 1790 1800 1810 1820 1830
1040 1050 1060 1070 1080 1090
pF1KB3 FKKALEEAAKRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIP
.::::.::: ::.:::::.: .. : .::..:::::::::.:. ::.::: .:::::::
CCDS44 YKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIP
1840 1850 1860 1870 1880 1890
1100 1110 1120 1130 1140 1150
pF1KB3 RCNCKPADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRG
::::: .::::::..:::.:::: ::::: ::::: :::::::.:: ::..::..: .::
CCDS44 RCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRG
1900 1910 1920 1930 1940 1950
1160 1170 1180 1190 1200 1210
pF1KB3 WGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKG
:::::: .::::::::::::::::::::: ::. :.:...:::::::. :::::::::::
CCDS44 WGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKG
1960 1970 1980 1990 2000 2010
1220 1230 1240 1250 1260 1270
pF1KB3 NYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCG
::.::::: :.::::::::.::::.::::::: :: :: ::::::::.:::::.: :.::
CCDS44 NYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCG
2020 2030 2040 2050 2060 2070
1280 1290 1300 1310 1320 1330
pF1KB3 ADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMC
: :::::::::::. .:.:.. : : .: .:. . : . .:: ::.:::.:.:: :
CCDS44 APNCSGFLGVRPKNQPIATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSC
2080 2090 2100 2110 2120 2130
1340 1350 1360 1370 1380 1390
pF1KB3 DKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVP
: :::.:: :::::. : ::::::::::: :.. :.::::.:: ::::.:..: :
CCDS44 KKPGCPKVYHADCLNLTKRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFI
2140 2150 2160 2170 2180 2190
1400 1410 1420 1430
pF1KB3 SALEGRLCCSEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
: :.::: :.:::: .:
CCDS44 SKLDGRLSCTEHDPCGPNPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDK
2200 2210 2220 2230 2240 2250
>>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564 aa)
initn: 843 init1: 587 opt: 672 Z-score: 425.8 bits: 92.2 E(32554): 2.1e-17
Smith-Waterman score: 672; 35.8% identity (66.2% similar) in 293 aa overlap (1021-1313:1433-1712)
1000 1010 1020 1030 1040 1050
pF1KB3 LKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDKSFAEGQTSINKTFKKALEEAAKRFQE
.:. : :.. .. . . .:..:
CCDS27 PLKKRRQEIESDSESDGELQDRKKVRVEVEQGETSVPPGSALVGPSCVMDDFRDPQRWKE
1410 1420 1430 1440 1450 1460
1060 1070 1080 1090 1100 1110
pF1KB3 LKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADENPCGL
: . ... ... :. :... : ..: . . ::. : . : ::
CCDS27 CAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRMQCECTPLSKDERAQ----GEIACG-
1470 1480 1490 1500 1510
1120 1130 1140 1150 1160 1170
pF1KB3 ESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSIKKGEF
.::::.:. :: . :: :: :.:. : .. . :.:.: ::..:::::. ... .. :
CCDS27 -EDCLNRLLMIECSSR-CPNGDYCSNRRFQRKQHADVEVILTEKKGWGLRAAKDLPSNTF
1520 1530 1540 1550 1560 1570
1180 1190 1200 1210 1220 1230
pF1KB3 VNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHSCNPNC
: :: ::..:..: . :.:. .:. ..:.... .:.:::: ::: ::::::::.:::
CCDS27 VLEYCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCSRFMNHSCEPNC
1580 1590 1600 1610 1620 1630
1240 1250 1260 1270 1280 1290
pF1KB3 ETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLGVRPKS
:::::::::..:::.:. .:.: ::::.:... :. .: ::. :: :.:: . .
CCDS27 ETQKWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQKCFCGSANCRGYLGGENRV
1640 1650 1660 1670 1680 1690
1300 1310 1320 1330 1340 1350
pF1KB3 ACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAYHLLCL
. .: ..:.:..: . :
CCDS27 SI------RAAGGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLMVRIETLE
1700 1710 1720 1730 1740
>>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964 aa)
initn: 500 init1: 332 opt: 658 Z-score: 416.1 bits: 90.6 E(32554): 7.4e-17
Smith-Waterman score: 658; 38.3% identity (69.0% similar) in 261 aa overlap (1068-1321:2062-2316)
1040 1050 1060 1070 1080 1090
pF1KB3 KKALEEAAKRFQELKAQRESKEALEIEKNSRKP--PPYKHIKANKVIGKVQIQVADLS--
.:: : ::.:..: : ..: ::
CCDS11 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSN-----VYVDVKPLSGY
2040 2050 2060 2070 2080
1100 1110 1120 1130 1140 1150
pF1KB3 EIPRCNCK-PADENPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDA-EIIK
: :::: : :.. : ..:::::. :: :..:: :..: :: . .. . . : ..
CCDS11 EATTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFR
2090 2100 2110 2120 2130 2140
1160 1170 1180 1190 1200 1210
pF1KB3 TERRGWGLRTKRSIKKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIID
.:..:::.:::. .: :.:. ::.::...:.: : :. . ..: .. : :.. . .::
CCDS11 AEEKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNH-SDHYCLNLDSGMVID
2150 2160 2170 2180 2190 2200
1220 1230 1240 1250 1260 1270
pF1KB3 AGPKGNYSRFMNHSCNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRT
. :: .::.::::.:::: :::.::: :.::.:: :.::: :::..::. .. .
CCDS11 SYRMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQ
2210 2220 2230 2240 2250 2260
1280 1290 1300 1310 1320 1330
pF1KB3 E-CHCGADNCSGFLGVRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDG
. :.:: ..: :..: . . . . :. .... ..: . : . :. :.
CCDS11 QLCKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLS
2270 2280 2290 2300 2310 2320
1340 1350 1360 1370 1380 1390
pF1KB3 GELVMCDKKDCPKAYHLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHE
CCDS11 EEPSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHS
2330 2340 2350 2360 2370 2380
>>CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 (629 aa)
initn: 776 init1: 323 opt: 560 Z-score: 364.4 bits: 78.8 E(32554): 5.6e-14
Smith-Waterman score: 772; 31.1% identity (59.3% similar) in 604 aa overlap (98-663:66-628)
70 80 90 100 110 120
pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
:: :. : :.: . :.. : .: :
CCDS46 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
40 50 60 70 80 90
130 140 150 160 170 180
pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
. . : ..: .. : :.:::::::::::: .::. :::::.::: .:.
CCDS46 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
100 110 120 130 140 150
190 200 210 220 230 240
pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
::.. .: :.. ...::.: :.:: . . . .... :.: .
CCDS46 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
160 170 180 190 200
250 260 270 280 290
pF1KB3 PVLKEEAPVQPILSSVPTT--EVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTK
:. :: : :.: . . .:..:::::::::. :::::::::.:: :. .::
CCDS46 PAKKE---------SCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTK
210 220 230 240 250
300 310 320 330 340 350
pF1KB3 IN--TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIR
.. ..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :.
CCDS46 LKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLL
260 270 280 290 300 310
360 370 380 390 400 410
pF1KB3 KPRPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVK
:: . ::::..::..::.: .:. ::: ..::.:. : . . ::.. . .
CCDS46 KPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLG
320 330 340 350 360 370
420 430 440 450 460 470
pF1KB3 KTRRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWK
. . .: . .:.: .:. : ::. . .::: : : . :
CCDS46 EMAESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQK
380 390 400 410 420
480 490 500 510 520
pF1KB3 TAAA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI
:: : :... . .: .... . . ... :: .. :. :
CCDS46 TAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDA
430 440 450 460 470
530 540 550 560 570 580
pF1KB3 -GNKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSES
:.. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .
CCDS46 SGEEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPT
480 490 500 510 520 530
590 600 610 620
pF1KB3 EKS-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKP
: . .: .:.:... .. .:. . :..:. : .....::.:::
CCDS46 EDAEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKP
540 550 560 570 580 590
630 640 650 660 670 680
pF1KB3 LKKRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQSMDSS
::::.:::: . .:. . :.: : .:.. .:
CCDS46 LKKRNRASTAA--SSALGFSKSSSPSASLTENEVK
600 610 620
690 700 710 720 730 740
pF1KB3 LSRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQ
>>CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 (647 aa)
initn: 776 init1: 323 opt: 560 Z-score: 364.2 bits: 78.8 E(32554): 5.7e-14
Smith-Waterman score: 769; 31.0% identity (58.6% similar) in 594 aa overlap (98-655:66-622)
70 80 90 100 110 120
pF1KB3 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
:: :. : :.: . :.. : .: :
CCDS33 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
40 50 60 70 80 90
130 140 150 160 170 180
pF1KB3 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
. . : ..: .. : :.:::::::::::: .::. :::::.::: .:.
CCDS33 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
100 110 120 130 140 150
190 200 210 220 230 240
pF1KB3 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
::.. .: :.. ...::.: :.:: . . . .... :.: .
CCDS33 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
160 170 180 190 200
250 260 270 280 290 300
pF1KB3 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
:. :: : . . .:..:::::::::. :::::::::.:: :. .::..
CCDS33 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
210 220 230 240 250
310 320 330 340 350
pF1KB3 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. ::
CCDS33 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
260 270 280 290 300 310
360 370 380 390 400 410
pF1KB3 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
. ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . .
CCDS33 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
320 330 340 350 360 370
420 430 440 450 460 470
pF1KB3 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
. .: . .:.: .:. : ::. . .::: : : . :::
CCDS33 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
380 390 400 410 420
480 490 500 510 520 530
pF1KB3 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G
: :... . .: .... . . ... :: : :. : :
CCDS33 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFC-------QKHRDEVVAEHPDASG
430 440 450 460 470 480
540 550 560 570 580
pF1KB3 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
.. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .:
CCDS33 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
490 500 510 520 530
590 600 610 620 630
pF1KB3 S-TEVVPKKKIKKEQ-----VETVPQATVKTGL------------QKGASEISDSCKPLK
. .: .:.:... .. .:. . :..:. : .....::.:::::
CCDS33 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
540 550 560 570 580 590
640 650 660 670 680 690
pF1KB3 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQVDSPSATADADVSDVQSMDSSLS
::.:::: . . . ...: : :
CCDS33 KRNRASTAASSALGFSKSSSPSASLTENELLWEPTPVKLDLNPAALYCT
600 610 620 630 640
1437 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 22:46:59 2016 done: Wed Nov 2 22:47:00 2016
Total Scan time: 4.700 Total Display time: 0.370
Function used was FASTA [36.3.4 Apr, 2011]