FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1090, 1365 aa
1>>>pF1KA1090 1365 - 1365 aa - 1365 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.4937+/-0.00099; mu= 14.7143+/- 0.060
mean_var=173.6466+/-34.979, 0's: 0 Z-trim(110.8): 104 B-trim: 0 in 0/51
Lambda= 0.097329
statistics sampled from 11802 (11906) to 11802 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.703), E-opt: 0.2 (0.366), width: 16
Scan time: 4.250
The best scores are: opt bits E(32554)
CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365) 9510 1348.8 0
CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 ( 629) 4107 589.8 7.7e-168
CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 ( 647) 4104 589.4 1.1e-167
CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427) 3606 520.0 3.1e-146
CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696) 3606 520.1 3.4e-146
CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437) 2691 391.3 1e-107
CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564) 706 112.8 1.2e-23
CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964) 648 104.7 3.9e-21
CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 ( 645) 545 89.7 2.9e-17
>>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365 aa)
initn: 9510 init1: 9510 opt: 9510 Z-score: 7222.5 bits: 1348.8 E(32554): 0
Smith-Waterman score: 9510; 100.0% identity (100.0% similar) in 1365 aa overlap (1-1365:1-1365)
10 20 30 40 50 60
pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 KESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 KMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKG
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA1 GSLLCCESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GSLLCCESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCH
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA1 PKNVPPNIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PKNVPPNIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKN
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KA1 ALQEAEARFREIKLQREARETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ALQEAEARFREIKLQREARETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKP
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KA1 TDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAK
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KA1 RDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFM
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KA1 NHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSG
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KA1 FLGDRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FLGDRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCT
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KA1 KAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGR
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360
pF1KA1 SYCCEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
:::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SYCCEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
1330 1340 1350 1360
>>CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 (629 aa)
initn: 4107 init1: 4107 opt: 4107 Z-score: 3126.7 bits: 589.8 E(32554): 7.7e-168
Smith-Waterman score: 4107; 100.0% identity (100.0% similar) in 628 aa overlap (1-628:1-628)
10 20 30 40 50 60
pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
::::::::::::::::::::::::::::
CCDS46 NRASTAASSALGFSKSSSPSASLTENEVK
610 620
>>CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 (647 aa)
initn: 4103 init1: 4103 opt: 4104 Z-score: 3124.3 bits: 589.4 E(32554): 1.1e-167
Smith-Waterman score: 4104; 99.4% identity (99.5% similar) in 632 aa overlap (1-632:1-632)
10 20 30 40 50 60
pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER
:::::::::::::::::::::::::::. :
CCDS33 NRASTAASSALGFSKSSSPSASLTENELLWEPTPVKLDLNPAALYCT
610 620 630 640
670 680 690 700 710 720
pF1KA1 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC
>>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427 aa)
initn: 2268 init1: 1856 opt: 3606 Z-score: 2738.8 bits: 520.0 E(32554): 3.1e-146
Smith-Waterman score: 3606; 62.9% identity (82.3% similar) in 770 aa overlap (595-1348:1198-1961)
570 580 590 600 610 620
pF1KA1 KTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKRNRASTAASSALGFSKSSSPSASLT
:: .::.: ::.. . .: .. ..:
CCDS44 EAGHLENGITESCATSYSKDFGGGTTKIFDKP-RKRKRQRHAAAK-MQCKKVKNDDSS--
1170 1180 1190 1200 1210 1220
630 640 650 660 670
pF1KA1 ENEVSDSPGD----EPSESPYESADE-TQTEVSV-SSKK--SERGVTAK-KEYVCQLCEK
.:. : :. . . :: :...: .. . .. .::: .::: : :: ::: :::
CCDS44 -KEIPGSEGELMPHRTATSPKETVEEGVEHDPGMPASKKMQGERGGGAALKENVCQNCEK
1230 1240 1250 1260 1270 1280
680 690 700 710 720 730
pF1KA1 PGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVCKESKTDVKRCVVTQC
: :::::. ::::::: ::::.. :.:.: :.:: .:::.:::::.: :::::.. :
CCDS44 LGELLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLC
1290 1300 1310 1320 1330 1340
740 750 760 770 780 790
pF1KA1 GKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKGKMMRCVRCPVAYHSG
:::::: ::.::: ::....:::: :: :..:::.::.: :::..:::::::::::..
CCDS44 GKFYHEECVQKYPPTVMQNKGFRCSLHICITCHAANPANVSASKGRLMRCVRCPVAYHAN
1350 1360 1370 1380 1390 1400
800 810 820 830 840 850
pF1KA1 DACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKGGSLLCCESCPAAFHP
: ::::: ...::::::: ::: :.: :.: :::::::::::.:::::::.:::::::
CCDS44 DFCLAAGSKILASNSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHR
1410 1420 1430 1440 1450 1460
860 870 880 890 900 910
pF1KA1 DCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPPNIQKMKHEI
.::::..:.:.:.::::.:::: :...:.:::.: :::::::.:::. :: ::.::.:..
CCDS44 ECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDV
1470 1480 1490 1500 1510 1520
920 930 940 950 960 970
pF1KA1 GEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAEARFREIKLQ
:::::.::::.:: :::::::::::::: .:. . .:. ..:.::::: :::.:.: :
CCDS44 GEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQ
1530 1540 1550 1560 1570 1580
980 990 1000 1010 1020 1030
pF1KA1 REARETQE---SERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENPCGFDSEC
.: :. :: ...:::::::::::.: :.:::.:::.::::.:::: :::::::.::::
CCDS44 KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSEC
1590 1600 1610 1620 1630 1640
1040 1050 1060 1070 1080 1090
pF1KA1 LNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNEY
.::::..:::: ::::: ::::::.::::::..:..: .:::: .: ::.::::::::
CCDS44 INRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEY
1650 1660 1670 1680 1690 1700
1100 1110 1120 1130 1140 1150
pF1KA1 VGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETLK
:::::::::: :::..:.:.:::.:::::.::::::::::::::.::::: ::::::: :
CCDS44 VGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQK
1710 1720 1730 1740 1750 1760
1160 1170 1180 1190 1200 1210
pF1KA1 WTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTTL
:.:::::::::::. :: :::::::::::.:::: ::::.::: ::::::: ::: . .
CCDS44 WSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLGVRPK-NQPI
1770 1780 1790 1800 1810 1820
1220 1230 1240 1250 1260 1270
pF1KA1 SSEEKGKKTKKKTR-RRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAYHLSCLGLG
..:::.:: ::: . .::..:: .. ::::: :::.:::: : . : :.:: .::.:
CCDS44 ATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLT
1830 1840 1850 1860 1870 1880
1280 1290 1300 1310 1320 1330
pF1KA1 KRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD-LGA
::: ::::::::.::.::: ..:::..::.::::.:..: : ::: : ::: :
CCDS44 KRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTEHDPCGP
1890 1900 1910 1920 1930 1940
1340 1350 1360
pF1KA1 ASVRSTKTEK--PPPEPGKPKGKRRRRRGWRRVTEGK
.. . .. ::: : :
CCDS44 NPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDKPPADTNQMLSLSKKALA
1950 1960 1970 1980 1990 2000
>>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696 aa)
initn: 2340 init1: 1856 opt: 3606 Z-score: 2738.2 bits: 520.1 E(32554): 3.4e-146
Smith-Waterman score: 3606; 62.9% identity (82.3% similar) in 770 aa overlap (595-1348:1467-2230)
570 580 590 600 610 620
pF1KA1 KTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKRNRASTAASSALGFSKSSSPSASLT
:: .::.: ::.. . .: .. ..:
CCDS44 EAGHLENGITESCATSYSKDFGGGTTKIFDKP-RKRKRQRHAAAK-MQCKKVKNDDSS--
1440 1450 1460 1470 1480 1490
630 640 650 660 670
pF1KA1 ENEVSDSPGD----EPSESPYESADE-TQTEVSV-SSKK--SERGVTAK-KEYVCQLCEK
.:. : :. . . :: :...: .. . .. .::: .::: : :: ::: :::
CCDS44 -KEIPGSEGELMPHRTATSPKETVEEGVEHDPGMPASKKMQGERGGGAALKENVCQNCEK
1500 1510 1520 1530 1540 1550
680 690 700 710 720 730
pF1KA1 PGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVCKESKTDVKRCVVTQC
: :::::. ::::::: ::::.. :.:.: :.:: .:::.:::::.: :::::.. :
CCDS44 LGELLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLC
1560 1570 1580 1590 1600 1610
740 750 760 770 780 790
pF1KA1 GKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKGKMMRCVRCPVAYHSG
:::::: ::.::: ::....:::: :: :..:::.::.: :::..:::::::::::..
CCDS44 GKFYHEECVQKYPPTVMQNKGFRCSLHICITCHAANPANVSASKGRLMRCVRCPVAYHAN
1620 1630 1640 1650 1660 1670
800 810 820 830 840 850
pF1KA1 DACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKGGSLLCCESCPAAFHP
: ::::: ...::::::: ::: :.: :.: :::::::::::.:::::::.:::::::
CCDS44 DFCLAAGSKILASNSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHR
1680 1690 1700 1710 1720 1730
860 870 880 890 900 910
pF1KA1 DCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPPNIQKMKHEI
.::::..:.:.:.::::.:::: :...:.:::.: :::::::.:::. :: ::.::.:..
CCDS44 ECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDV
1740 1750 1760 1770 1780 1790
920 930 940 950 960 970
pF1KA1 GEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAEARFREIKLQ
:::::.::::.:: :::::::::::::: .:. . .:. ..:.::::: :::.:.: :
CCDS44 GEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQ
1800 1810 1820 1830 1840 1850
980 990 1000 1010 1020 1030
pF1KA1 REARETQE---SERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENPCGFDSEC
.: :. :: ...:::::::::::.: :.:::.:::.::::.:::: :::::::.::::
CCDS44 KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSEC
1860 1870 1880 1890 1900 1910
1040 1050 1060 1070 1080 1090
pF1KA1 LNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNEY
.::::..:::: ::::: ::::::.::::::..:..: .:::: .: ::.::::::::
CCDS44 INRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEY
1920 1930 1940 1950 1960 1970
1100 1110 1120 1130 1140 1150
pF1KA1 VGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETLK
:::::::::: :::..:.:.:::.:::::.::::::::::::::.::::: ::::::: :
CCDS44 VGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQK
1980 1990 2000 2010 2020 2030
1160 1170 1180 1190 1200 1210
pF1KA1 WTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTTL
:.:::::::::::. :: :::::::::::.:::: ::::.::: ::::::: ::: . .
CCDS44 WSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLGVRPK-NQPI
2040 2050 2060 2070 2080 2090
1220 1230 1240 1250 1260 1270
pF1KA1 SSEEKGKKTKKKTR-RRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAYHLSCLGLG
..:::.:: ::: . .::..:: .. ::::: :::.:::: : . : :.:: .::.:
CCDS44 ATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLT
2100 2110 2120 2130 2140 2150
1280 1290 1300 1310 1320 1330
pF1KA1 KRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD-LGA
::: ::::::::.::.::: ..:::..::.::::.:..: : ::: : ::: :
CCDS44 KRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTEHDPCGP
2160 2170 2180 2190 2200 2210
1340 1350 1360
pF1KA1 ASVRSTKTEK--PPPEPGKPKGKRRRRRGWRRVTEGK
.. . .. ::: : :
CCDS44 NPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDKPPADTNQMLSLSKKALA
2220 2230 2240 2250 2260 2270
>>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437 aa)
initn: 3744 init1: 1867 opt: 2691 Z-score: 2047.4 bits: 391.3 E(32554): 1e-107
Smith-Waterman score: 4037; 46.5% identity (69.4% similar) in 1354 aa overlap (66-1327:98-1409)
40 50 60 70 80 90
pF1KA1 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
:: :. : :.: . :.. : .: :
CCDS43 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
70 80 90 100 110 120
100 110 120 130 140 150
pF1KA1 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
. . : ..: .. : :.:::::::::::: .::. :::::.::: .:.
CCDS43 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
130 140 150 160 170 180
160 170 180 190 200
pF1KA1 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
::.. .: :.. ...::.: :.:: . . . .... :.: .
CCDS43 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
190 200 210 220 230 240
210 220 230 240 250
pF1KA1 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
:. :: : . . .:..:::::::::. :::::::::.:: :. .::..
CCDS43 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
250 260 270 280 290 300
260 270 280 290 300 310
pF1KA1 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. ::
CCDS43 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
310 320 330 340 350
320 330 340 350 360 370
pF1KA1 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
. ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . .
CCDS43 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
360 370 380 390 400 410
380 390 400 410 420
pF1KA1 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
. .: . .:.: .:. : ::. . .::: : : . :::
CCDS43 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
420 430 440 450 460 470
430 440 450 460 470 480
pF1KA1 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDASG
: :... . .: .... . . ... :: .. :. : :
CCDS43 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G
480 490 500 510 520 530
490 500 510 520 530
pF1KA1 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
.. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .:
CCDS43 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
540 550 560 570 580
540 550 560 570 580 590
pF1KA1 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
. .: .:.:... . . .:. . :..:. : .....::.:::::
CCDS43 S-TEVVPKKKIKKE-----QVETVPQATVKTGL------------QKGASEISDSCKPLK
590 600 610 620 630
600 610 620 630 640 650
pF1KA1 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEV-SVSSKK
::.:::: . . . ...: : : .... . : . .:: .:: ..: :..:.
CCDS43 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQ-VDSPSATADADVSDVQSMDSSL
640 650 660 670 680 690
660 670 680 690 700 710
pF1KA1 SERGV-TAKKEYVCQLCEKPG-SLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIH
:.::. .::. :::.::. : ::. ::: :: ::: ::::. :...: : :: .: :
CCDS43 SRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQH
700 710 720 730 740 750
720 730 740 750 760 770
pF1KA1 SCFVCKESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNP
:: :: : ::::: : ::::::::::.:.: ..:::.::::: : : .: . .
CCDS43 PCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSACSMEKDIH-
760 770 780 790 800
780 790 800 810 820 830
pF1KA1 RPSKGKMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCF
. :::.::::.::::::::::::.::: ...: .::. : : . . . :::..::
CCDS43 KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH---SKRSSNSSAVNVGFCF
810 820 830 840 850 860
840
pF1KA1 VCS-------------------------------------------------KGGSLLCC
::. ::: ::::
CCDS43 VCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKCEKGGRLLCC
870 880 890 900 910 920
850 860 870 880 890 900
pF1KA1 ESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPP
:::::.:::.::.::::.: : ::::.::::::...:.:::::::::::::.:.:..::
CCDS43 ESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAEICNPRSVPL
930 940 950 960 970 980
910 920 930 940 950 960
pF1KA1 NIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAE
::: .::..:.::::::::.::::.::.:::::.:::. : .: .:...::.::.::
CCDS43 NIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDK-SFAEGQTSINKTFKKALEEAA
990 1000 1010 1020 1030 1040
970 980 990 1000 1010 1020
pF1KA1 ARFREIKLQREARETQESE---RKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDE
::.:.: :::..:. : : ::::::::::.:: ::::: .::.::::.:::::.::
CCDS43 KRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADE
1050 1060 1070 1080 1090 1100
1030 1040 1050 1060 1070 1080
pF1KA1 NPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDI
::::..::::::::..::::::::::. ::::::::: ::...::::. .:::: .::.:
CCDS43 NPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSI
1110 1120 1130 1140 1150 1160
1090 1100 1110 1120 1130 1140
pF1KA1 RKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHS
.:::::::::::::::::: :::.::::..:.:::::. ::::::::::::::::::::
CCDS43 KKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHS
1170 1180 1190 1200 1210 1220
1150 1160 1170 1180 1190 1200
pF1KA1 CQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLG
:.::::: :::::::.::::::.:::::: ::::::::::::: .: :.:::.:::::::
CCDS43 CNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLG
1230 1240 1250 1260 1270 1280
1210 1220 1230 1240 1250 1260
pF1KA1 DRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAY
:::.. . ..:::.:..: : .::. : : :.. :: ::.:::::.::.::.: : :::
CCDS43 VRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAY
1290 1300 1310 1320 1330 1340
1270 1280 1290 1300 1310 1320
pF1KA1 HLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYC
:: ::.: . :.::::::::.:: :.. ..:::..::.::::.:. :. . .:: :
CCDS43 HLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVPSALEGRLCC
1350 1360 1370 1380 1390 1400
1330 1340 1350 1360
pF1KA1 CEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK
:::
CCDS43 SEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE
1410 1420 1430
>>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564 aa)
initn: 703 init1: 604 opt: 706 Z-score: 537.8 bits: 112.8 E(32554): 1.2e-23
Smith-Waterman score: 706; 40.3% identity (69.2% similar) in 273 aa overlap (1009-1270:1493-1757)
980 990 1000 1010 1020 1030
pF1KA1 RETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENP-------CGFDSE
::... .:.: : ... :: :
CCDS27 CAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRM-QCECTPLSKDERAQGEIACGED--
1470 1480 1490 1500 1510
1040 1050 1060 1070 1080 1090
pF1KA1 CLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNE
::::.::.:: . :: :..:.:. : ..:. ....: :. ::::: : .:. .. :: :
CCDS27 CLNRLLMIECSSR-CPNGDYCSNRRFQRKQHADVEVILTEKKGWGLRAAKDLPSNTFVLE
1520 1530 1540 1550 1560 1570
1100 1110 1120 1130 1140 1150
pF1KA1 YVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETL
: ::..:..: ::.:. .: :.:.... .:.:::: ::: ::::::::.:::::
CCDS27 YCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCSRFMNHSCEPNCETQ
1580 1590 1600 1610 1620 1630
1160 1170 1180 1190 1200 1210
pF1KA1 KWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTT
::::::. :::.:.. .:.:.::::.:... :.: : ::..:: :.:: . ..:
CCDS27 KWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQKCFCGSANCRGYLGGENRVSIR
1640 1650 1660 1670 1680 1690
1220 1230 1240 1250 1260
pF1KA1 LSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFR-CGDGGQLVLCDR---KFCTKAYHLSC
. : : ::. :.. . .:. .. : . .: .:.. .: .. : .:.:
CCDS27 AA----GGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLMVRIETLEQKLTC
1700 1710 1720 1730 1740 1750
1270 1280 1290 1300 1310 1320
pF1KA1 LGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD
: :
CCDS27 LELIQNTHSQSCLKSFLERHGLSLLWIWMAELGDGRESNQKLQEEIIKTLEHLPIPTKNM
1760 1770 1780 1790 1800 1810
>>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964 aa)
initn: 407 init1: 358 opt: 648 Z-score: 493.0 bits: 104.7 E(32554): 3.9e-21
Smith-Waterman score: 648; 38.6% identity (69.1% similar) in 259 aa overlap (986-1237:2062-2316)
960 970 980 990 1000 1010
pF1KA1 RVFKNALQEAEARFREIKLQREARETQESERKP--PPYKHIKVNKPYGKVQIYTADISEI
.:: : ::.:. : : :. .. :
CCDS11 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNV-YVDVKPLSG--YEA
2040 2050 2060 2070 2080
1020 1030 1040 1050 1060 1070
pF1KA1 PKCNCK-PTDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPET-KIIKTD
:::: : :.. : ..:::::.. :: :..:: :: : :: . .... . . ....
CCDS11 TTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAE
2090 2100 2110 2120 2130 2140
1080 1090 1100 1110 1120 1130
pF1KA1 GKGWGLVAKRDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAG
::::. .:. .. :.:. ::.::...:.: :. . ..: : : :..:. .::.
CCDS11 EKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDH-YCLNLDSGMVIDSY
2150 2160 2170 2180 2190 2200
1140 1150 1160 1170 1180 1190
pF1KA1 PKGNYSRFMNHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKT-V
:: .::.::::.:::: ::.::: :.::.:. :.:::::::..::. .. :: .
CCDS11 RMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQL
2210 2220 2230 2240 2250 2260
1200 1210 1220 1230 1240
pF1KA1 CRCGASNCSGFLGDRPKTSTTLSSEEKGKK--TKKKTRRRRAKGEGKRQSEDECFRCGDG
:.:: .: :..: . . . :.: .... :.::. : . : ..:..
CCDS11 CKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEE
2270 2280 2290 2300 2310 2320
1250 1260 1270 1280 1290 1300
pF1KA1 GQLVLCDRKFCTKAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQ
CCDS11 PSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSAS
2330 2340 2350 2360 2370 2380
>>CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 (645 aa)
initn: 692 init1: 323 opt: 545 Z-score: 423.5 bits: 89.7 E(32554): 2.9e-17
Smith-Waterman score: 710; 29.3% identity (58.9% similar) in 564 aa overlap (66-592:98-642)
40 50 60 70 80 90
pF1KA1 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH
:: :. : :.: . :.. : .: :
CCDS61 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H
70 80 90 100 110 120
100 110 120 130 140 150
pF1KA1 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ
. . : ..: .. : :.:::::::::::: .::. :::::.::: .:.
CCDS61 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA
130 140 150 160 170 180
160 170 180 190 200
pF1KA1 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI
::.. .: :.. ...::.: :.:: . . . .... :.: .
CCDS61 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE
190 200 210 220 230 240
210 220 230 240 250
pF1KA1 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK
:. :: : . . .:..:::::::::. :::::::::.:: :. .::..
CCDS61 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN
250 260 270 280 290 300
260 270 280 290 300 310
pF1KA1 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP
..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. ::
CCDS61 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP
310 320 330 340 350
320 330 340 350 360 370
pF1KA1 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM
. ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . .
CCDS61 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT
360 370 380 390 400 410
380 390 400 410 420
pF1KA1 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA
. .: . .:.: .:. : ::. . .::: : : . :::
CCDS61 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA
420 430 440 450 460 470
430 440 450 460 470 480
pF1KA1 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDASG
: :... . .: .... . . ... :: .. :. : . :
CCDS61 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYS-TKGIG
480 490 500 510 520 530
490 500 510 520 530
pF1KA1 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED
.. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .:
CCDS61 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK
540 550 560 570 580
540 550 560 570 580 590
pF1KA1 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK
. .: .:.:... .. . :. . :. ...... ....... . .
CCDS61 S-TEVVPKKKIKKEQVETVPQATVKTGLQKGSADRGVQGSVRFSDSSVSAAIEETVD
590 600 610 620 630 640
600 610 620 630 640 650
pF1KA1 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKS
1365 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 20:27:08 2016 done: Wed Nov 2 20:27:09 2016
Total Scan time: 4.250 Total Display time: 0.340
Function used was FASTA [36.3.4 Apr, 2011]