FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1090, 1365 aa 1>>>pF1KA1090 1365 - 1365 aa - 1365 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4937+/-0.00099; mu= 14.7143+/- 0.060 mean_var=173.6466+/-34.979, 0's: 0 Z-trim(110.8): 104 B-trim: 0 in 0/51 Lambda= 0.097329 statistics sampled from 11802 (11906) to 11802 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.703), E-opt: 0.2 (0.366), width: 16 Scan time: 4.250 The best scores are: opt bits E(32554) CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365) 9510 1348.8 0 CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 ( 629) 4107 589.8 7.7e-168 CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 ( 647) 4104 589.4 1.1e-167 CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427) 3606 520.0 3.1e-146 CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696) 3606 520.1 3.4e-146 CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437) 2691 391.3 1e-107 CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564) 706 112.8 1.2e-23 CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964) 648 104.7 3.9e-21 CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 ( 645) 545 89.7 2.9e-17 >>CCDS33940.1 WHSC1 gene_id:7468|Hs108|chr4 (1365 aa) initn: 9510 init1: 9510 opt: 9510 Z-score: 7222.5 bits: 1348.8 E(32554): 0 Smith-Waterman score: 9510; 100.0% identity (100.0% similar) in 1365 aa overlap (1-1365:1-1365) 10 20 30 40 50 60 pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 KESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 KMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKG 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 GSLLCCESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GSLLCCESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCH 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 PKNVPPNIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PKNVPPNIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKN 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KA1 ALQEAEARFREIKLQREARETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ALQEAEARFREIKLQREARETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKP 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KA1 TDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAK 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KA1 RDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFM 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KA1 NHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSG 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KA1 FLGDRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FLGDRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCT 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KA1 KAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGR 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 pF1KA1 SYCCEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK ::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SYCCEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK 1330 1340 1350 1360 >>CCDS46999.1 WHSC1 gene_id:7468|Hs108|chr4 (629 aa) initn: 4107 init1: 4107 opt: 4107 Z-score: 3126.7 bits: 589.8 E(32554): 7.7e-168 Smith-Waterman score: 4107; 100.0% identity (100.0% similar) in 628 aa overlap (1-628:1-628) 10 20 30 40 50 60 pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER :::::::::::::::::::::::::::: CCDS46 NRASTAASSALGFSKSSSPSASLTENEVK 610 620 >>CCDS3356.1 WHSC1 gene_id:7468|Hs108|chr4 (647 aa) initn: 4103 init1: 4103 opt: 4104 Z-score: 3124.3 bits: 589.4 E(32554): 1.1e-167 Smith-Waterman score: 4104; 99.4% identity (99.5% similar) in 632 aa overlap (1-632:1-632) 10 20 30 40 50 60 pF1KA1 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MEFSIKQSPLSVQSVVKCIKMKQAPEILGSANGKTPSCEVNRECSVFLSKAQLSSSLQEG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VMQKFNGHDALPFIPADKLKDLTSRVFNGEPGAHDAKLRFESQEMKGIGTPPNTTPIKNG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SPEIKLKITKTYMNGKPLFESSICGDSAADVSQSEENGQKPENKARRNRKRSIKYDSLLE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QGLVEAALVSKISSPSDKKIPAKKESCPNTGRDKDHLLKYNVGDLVWSKVSGYPWWPCMV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 APTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KEAGIAAESLGEMAESSGVSEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 STPQKTAEADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHRDEVVAEHPDASG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EEIEELLRSQWSLLSEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTEDAE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 NRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKSER :::::::::::::::::::::::::::. : CCDS33 NRASTAASSALGFSKSSSPSASLTENELLWEPTPVKLDLNPAALYCT 610 620 630 640 670 680 690 700 710 720 pF1KA1 GVTAKKEYVCQLCEKPGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVC >>CCDS4413.1 NSD1 gene_id:64324|Hs108|chr5 (2427 aa) initn: 2268 init1: 1856 opt: 3606 Z-score: 2738.8 bits: 520.0 E(32554): 3.1e-146 Smith-Waterman score: 3606; 62.9% identity (82.3% similar) in 770 aa overlap (595-1348:1198-1961) 570 580 590 600 610 620 pF1KA1 KTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKRNRASTAASSALGFSKSSSPSASLT :: .::.: ::.. . .: .. ..: CCDS44 EAGHLENGITESCATSYSKDFGGGTTKIFDKP-RKRKRQRHAAAK-MQCKKVKNDDSS-- 1170 1180 1190 1200 1210 1220 630 640 650 660 670 pF1KA1 ENEVSDSPGD----EPSESPYESADE-TQTEVSV-SSKK--SERGVTAK-KEYVCQLCEK .:. : :. . . :: :...: .. . .. .::: .::: : :: ::: ::: CCDS44 -KEIPGSEGELMPHRTATSPKETVEEGVEHDPGMPASKKMQGERGGGAALKENVCQNCEK 1230 1240 1250 1260 1270 1280 680 690 700 710 720 730 pF1KA1 PGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVCKESKTDVKRCVVTQC : :::::. ::::::: ::::.. :.:.: :.:: .:::.:::::.: :::::.. : CCDS44 LGELLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLC 1290 1300 1310 1320 1330 1340 740 750 760 770 780 790 pF1KA1 GKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKGKMMRCVRCPVAYHSG :::::: ::.::: ::....:::: :: :..:::.::.: :::..:::::::::::.. CCDS44 GKFYHEECVQKYPPTVMQNKGFRCSLHICITCHAANPANVSASKGRLMRCVRCPVAYHAN 1350 1360 1370 1380 1390 1400 800 810 820 830 840 850 pF1KA1 DACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKGGSLLCCESCPAAFHP : ::::: ...::::::: ::: :.: :.: :::::::::::.:::::::.::::::: CCDS44 DFCLAAGSKILASNSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHR 1410 1420 1430 1440 1450 1460 860 870 880 890 900 910 pF1KA1 DCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPPNIQKMKHEI .::::..:.:.:.::::.:::: :...:.:::.: :::::::.:::. :: ::.::.:.. CCDS44 ECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDV 1470 1480 1490 1500 1510 1520 920 930 940 950 960 970 pF1KA1 GEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAEARFREIKLQ :::::.::::.:: :::::::::::::: .:. . .:. ..:.::::: :::.:.: : CCDS44 GEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQ 1530 1540 1550 1560 1570 1580 980 990 1000 1010 1020 1030 pF1KA1 REARETQE---SERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENPCGFDSEC .: :. :: ...:::::::::::.: :.:::.:::.::::.:::: :::::::.:::: CCDS44 KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSEC 1590 1600 1610 1620 1630 1640 1040 1050 1060 1070 1080 1090 pF1KA1 LNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNEY .::::..:::: ::::: ::::::.::::::..:..: .:::: .: ::.:::::::: CCDS44 INRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEY 1650 1660 1670 1680 1690 1700 1100 1110 1120 1130 1140 1150 pF1KA1 VGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETLK :::::::::: :::..:.:.:::.:::::.::::::::::::::.::::: ::::::: : CCDS44 VGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQK 1710 1720 1730 1740 1750 1760 1160 1170 1180 1190 1200 1210 pF1KA1 WTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTTL :.:::::::::::. :: :::::::::::.:::: ::::.::: ::::::: ::: . . CCDS44 WSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLGVRPK-NQPI 1770 1780 1790 1800 1810 1820 1220 1230 1240 1250 1260 1270 pF1KA1 SSEEKGKKTKKKTR-RRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAYHLSCLGLG ..:::.:: ::: . .::..:: .. ::::: :::.:::: : . : :.:: .::.: CCDS44 ATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLT 1830 1840 1850 1860 1870 1880 1280 1290 1300 1310 1320 1330 pF1KA1 KRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD-LGA ::: ::::::::.::.::: ..:::..::.::::.:..: : ::: : ::: : CCDS44 KRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTEHDPCGP 1890 1900 1910 1920 1930 1940 1340 1350 1360 pF1KA1 ASVRSTKTEK--PPPEPGKPKGKRRRRRGWRRVTEGK .. . .. ::: : : CCDS44 NPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDKPPADTNQMLSLSKKALA 1950 1960 1970 1980 1990 2000 >>CCDS4412.1 NSD1 gene_id:64324|Hs108|chr5 (2696 aa) initn: 2340 init1: 1856 opt: 3606 Z-score: 2738.2 bits: 520.1 E(32554): 3.4e-146 Smith-Waterman score: 3606; 62.9% identity (82.3% similar) in 770 aa overlap (595-1348:1467-2230) 570 580 590 600 610 620 pF1KA1 KTARTSSYKAMEAASSLKSQAATKNLSDACKPLKKRNRASTAASSALGFSKSSSPSASLT :: .::.: ::.. . .: .. ..: CCDS44 EAGHLENGITESCATSYSKDFGGGTTKIFDKP-RKRKRQRHAAAK-MQCKKVKNDDSS-- 1440 1450 1460 1470 1480 1490 630 640 650 660 670 pF1KA1 ENEVSDSPGD----EPSESPYESADE-TQTEVSV-SSKK--SERGVTAK-KEYVCQLCEK .:. : :. . . :: :...: .. . .. .::: .::: : :: ::: ::: CCDS44 -KEIPGSEGELMPHRTATSPKETVEEGVEHDPGMPASKKMQGERGGGAALKENVCQNCEK 1500 1510 1520 1530 1540 1550 680 690 700 710 720 730 pF1KA1 PGSLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIHSCFVCKESKTDVKRCVVTQC : :::::. ::::::: ::::.. :.:.: :.:: .:::.:::::.: :::::.. : CCDS44 LGELLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLC 1560 1570 1580 1590 1600 1610 740 750 760 770 780 790 pF1KA1 GKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNPRPSKGKMMRCVRCPVAYHSG :::::: ::.::: ::....:::: :: :..:::.::.: :::..:::::::::::.. CCDS44 GKFYHEECVQKYPPTVMQNKGFRCSLHICITCHAANPANVSASKGRLMRCVRCPVAYHAN 1620 1630 1640 1650 1660 1670 800 810 820 830 840 850 pF1KA1 DACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCFVCSKGGSLLCCESCPAAFHP : ::::: ...::::::: ::: :.: :.: :::::::::::.:::::::.::::::: CCDS44 DFCLAAGSKILASNSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHR 1680 1690 1700 1710 1720 1730 860 870 880 890 900 910 pF1KA1 DCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPPNIQKMKHEI .::::..:.:.:.::::.:::: :...:.:::.: :::::::.:::. :: ::.::.:.. CCDS44 ECLNIDIPEGNWYCNDCKAGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDV 1740 1750 1760 1770 1780 1790 920 930 940 950 960 970 pF1KA1 GEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAEARFREIKLQ :::::.::::.:: :::::::::::::: .:. . .:. ..:.::::: :::.:.: : CCDS44 GEFPVLFFGSNDYLWTHQARVFPYMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQ 1800 1810 1820 1830 1840 1850 980 990 1000 1010 1020 1030 pF1KA1 REARETQE---SERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENPCGFDSEC .: :. :: ...:::::::::::.: :.:::.:::.::::.:::: :::::::.:::: CCDS44 KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSEC 1860 1870 1880 1890 1900 1910 1040 1050 1060 1070 1080 1090 pF1KA1 LNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNEY .::::..:::: ::::: ::::::.::::::..:..: .:::: .: ::.:::::::: CCDS44 INRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEY 1920 1930 1940 1950 1960 1970 1100 1110 1120 1130 1140 1150 pF1KA1 VGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETLK :::::::::: :::..:.:.:::.:::::.::::::::::::::.::::: ::::::: : CCDS44 VGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQK 1980 1990 2000 2010 2020 2030 1160 1170 1180 1190 1200 1210 pF1KA1 WTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTTL :.:::::::::::. :: :::::::::::.:::: ::::.::: ::::::: ::: . . CCDS44 WSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLGVRPK-NQPI 2040 2050 2060 2070 2080 2090 1220 1230 1240 1250 1260 1270 pF1KA1 SSEEKGKKTKKKTR-RRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAYHLSCLGLG ..:::.:: ::: . .::..:: .. ::::: :::.:::: : . : :.:: .::.: CCDS44 ATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSCKKPGCPKVYHADCLNLT 2100 2110 2120 2130 2140 2150 1280 1290 1300 1310 1320 1330 pF1KA1 KRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD-LGA ::: ::::::::.::.::: ..:::..::.::::.:..: : ::: : ::: : CCDS44 KRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTEHDPCGP 2160 2170 2180 2190 2200 2210 1340 1350 1360 pF1KA1 ASVRSTKTEK--PPPEPGKPKGKRRRRRGWRRVTEGK .. . .. ::: : : CCDS44 NPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDKPPADTNQMLSLSKKALA 2220 2230 2240 2250 2260 2270 >>CCDS43729.1 WHSC1L1 gene_id:54904|Hs108|chr8 (1437 aa) initn: 3744 init1: 1867 opt: 2691 Z-score: 2047.4 bits: 391.3 E(32554): 1e-107 Smith-Waterman score: 4037; 46.5% identity (69.4% similar) in 1354 aa overlap (66-1327:98-1409) 40 50 60 70 80 90 pF1KA1 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH :: :. : :.: . :.. : .: : CCDS43 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H 70 80 90 100 110 120 100 110 120 130 140 150 pF1KA1 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ . . : ..: .. : :.:::::::::::: .::. :::::.::: .:. CCDS43 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA 130 140 150 160 170 180 160 170 180 190 200 pF1KA1 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI ::.. .: :.. ...::.: :.:: . . . .... :.: . CCDS43 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE 190 200 210 220 230 240 210 220 230 240 250 pF1KA1 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK :. :: : . . .:..:::::::::. :::::::::.:: :. .::.. CCDS43 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN 250 260 270 280 290 300 260 270 280 290 300 310 pF1KA1 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP ..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. :: CCDS43 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP 310 320 330 340 350 320 330 340 350 360 370 pF1KA1 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM . ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . . CCDS43 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT 360 370 380 390 400 410 380 390 400 410 420 pF1KA1 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA . .: . .:.: .:. : ::. . .::: : : . ::: CCDS43 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA 420 430 440 450 460 470 430 440 450 460 470 480 pF1KA1 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDASG : :... . .: .... . . ... :: .. :. : : CCDS43 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYSTKGI-G 480 490 500 510 520 530 490 500 510 520 530 pF1KA1 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED .. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .: CCDS43 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK 540 550 560 570 580 540 550 560 570 580 590 pF1KA1 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK . .: .:.:... . . .:. . :..:. : .....::.::::: CCDS43 S-TEVVPKKKIKKE-----QVETVPQATVKTGL------------QKGASEISDSCKPLK 590 600 610 620 630 600 610 620 630 640 650 pF1KA1 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEV-SVSSKK ::.:::: . . . ...: : : .... . : . .:: .:: ..: :..:. CCDS43 KRSRASTDVEMTSSAYRDTSDSDSRGLSDLQVGFGKQ-VDSPSATADADVSDVQSMDSSL 640 650 660 670 680 690 660 670 680 690 700 710 pF1KA1 SERGV-TAKKEYVCQLCEKPG-SLLLCEGPCCGAFHLACLGLSRRPEGRFTCSECASGIH :.::. .::. :::.::. : ::. ::: :: ::: ::::. :...: : :: .: : CCDS43 SRRGTGMSKKDTVCQICESSGDSLIPCEGECCKHFHLECLGLASLPDSKFICMECKTGQH 700 710 720 730 740 750 720 730 740 750 760 770 pF1KA1 SCFVCKESKTDVKRCVVTQCGKFYHEACVKKYPLTVFESRGFRCPLHSCVSCHASNPSNP :: :: : ::::: : ::::::::::.:.: ..:::.::::: : : .: . . CCDS43 PCFSCKVSGKDVKRCSVGACGKFYHEACVRKFPTAIFESKGFRCPQHCCSACSMEKDIH- 760 770 780 790 800 780 790 800 810 820 830 pF1KA1 RPSKGKMMRCVRCPVAYHSGDACLAAGCSVIASNSIICTAHFTARKGKRHHAHVNVSWCF . :::.::::.::::::::::::.::: ...: .::. : : . . . :::..:: CCDS43 KASKGRMMRCLRCPVAYHSGDACIAAGSMLVSSYILICSNH---SKRSSNSSAVNVGFCF 810 820 830 840 850 860 840 pF1KA1 VCS-------------------------------------------------KGGSLLCC ::. ::: :::: CCDS43 VCARGLIVQDHSDPMFSSYAYKSHYLLNESNRAELMKLPMIPSSSASKKKCEKGGRLLCC 870 880 890 900 910 920 850 860 870 880 890 900 pF1KA1 ESCPAAFHPDCLNIEMPDGSWFCNDCRAGKKLHFQDIIWVKLGNYRWWPAEVCHPKNVPP :::::.:::.::.::::.: : ::::.::::::...:.:::::::::::::.:.:..:: CCDS43 ESCPASFHPECLSIEMPEGCWNCNDCKAGKKLHYKQIVWVKLGNYRWWPAEICNPRSVPL 930 940 950 960 970 980 910 920 930 940 950 960 pF1KA1 NIQKMKHEIGEFPVFFFGSKDYYWTHQARVFPYMEGDRGSRYQGVRGIGRVFKNALQEAE ::: .::..:.::::::::.::::.::.:::::.:::. : .: .:...::.::.:: CCDS43 NIQGLKHDLGDFPVFFFGSHDYYWVHQGRVFPYVEGDK-SFAEGQTSINKTFKKALEEAA 990 1000 1010 1020 1030 1040 970 980 990 1000 1010 1020 pF1KA1 ARFREIKLQREARETQESE---RKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDE ::.:.: :::..:. : : ::::::::::.:: ::::: .::.::::.:::::.:: CCDS43 KRFQELKAQRESKEALEIEKNSRKPPPYKHIKANKVIGKVQIQVADLSEIPRCNCKPADE 1050 1060 1070 1080 1090 1100 1030 1040 1050 1060 1070 1080 pF1KA1 NPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDI ::::..::::::::..::::::::::. ::::::::: ::...::::. .:::: .::.: CCDS43 NPCGLESECLNRMLQYECHPQVCPAGDRCQNQCFTKRLYPDAEIIKTERRGWGLRTKRSI 1110 1120 1130 1140 1150 1160 1090 1100 1110 1120 1130 1140 pF1KA1 RKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHS .:::::::::::::::::: :::.::::..:.:::::. :::::::::::::::::::: CCDS43 KKGEFVNEYVGELIDEEECRLRIKRAHENSVTNFYMLTVTKDRIIDAGPKGNYSRFMNHS 1170 1180 1190 1200 1210 1220 1150 1160 1170 1180 1190 1200 pF1KA1 CQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLG :.::::: :::::::.::::::.:::::: ::::::::::::: .: :.:::.::::::: CCDS43 CNPNCETQKWTVNGDVRVGLFALCDIPAGMELTFNYNLDCLGNGRTECHCGADNCSGFLG 1230 1240 1250 1260 1270 1280 1210 1220 1230 1240 1250 1260 pF1KA1 DRPKTSTTLSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFRCGDGGQLVLCDRKFCTKAY :::.. . ..:::.:..: : .::. : : :.. :: ::.:::::.::.::.: : ::: CCDS43 VRPKSACASTNEEKAKNAKLKQKRRKIKTEPKQMHEDYCFQCGDGGELVMCDKKDCPKAY 1290 1300 1310 1320 1330 1340 1270 1280 1290 1300 1310 1320 pF1KA1 HLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYC :: ::.: . :.::::::::.:: :.. ..:::..::.::::.:. :. . .:: : CCDS43 HLLCLNLTQPPYGKWECPWHQCDECSSAAVSFCEFCPHSFCKDHEKGALVPSALEGRLCC 1350 1360 1370 1380 1390 1400 1330 1340 1350 1360 pF1KA1 CEHDLGAASVRSTKTEKPPPEPGKPKGKRRRRRGWRRVTEGK ::: CCDS43 SEHDPMAPVSPEYWSKIKCKWESQDHGEEVKE 1410 1420 1430 >>CCDS2749.2 SETD2 gene_id:29072|Hs108|chr3 (2564 aa) initn: 703 init1: 604 opt: 706 Z-score: 537.8 bits: 112.8 E(32554): 1.2e-23 Smith-Waterman score: 706; 40.3% identity (69.2% similar) in 273 aa overlap (1009-1270:1493-1757) 980 990 1000 1010 1020 1030 pF1KA1 RETQESERKPPPYKHIKVNKPYGKVQIYTADISEIPKCNCKPTDENP-------CGFDSE ::... .:.: : ... :: : CCDS27 CAKQGKMPCYFDLIEENVYLTERKKNKSHRDIKRM-QCECTPLSKDERAQGEIACGED-- 1470 1480 1490 1500 1510 1040 1050 1060 1070 1080 1090 pF1KA1 CLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPETKIIKTDGKGWGLVAKRDIRKGEFVNE ::::.::.:: . :: :..:.:. : ..:. ....: :. ::::: : .:. .. :: : CCDS27 CLNRLLMIECSSR-CPNGDYCSNRRFQRKQHADVEVILTEKKGWGLRAAKDLPSNTFVLE 1520 1530 1540 1550 1560 1570 1100 1110 1120 1130 1140 1150 pF1KA1 YVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAGPKGNYSRFMNHSCQPNCETL : ::..:..: ::.:. .: :.:.... .:.:::: ::: ::::::::.::::: CCDS27 YCGEVLDHKEFKARVKEYARNKNIHYYFMALKNDEIIDATQKGNCSRFMNHSCEPNCETQ 1580 1590 1600 1610 1620 1630 1160 1170 1180 1190 1200 1210 pF1KA1 KWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKTVCRCGASNCSGFLGDRPKTSTT ::::::. :::.:.. .:.:.::::.:... :.: : ::..:: :.:: . ..: CCDS27 KWTVNGQLRVGFFTTKLVPSGSELTFDYQFQRYGKEAQKCFCGSANCRGYLGGENRVSIR 1640 1650 1660 1670 1680 1690 1220 1230 1240 1250 1260 pF1KA1 LSSEEKGKKTKKKTRRRRAKGEGKRQSEDECFR-CGDGGQLVLCDR---KFCTKAYHLSC . : : ::. :.. . .:. .. : . .: .:.. .: .. : .:.: CCDS27 AA----GGKMKKERSRKKDSVDGELEALMENGEGLSDKNQVLSLSRLMVRIETLEQKLTC 1700 1710 1720 1730 1740 1750 1270 1280 1290 1300 1310 1320 pF1KA1 LGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQDGTAFSCTPDGRSYCCEHD : : CCDS27 LELIQNTHSQSCLKSFLERHGLSLLWIWMAELGDGRESNQKLQEEIIKTLEHLPIPTKNM 1760 1770 1780 1790 1800 1810 >>CCDS1113.2 ASH1L gene_id:55870|Hs108|chr1 (2964 aa) initn: 407 init1: 358 opt: 648 Z-score: 493.0 bits: 104.7 E(32554): 3.9e-21 Smith-Waterman score: 648; 38.6% identity (69.1% similar) in 259 aa overlap (986-1237:2062-2316) 960 970 980 990 1000 1010 pF1KA1 RVFKNALQEAEARFREIKLQREARETQESERKP--PPYKHIKVNKPYGKVQIYTADISEI .:: : ::.:. : : :. .. : CCDS11 IHVGKYLRQKRIDFQLPYDILWQWKHNQLYKKPDVPLYKKIRSNV-YVDVKPLSG--YEA 2040 2050 2060 2070 2080 1020 1030 1040 1050 1060 1070 pF1KA1 PKCNCK-PTDENPCGFDSECLNRMLMFECHPQVCPAGEFCQNQCFTKRQYPET-KIIKTD :::: : :.. : ..:::::.. :: :..:: :: : :: . .... . . .... CCDS11 TTCNCKKPDDDTRKGCVDDCLNRMIFAECSPNTCPCGEQCCNQRIQRHEWVQCLERFRAE 2090 2100 2110 2120 2130 2140 1080 1090 1100 1110 1120 1130 pF1KA1 GKGWGLVAKRDIRKGEFVNEYVGELIDEEECMARIKHAHENDITHFYMLTIDKDRIIDAG ::::. .:. .. :.:. ::.::...:.: :. . ..: : : :..:. .::. CCDS11 EKGWGIRTKEPLKAGQFIIEYLGEVVSEQEFRNRMIEQYHNHSDH-YCLNLDSGMVIDSY 2150 2160 2170 2180 2190 2200 1140 1150 1160 1170 1180 1190 pF1KA1 PKGNYSRFMNHSCQPNCETLKWTVNGDTRVGLFAVCDIPAGTELTFNYNLDCLGNEKT-V :: .::.::::.:::: ::.::: :.::.:. :.:::::::..::. .. :: . CCDS11 RMGNEARFINHSCDPNCEMQKWSVNGVYRIGLYALKDMPAGTELTYDYNFHSFNVEKQQL 2210 2220 2230 2240 2250 2260 1200 1210 1220 1230 1240 pF1KA1 CRCGASNCSGFLGDRPKTSTTLSSEEKGKK--TKKKTRRRRAKGEGKRQSEDECFRCGDG :.:: .: :..: . . . :.: .... :.::. : . : ..:.. CCDS11 CKCGFEKCRGIIGGKSQRVNGLTSSKNSQPMATHKKSGRSKEKRKSKHKLKKRRGHLSEE 2270 2280 2290 2300 2310 2320 1250 1260 1270 1280 1290 1300 pF1KA1 GQLVLCDRKFCTKAYHLSCLGLGKRPFGKWECPWHHCDVCGKPSTSFCHLCPNSFCKEHQ CCDS11 PSENINTPTRLTPQLQMKPMSNRERNFVLKHHVFLVRNWEKIRQKQEEVKHTSDNIHSAS 2330 2340 2350 2360 2370 2380 >>CCDS6105.1 WHSC1L1 gene_id:54904|Hs108|chr8 (645 aa) initn: 692 init1: 323 opt: 545 Z-score: 423.5 bits: 89.7 E(32554): 2.9e-17 Smith-Waterman score: 710; 29.3% identity (58.9% similar) in 564 aa overlap (66-592:98-642) 40 50 60 70 80 90 pF1KA1 PSCEVNRECSVFLSKAQLSSSLQEGVMQKFNGHDAL-PFIPADKLKDLTSRVFNGEPGAH :: :. : :.: . :.. : .: : CCDS61 PLTNGYPSSISVYETQTKYQSYNQYPNGSANGFGAVRNFSPTDYYH---SEIPNTRP--H 70 80 90 100 110 120 100 110 120 130 140 150 pF1KA1 DAKLR-FESQEMKGIGTPPNTTPIKNGSPEIKLKITKTYMNGKPLFESSICGDSAADVSQ . . : ..: .. : :.:::::::::::: .::. :::::.::: .:. CCDS61 EILEKPSPPQPPPPPSVPQTVIPKKTGSPEIKLKITKTIQNGRELFESSLCGDLLNEVQA 130 140 150 160 170 180 160 170 180 190 200 pF1KA1 SEENGQKPENKARRNRKRSIKYDSLLEQGLVEAALVS-----------KISSPSDK--KI ::.. .: :.. ...::.: :.:: . . . .... :.: . CCDS61 SEHTKSKHESR-KEKRKKSNKHDSSRSEERKSHKIPKLEPEEQNRPNERVDTVSEKPREE 190 200 210 220 230 240 210 220 230 240 250 pF1KA1 PAKKESCPNTG-------RDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLK :. :: : . . .:..:::::::::. :::::::::.:: :. .::.. CCDS61 PVLKEEAPVQPILSSVPTTEVSTGVKFQVGDLVWSKVGTYPWWPCMVSSDPQLEVHTKIN 250 260 270 280 290 300 260 270 280 290 300 310 pF1KA1 GQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKP ..::.::::::.. :::::. :: . ..:. :.:.: :..::: ...:: :. :: CCDS61 --TRGAREYHVQFFSNQPERAWVHEKRVREYKGHKQYEELLAEATKQASNHSEKQKIRKP 310 320 330 340 350 320 330 340 350 360 370 pF1KA1 ISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVGDQLHLNPQVAKEAGIAAESLGEM . ::::..::..::.: .:. ::: ..::.:. : . . ::.. . . . CCDS61 RPQRERAQWDIGIAHAEKALKMTREERIEQYTFIYIDKQPEEALSQAKKSVASKTEVKKT 360 370 380 390 400 410 380 390 400 410 420 pF1KA1 AESSGV------SEEAAENPKSVREECIPMKRRRRAKLCSSAETLESHPDIGKSTPQKTA . .: . .:.: .:. : ::. . .::: : : . ::: CCDS61 RRPRSVLNTQPEQTNAGEVASSLSSTEI---RRHSQRRHTSAEEEEPPP---VKIAWKTA 420 430 440 450 460 470 430 440 450 460 470 480 pF1KA1 EADPRRGVGSPPGRKKTTVSMPRSRKGDAASQFLVFCQKHR-------DEVVAEHPDASG : :... . .: .... . . ... :: .. :. : . : CCDS61 AA--RKSLPASITMHKGSLDLQKCNMSPVVKIEQVFALQNATGDGKFIDQFVYS-TKGIG 480 490 500 510 520 530 490 500 510 520 530 pF1KA1 EEIEELLRSQWSLL--SEKQRARYNTKFALVAPVQAEEDSGNVNGKKRNHTKRIQDPTED .. : .:.: :. . .:: . :. .. .: . ..:.:. :.. .. : .. .: CCDS61 NKTEISVRGQDRLIISTPNQRNEKPTQ-SVSSPEATSGSTGSVEKKQQRRSIRTRSESEK 540 550 560 570 580 540 550 560 570 580 590 pF1KA1 AEAEDTPRKRLRTDKHSLRKRDTITDKTARTSSYKAMEAASSLKSQAATKNLSDACKPLK . .: .:.:... .. . :. . :. ...... ....... . . CCDS61 S-TEVVPKKKIKKEQVETVPQATVKTGLQKGSADRGVQGSVRFSDSSVSAAIEETVD 590 600 610 620 630 640 600 610 620 630 640 650 pF1KA1 KRNRASTAASSALGFSKSSSPSASLTENEVSDSPGDEPSESPYESADETQTEVSVSSKKS 1365 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 20:27:08 2016 done: Wed Nov 2 20:27:09 2016 Total Scan time: 4.250 Total Display time: 0.340 Function used was FASTA [36.3.4 Apr, 2011]