FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0662, 1101 aa 1>>>pF1KSDA0662 1101 - 1101 aa - 1101 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.2131+/-0.00102; mu= -3.5001+/- 0.062 mean_var=310.6988+/-61.870, 0's: 0 Z-trim(114.0): 15 B-trim: 0 in 0/52 Lambda= 0.072762 statistics sampled from 14607 (14618) to 14607 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.449), width: 16 Scan time: 4.640 The best scores are: opt bits E(32554) CCDS35069.1 PHF2 gene_id:5253|Hs108|chr9 (1096) 7056 755.0 2.1e-217 CCDS55418.1 PHF8 gene_id:23133|Hs108|chrX ( 948) 1866 210.2 1.8e-53 CCDS55419.1 PHF8 gene_id:23133|Hs108|chrX ( 878) 1855 209.0 3.9e-53 CCDS14355.1 PHF8 gene_id:23133|Hs108|chrX (1024) 1855 209.0 4.4e-53 CCDS55420.1 PHF8 gene_id:23133|Hs108|chrX (1060) 1855 209.0 4.5e-53 CCDS43658.1 KDM7A gene_id:80853|Hs108|chr7 ( 941) 1723 195.1 6.1e-49 CCDS41849.1 KDM2B gene_id:84678|Hs108|chr12 (1265) 572 74.4 1.8e-12 CCDS41850.1 KDM2B gene_id:84678|Hs108|chr12 (1336) 572 74.4 1.9e-12 CCDS44657.1 KDM2A gene_id:22992|Hs108|chr11 (1162) 522 69.1 6.4e-11 >>CCDS35069.1 PHF2 gene_id:5253|Hs108|chr9 (1096 aa) initn: 6696 init1: 6456 opt: 7056 Z-score: 4016.7 bits: 755.0 E(32554): 2.1e-217 Smith-Waterman score: 7056; 97.4% identity (97.6% similar) in 1101 aa overlap (1-1101:1-1096) 10 20 30 40 50 60 pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS :::::::::::::::::: . . . ::::::::::::::::::: CCDS35 MATVPVYCVCRLPYDVTRFMIECDACKDWFHGSCVGVEEEEAPDIDIYHCPNCEKTHGKS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGYMEE ::::::::::::::::::::::::::::::::::::::: :::::::::::::::::::: CCDS35 TLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKELRSRTFPSAEDVVARVPGSQLTLGYMEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD HGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVDY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVDY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD YYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLIC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 YYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLIC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD VKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQVD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD KCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGSL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHED 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD ELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEATP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEATP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD PQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD TIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSKSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSKSE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD AKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGVFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGVFG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD ALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTPVTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTPVTK 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD PKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGALEYN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGALEYN 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD PSSQPPASPSTQEAIQGMLSMANLQASDSCLQTTWGAGQAKGSSLAAHGARKNGGGSGKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PSSQPPASPSTQEAIQGMLSMANLQASDSCLQTTWGAGQAKGSSLAAHGARKNGGGSGKS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD AGKRLLKRAAKNSVDLDDYEEEQDHLDACFKDSDYVYPSLESDEDNPIFKSRSKKRKGSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AGKRLLKRAAKNSVDLDDYEEEQDHLDACFKDSDYVYPSLESDEDNPIFKSRSKKRKGSD 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD DAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQEEQKSKKKKSAKRKLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQEEQKSKKKKSAKRKLT 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD PNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTSTASSQASQEGSSPEPPPE :::::::::::::::::::::::::::::::: ::::::::::::::::::::::: CCDS35 PNTTSPSTSTSISAGTTSTSTTPASTTPASTT-----PASTSTASSQASQEGSSPEPPPE 970 980 990 1000 1010 1030 1040 1050 1060 1070 1080 pF1KSD SHSSSLADHEYTAAGTFTGAQAGRTSQPMAPGVFLTQRRPSASSPNNNTAAKGKRTKKGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SHSSSLADHEYTAAGTFTGAQAGRTSQPMAPGVFLTQRRPSASSPNNNTAAKGKRTKKGM 1020 1030 1040 1050 1060 1070 1090 1100 pF1KSD ATAKQRLGKILKIHRNGKLLL ::::::::::::::::::::: CCDS35 ATAKQRLGKILKIHRNGKLLL 1080 1090 >>CCDS55418.1 PHF8 gene_id:23133|Hs108|chrX (948 aa) initn: 2802 init1: 1657 opt: 1866 Z-score: 1073.2 bits: 210.2 E(32554): 1.8e-53 Smith-Waterman score: 2749; 45.2% identity (64.5% similar) in 1121 aa overlap (1-1101:1-923) 10 20 30 40 50 60 pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS ::.:::::.::::::::: . . . : :::.::::::: :: : CCDS55 MASVPVYCLCRLPYDVTRFMIECDMCQDWFHGSCVGVEEEKAADIDLYHCPNCEVLHGPS 10 20 30 40 50 60 70 80 90 100 110 pF1KSD TLKKKRTWHK-HGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGYME .::.: : : .. :::..:: :..::::::: ...:. . :.:::. ..: CCDS55 IMKKRRGSSKGHDTHKG---KPVKTGSPTFVRELRSRTFDSSDEVILKPTGNQLTVEFLE 70 80 90 100 110 120 130 140 150 160 170 pF1KSD EHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVD :..:. :::: ::::::...:.:.: : :::.::: .. .:: :::.: :::::: .:: CCDS55 ENSFSVPILVLKKDGLGMTLPSPSFTVRDVEHYVGSDKEIDVIDVTRQADCKMKLGDFVK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD YYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLI :::: .:..:::: .:::::::.:..:: : ::.::::::: ::.. .. .:.: ::::. CCDS55 YYYSGKREKVLNVISLEFSDTRLSNLVETPKIVRKLSWVENLWPEECVFERPNVQKYCLM 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD CVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQV :.::::::::: ::.:.::::::::: ::::::..::..:.: : :.::..::::.::: CCDS55 SVRDSYTDFHIDFGGTSVWYHVLKGEKIFYLIRPTNANLTLFECWSSSSNQNEMFFGDQV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD DKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGS :::::: ::::::::::.:::.:.:::::::::.:.:::::..:::..:::.:.::. .. CCDS55 DKCYKCSVKQGQTLFIPTGWIHAVLTPVDCLAFGGNFLHSLNIEMQLKAYEIEKRLSTAD 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD LTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHE : .:::::: :::.:::.:. :.: ... .. .::.:.: :: :::.::.:.:: .:: CCDS55 LFRFPNFETICWYVGKHILDIFRGLRENRRHPASYLVHGGKALNLAFRAWTRKEALPDHE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD DELPEHFKPSQLIKDLAKEIRLSE-NASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEA ::.:: . :::::::.:::: : : . : : .: . . : ... CCDS55 DEIPETVRTVQLIKDLAREIRLVEFNITGA--------------CLNDSDDDSPDLDLDG 420 430 440 450 460 480 490 500 510 520 530 pF1KSD TPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESA . . : .: ...:. :. : CCDS55 N------------------------------------ESPLALLMSNGSTKRVK------ 470 480 540 550 560 570 580 590 pF1KSD SPTIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSK .:.: .. : .:.: : :: . ::. CCDS55 ----------------SLSK---SRRTKIAKKV-------------DKARL-MAEQV--- 490 500 600 610 620 630 640 650 pF1KSD SEAKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGV ::.: :.. :...... : .. .:: : CCDS55 -----------------MEDEFDLDS-------DDELQIDERLGKEKATLIIRPKF-PR- 510 520 530 660 670 680 690 700 710 pF1KSD FGALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTPV : . :: : . : . ::. :: :.. CCDS55 -------KLPRAKPCSDP-NRVREPGEV---EFDIEED---------------------- 540 550 560 720 730 740 750 760 770 pF1KSD TKPKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGALE : .:.. :: .. : : .::.:.::::::.::..::. . CCDS55 ---------YTTDEDMVEG-----VEGKLG--------NGSGAGGILDLLKASRQVGGPD 570 580 590 600 780 790 800 810 820 830 pF1KSD YNPSSQPPASPSTQEAIQGMLSMANLQASDSC-----LQTTWGAGQAK--GSSLAAHGAR : .. :::::::::::::: :::::.:.: ::. : .:: . ::: .. :. CCDS55 YAALTEAPASPSTQEAIQGMLCMANLQSSSSSPATSSLQAWWTGGQDRSSGSSSSGLGTV 610 620 630 640 650 660 840 850 860 870 880 pF1KSD KNGGGSGKSAGKRLLKRAAKNSVDLDDYEE-----EQDHLDACFKDSDYVYPSLESDEDN .:. .: .. ::: .:: : .. .. :: ::: : :::::..:.:::::::.:. CCDS55 SNSPASQRTPGKRPIKRPAYWRTESEEEEENASLDEQDSLGACFKDAEYIYPSLESDDDD 670 680 690 700 710 720 890 900 910 920 930 940 pF1KSD PIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQEE : .::: ::.:.:::::.:: ::: :..:.:::::::::::::::::::::::::.::: CCDS55 PALKSRPKKKKNSDDAPWSPKARVTPTLPKQDRPVREGTRVASIETGLAAAAAKLAQQEL 730 740 750 760 770 780 950 960 970 980 990 1000 pF1KSD QKSKKKKSAKRK-LTPNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTSTAS ::..::: :.: : .. .: : ... . :.:: :. :. . .. CCDS55 QKAQKKKYIKKKPLLKEVEQPR---------------PQDSNLSLTVPAPTVAATPQLVT 790 800 810 820 1010 1020 1030 1040 1050 1060 pF1KSD SQASQEGSSPEPPPESH----SSSLADHEYTA-AGTFTGAQAGRTSQPMAPGVFLTQRRP : ::: :::: . :.::::::::: ..: :::.:.. ::::::::::::: CCDS55 S------SSPLPPPEPKQEALSGSLADHEYTARPNAFGMAQANRSTTPMAPGVFLTQRRP 830 840 850 860 870 880 1070 1080 1090 1100 pF1KSD SASSPNNNTAAKGKRTKKGMATAKQRLGKILKIHRNGKLLL :..: ..: :..::: :::.::::::::.:::::::::::: CCDS55 SVGS-QSNQAGQGKRPKKGLATAKQRLGRILKIHRNGKLLLRQVIVQAECRQAIHEPKLK 890 900 910 920 930 940 CCDS55 RRDAHP >>CCDS55419.1 PHF8 gene_id:23133|Hs108|chrX (878 aa) initn: 2411 init1: 1659 opt: 1855 Z-score: 1067.5 bits: 209.0 E(32554): 3.9e-53 Smith-Waterman score: 2467; 44.4% identity (67.9% similar) in 959 aa overlap (1-944:1-866) 10 20 30 40 50 60 pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS ::.:::::.::::::::: . . . : :::.::::::: :: : CCDS55 MASVPVYCLCRLPYDVTRFMIECDMCQDWFHGSCVGVEEEKAADIDLYHCPNCEVLHGPS 10 20 30 40 50 60 70 80 90 100 110 pF1KSD TLKKKRTWHKHGPGQAPDV---KPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGY .::.: : ... :. :::..:: :..::::::: ...:. . :.:::. . CCDS55 IMKKRR-----GSSKGHDTHKGKPVKTGSPTFVRELRSRTFDSSDEVILKPTGNQLTVEF 70 80 90 100 110 120 130 140 150 160 170 pF1KSD MEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEF .::..:. :::: ::::::...:.:.: : :::.::: .. .:: :::.: :::::: .: CCDS55 LEENSFSVPILVLKKDGLGMTLPSPSFTVRDVEHYVGSDKEIDVIDVTRQADCKMKLGDF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD VDYYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYC : :::: .:..:::: .:::::::.:..:: : ::.::::::: ::.. .. .:.: ::: CCDS55 VKYYYSGKREKVLNVISLEFSDTRLSNLVETPKIVRKLSWVENLWPEECVFERPNVQKYC 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD LICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFAD :. :.::::::::: ::.:.::::::::: ::::::..::..:.: : :.::..::::.: CCDS55 LMSVRDSYTDFHIDFGGTSVWYHVLKGEKIFYLIRPTNANLTLFECWSSSSNQNEMFFGD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD QVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKL :::::::: ::::::::::.:::.:.:::::::::.:.:::::..:::..:::.:.::. CCDS55 QVDKCYKCSVKQGQTLFIPTGWIHAVLTPVDCLAFGGNFLHSLNIEMQLKAYEIEKRLST 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD GSLTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAE ..: .:::::: :::.:::.:. :.: ... .. .::.:.: :: :::.::.:.:: . CCDS55 ADLFRFPNFETICWYVGKHILDIFRGLRENRRHPASYLVHGGKALNLAFRAWTRKEALPD 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD HEDELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIE ::::.:: . :::::::.:::: :. . ..:...... .: : . : CCDS55 HEDEIPETVRTVQLIKDLAREIRLVEDIFQ------QNVGKTSNIFGLQRI--FPAGSIP 420 430 440 450 460 480 490 500 510 520 530 pF1KSD ATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRES : : ... . . .. ::: . : :: : : : ...:::.: CCDS55 LTRP-------AHSTSVSMSRLSLPSKNGSKKKGLKP----KELFKK--AERKGKESSAL 470 480 490 500 510 540 550 560 570 580 590 pF1KSD ASPTIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKS . . .:.......:: : :. :. ... . . ..: :.. CCDS55 GPAGQLSYNLMDTYSHQAL------KTGSFQKAKFNITGACLNDSDDDSPDLDLD----- 520 530 540 550 560 600 610 620 630 640 650 pF1KSD KSEAKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPG : .: .:: . : :: :. .. .:.. . .. .:.. .... CCDS55 --------GNESPLALLMSNGSTKRVKS-LSKSRRTKIAKKVDKARLMAEQVME------ 570 580 590 600 660 670 680 690 700 710 pF1KSD VFGALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNAPKRDLSFLLDKKAVLPTP ::.. ::: ::.::: : : .::.: CCDS55 -----------------DEFDLDSDD-ELQIDE---RLGK------------EKATL--- 610 620 630 720 730 740 750 760 770 pF1KSD VTKPKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGAL . .::. .. :: . .. .::. .:. .. ... ... . . CCDS55 IIRPKFPRKLPRAKPCSDPNRVR-----EPGEVEFDIEEDYTTDEDMVEGVEGYQTATPA 640 650 660 670 680 780 790 800 810 820 830 pF1KSD EYNPSSQPPASPSTQEAIQGMLSMANLQASDSC-----LQTTWGAGQAK--GSSLAAHGA . .:. :::::::::::::: :::::.:.: ::. : .:: . ::: .. :. CCDS55 PAQGASEAPASPSTQEAIQGMLCMANLQSSSSSPATSSLQAWWTGGQDRSSGSSSSGLGT 690 700 710 720 730 740 840 850 860 870 880 pF1KSD RKNGGGSGKSAGKRLLKRAAKNSVDLDDYEE-----EQDHLDACFKDSDYVYPSLESDED .:. .: .. ::: .:: : .. .. :: ::: : :::::..:.:::::::.: CCDS55 VSNSPASQRTPGKRPIKRPAYWRTESEEEEENASLDEQDSLGACFKDAEYIYPSLESDDD 750 760 770 780 790 800 890 900 910 920 930 940 pF1KSD NPIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQE .: .::: ::.:.:::::.:: ::: :..:.:::::::::::::::::::::::::.:: CCDS55 DPALKSRPKKKKNSDDAPWSPKARVTPTLPKQDRPVREGTRVASIETGLAAAAAKLAQQV 810 820 830 840 850 860 950 960 970 980 990 1000 pF1KSD EQKSKKKKSAKRKLTPNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTSTAS CCDS55 KKMKLSLTDSG 870 >>CCDS14355.1 PHF8 gene_id:23133|Hs108|chrX (1024 aa) initn: 2804 init1: 1659 opt: 1855 Z-score: 1066.5 bits: 209.0 E(32554): 4.4e-53 Smith-Waterman score: 2969; 46.4% identity (68.7% similar) in 1123 aa overlap (1-1101:1-1024) 10 20 30 40 50 60 pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAAQRRGRATAPDIDIYHCPNCEKTHGKS ::.:::::.::::::::: . . . : :::.::::::: :: : CCDS14 MASVPVYCLCRLPYDVTRFMIECDMCQDWFHGSCVGVEEEKAADIDLYHCPNCEVLHGPS 10 20 30 40 50 60 70 80 90 100 110 pF1KSD TLKKKRTWHK-HGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLTLGYME .::.: : : .. :::..:: :..::::::: ...:. . :.:::. ..: CCDS14 IMKKRRGSSKGHDTHKG---KPVKTGSPTFVRELRSRTFDSSDEVILKPTGNQLTVEFLE 70 80 90 100 110 120 130 140 150 160 170 pF1KSD EHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKLKEFVD :..:. :::: ::::::...:.:.: : :::.::: .. .:: :::.: :::::: .:: CCDS14 ENSFSVPILVLKKDGLGMTLPSPSFTVRDVEHYVGSDKEIDVIDVTRQADCKMKLGDFVK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD YYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPDDALLAKPKVTKYCLI :::: .:..:::: .:::::::.:..:: : ::.::::::: ::.. .. .:.: ::::. CCDS14 YYYSGKREKVLNVISLEFSDTRLSNLVETPKIVRKLSWVENLWPEECVFERPNVQKYCLM 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD CVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISLYERWRSASNHSEMFFADQV :.::::::::: ::.:.::::::::: ::::::..::..:.: : :.::..::::.::: CCDS14 SVRDSYTDFHIDFGGTSVWYHVLKGEKIFYLIRPTNANLTLFECWSSSSNQNEMFFGDQV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD DKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSLSVEMQMRAYEVERRLKLGS :::::: ::::::::::.:::.:.:::::::::.:.:::::..:::..:::.:.::. .. CCDS14 DKCYKCSVKQGQTLFIPTGWIHAVLTPVDCLAFGGNFLHSLNIEMQLKAYEIEKRLSTAD 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD LTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAKILNGAFRSWTKKQALAEHE : .:::::: :::.:::.:. :.: ... .. .::.:.: :: :::.::.:.:: .:: CCDS14 LFRFPNFETICWYVGKHILDIFRGLRENRRHPASYLVHGGKALNLAFRAWTRKEALPDHE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD DELPEHFKPSQLIKDLAKEIRLSENASKAVRPEVNTVASSDEVCDGDREKEEPPSPIEAT ::.:: . :::::::.:::: :. . ..:...... .: : . : : CCDS14 DEIPETVRTVQLIKDLAREIRLVEDIFQ------QNVGKTSNIFGLQR--IFPAGSIPLT 420 430 440 450 460 480 490 500 510 520 530 pF1KSD PPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESAS : ... . . .. ::: . : :: : : : ...:::.: . CCDS14 RP-------AHSTSVSMSRLSLPSKNGSKKKGLKP----KELFKK--AERKGKESSALGP 470 480 490 500 510 540 550 560 570 580 590 pF1KSD PTIPNLDLLEAHTKEALTKMEPPKKGKATKSVLSVPNKDVVHMQNDVERLEIREQTKSKS . .:.......:: : :. :. ... . . ..: :.. CCDS14 AGQLSYNLMDTYSHQAL------KTGSFQKAKFNITGACLNDSDDDSPDLDLD------- 520 530 540 550 560 600 610 620 630 640 650 pF1KSD EAKWKYKNSKPDSLLKMEEEQKLEKSPLAGNKDNKFSFSFSNKKLLGSKALRPPTSPGVF : .: .:: . : :: :. .. .:.. . .. .:.. .... CCDS14 ------GNESPLALLMSNGSTKRVKS-LSKSRRTKIAKKVDKARLMAEQVME-------- 570 580 590 600 660 670 680 690 700 710 pF1KSD GALQNFKEDKPKPVRDEYEYVSDDGELKIDEFPIRRKKNA---PKRDLSFLLDKKAVLPT ::.. ::: ::.::: ..: . :: .. : :. CCDS14 ---------------DEFDLDSDD-ELQIDERLGKEKATLIIRPKFPRKLPRAKPCSDPN 610 620 630 640 650 720 730 740 750 760 770 pF1KSD PVTKPKLDSAAYKSDDSSDEGSLHIDTDTKPGRNARVKKESGSSAAGILDLLQASEEVGA : .: . : ..:: : : .... .::.:.::::::.::..::. CCDS14 RVREPGEVEFDIEEDYTTDE-------DMVEGVEGKLG--NGSGAGGILDLLKASRQVGG 660 670 680 690 700 780 790 800 810 820 pF1KSD LEYNPSSQPPASPSTQEAIQGMLSMANLQASDSC-----LQTTWGAGQAK--GSSLAAHG .: .. :::::::::::::: :::::.:.: ::. : .:: . ::: .. : CCDS14 PDYAALTEAPASPSTQEAIQGMLCMANLQSSSSSPATSSLQAWWTGGQDRSSGSSSSGLG 710 720 730 740 750 760 830 840 850 860 870 880 pF1KSD ARKNGGGSGKSAGKRLLKRAAKNSVDLDDYEE-----EQDHLDACFKDSDYVYPSLESDE . .:. .: .. ::: .:: : .. .. :: ::: : :::::..:.:::::::. CCDS14 TVSNSPASQRTPGKRPIKRPAYWRTESEEEEENASLDEQDSLGACFKDAEYIYPSLESDD 770 780 790 800 810 820 890 900 910 920 930 940 pF1KSD DNPIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVASIETGLAAAAAKLSQQ :.: .::: ::.:.:::::.:: ::: :..:.:::::::::::::::::::::::::.:: CCDS14 DDPALKSRPKKKKNSDDAPWSPKARVTPTLPKQDRPVREGTRVASIETGLAAAAAKLAQQ 830 840 850 860 870 880 950 960 970 980 990 1000 pF1KSD EEQKSKKKKSAKRK-LTPNTTSPSTSTSISAGTTSTSTTPASTTPASTTPASTTPASTST : ::..::: :.: : .. .: : ... . :.:: :. :. . CCDS14 ELQKAQKKKYIKKKPLLKEVEQPR---------------PQDSNLSLTVPAPTVAATPQL 890 900 910 920 1010 1020 1030 1040 1050 pF1KSD ASSQASQEGSSPEPPPESH----SSSLADHEYTA-AGTFTGAQAGRTSQPMAPGVFLTQR ..: ::: :::: . :.::::::::: ..: :::.:.. ::::::::::: CCDS14 VTS------SSPLPPPEPKQEALSGSLADHEYTARPNAFGMAQANRSTTPMAPGVFLTQR 930 940 950 960 970 980 1060 1070 1080 1090 1100 pF1KSD RPSASSPNNNTAAKGKRTKKGMATAKQRLGKILKIHRNGKLLL :::..: ..: :..::: :::.::::::::.:::::::::::: CCDS14 RPSVGS-QSNQAGQGKRPKKGLATAKQRLGRILKIHRNGKLLL 990 1000 1010 1020 >>CCDS55420.1 PHF8 gene_id:23133|Hs108|chrX (1060 aa) initn: 2804 init1: 1659 opt: 1855 Z-score: 1066.3 bits: 209.0 E(32554): 4.5e-53 Smith-Waterman score: 2969; 46.4% identity (68.7% similar) in 1123 aa overlap (1-1101:37-1060) 10 20 30 pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGP ::.:::::.::::::::: . CCDS55 IVQRGRVLPPPAPLDTTNLAGRRTLQGRAKMASVPVYCLCRLPYDVTRFMIECDMCQDWF 10 20 30 40 50 60 40 50 60 70 80 pF1KSD TRAAQRRGRATAPDIDIYHCPNCEKTHGKSTLKKKRTWHK-HGPGQAPDVKPVQNGSQLF . . : :::.::::::: :: : .::.: : : .. :::..:: : CCDS55 HGSCVGVEEEKAADIDLYHCPNCEVLHGPSIMKKRRGSSKGHDTHKG---KPVKTGSPTF 70 80 90 100 110 120 90 100 110 120 130 140 pF1KSD IKELRSRTFPRAEDVVARVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDV ..::::::: ...:. . :.:::. ..::..:. :::: ::::::...:.:.: : :: CCDS55 VRELRSRTFDSSDEVILKPTGNQLTVEFLEENSFSVPILVLKKDGLGMTLPSPSFTVRDV 130 140 150 160 170 180 150 160 170 180 190 200 pF1KSD ENYVGPERSVDVTDVTKQKDCKMKLKEFVDYYYSTNRKRVLNVTNLEFSDTRMSSFVEPP :.::: .. .:: :::.: :::::: .:: :::: .:..:::: .:::::::.:..:: : CCDS55 EHYVGSDKEIDVIDVTRQADCKMKLGDFVKYYYSGKREKVLNVISLEFSDTRLSNLVETP 190 200 210 220 230 240 210 220 230 240 250 260 pF1KSD DIVKKLSWVENYWPDDALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFY ::.::::::: ::.. .. .:.: ::::. :.::::::::: ::.:.::::::::: :: CCDS55 KIVRKLSWVENLWPEECVFERPNVQKYCLMSVRDSYTDFHIDFGGTSVWYHVLKGEKIFY 250 260 270 280 290 300 270 280 290 300 310 320 pF1KSD LIRPASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDC ::::..::..:.: : :.::..::::.::::::::: ::::::::::.:::.:.:::::: CCDS55 LIRPTNANLTLFECWSSSSNQNEMFFGDQVDKCYKCSVKQGQTLFIPTGWIHAVLTPVDC 310 320 330 340 350 360 330 340 350 360 370 380 pF1KSD LAFAGHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWYMGKHLLEAFKGSHKSGK :::.:.:::::..:::..:::.:.::. ..: .:::::: :::.:::.:. :.: ... . CCDS55 LAFGGNFLHSLNIEMQLKAYEIEKRLSTADLFRFPNFETICWYVGKHILDIFRGLRENRR 370 380 390 400 410 420 390 400 410 420 430 440 pF1KSD QLPPHLVQGAKILNGAFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIRLSENASKAV . .::.:.: :: :::.::.:.:: .::::.:: . :::::::.:::: :. . CCDS55 HPASYLVHGGKALNLAFRAWTRKEALPDHEDEIPETVRTVQLIKDLAREIRLVEDIFQ-- 430 440 450 460 470 480 450 460 470 480 490 500 pF1KSD RPEVNTVASSDEVCDGDREKEEPPSPIEATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPP ..:...... .: : . : : : ... . . .. ::: . CCDS55 ----QNVGKTSNIFGLQR--IFPAGSIPLTRP-------AHSTSVSMSRLSLPSKNGSKK 490 500 510 520 510 520 530 540 550 560 pF1KSD KPPKPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKMEPPKKGKATK : :: : : : ...:::.: . . .:.......:: : :. : CCDS55 KGLKP----KELFKK--AERKGKESSALGPAGQLSYNLMDTYSHQAL------KTGSFQK 530 540 550 560 570 570 580 590 600 610 620 pF1KSD SVLSVPNKDVVHMQNDVERLEIREQTKSKSEAKWKYKNSKPDSLLKMEEEQKLEKSPLAG . ... . . ..: :.. : .: .:: . : :: :. CCDS55 AKFNITGACLNDSDDDSPDLDLD-------------GNESPLALLMSNGSTKRVKS-LSK 580 590 600 610 620 630 640 650 660 670 680 pF1KSD NKDNKFSFSFSNKKLLGSKALRPPTSPGVFGALQNFKEDKPKPVRDEYEYVSDDGELKID .. .:.. . .. .:.. .... ::.. ::: ::.:: CCDS55 SRRTKIAKKVDKARLMAEQVME-----------------------DEFDLDSDD-ELQID 630 640 650 690 700 710 720 730 740 pF1KSD EFPIRRKKNA---PKRDLSFLLDKKAVLPTPVTKPKLDSAAYKSDDSSDEGSLHIDTDTK : ..: . :: .. : :. : .: . : ..:: : CCDS55 ERLGKEKATLIIRPKFPRKLPRAKPCSDPNRVREPGEVEFDIEEDYTTDE-------DMV 660 670 680 690 700 710 750 760 770 780 790 800 pF1KSD PGRNARVKKESGSSAAGILDLLQASEEVGALEYNPSSQPPASPSTQEAIQGMLSMANLQA : .... .::.:.::::::.::..::. .: .. :::::::::::::: :::::. CCDS55 EGVEGKLG--NGSGAGGILDLLKASRQVGGPDYAALTEAPASPSTQEAIQGMLCMANLQS 720 730 740 750 760 810 820 830 840 850 pF1KSD SDSC-----LQTTWGAGQAK--GSSLAAHGARKNGGGSGKSAGKRLLKRAAKNSVDLDDY :.: ::. : .:: . ::: .. :. .:. .: .. ::: .:: : .. .. CCDS55 SSSSPATSSLQAWWTGGQDRSSGSSSSGLGTVSNSPASQRTPGKRPIKRPAYWRTESEEE 770 780 790 800 810 820 860 870 880 890 900 910 pF1KSD EE-----EQDHLDACFKDSDYVYPSLESDEDNPIFKSRSKKRKGSDDAPYSPTARVGPSV :: ::: : :::::..:.:::::::.:.: .::: ::.:.:::::.:: ::: :.. CCDS55 EENASLDEQDSLGACFKDAEYIYPSLESDDDDPALKSRPKKKKNSDDAPWSPKARVTPTL 830 840 850 860 870 880 920 930 940 950 960 970 pF1KSD PRQDRPVREGTRVASIETGLAAAAAKLSQQEEQKSKKKKSAKRK-LTPNTTSPSTSTSIS :.:::::::::::::::::::::::::.::: ::..::: :.: : .. .: CCDS55 PKQDRPVREGTRVASIETGLAAAAAKLAQQELQKAQKKKYIKKKPLLKEVEQPR------ 890 900 910 920 930 940 980 990 1000 1010 1020 pF1KSD AGTTSTSTTPASTTPASTTPASTTPASTSTASSQASQEGSSPEPPPESH----SSSLADH : ... . :.:: :. :. . ..: ::: :::: . :.::::: CCDS55 ---------PQDSNLSLTVPAPTVAATPQLVTS------SSPLPPPEPKQEALSGSLADH 950 960 970 980 1030 1040 1050 1060 1070 1080 pF1KSD EYTA-AGTFTGAQAGRTSQPMAPGVFLTQRRPSASSPNNNTAAKGKRTKKGMATAKQRLG :::: ..: :::.:.. ::::::::::::::..: ..: :..::: :::.:::::::: CCDS55 EYTARPNAFGMAQANRSTTPMAPGVFLTQRRPSVGS-QSNQAGQGKRPKKGLATAKQRLG 990 1000 1010 1020 1030 1040 1090 1100 pF1KSD KILKIHRNGKLLL .:::::::::::: CCDS55 RILKIHRNGKLLL 1050 1060 >>CCDS43658.1 KDM7A gene_id:80853|Hs108|chr7 (941 aa) initn: 1995 init1: 1494 opt: 1723 Z-score: 992.2 bits: 195.1 E(32554): 6.1e-49 Smith-Waterman score: 1849; 35.4% identity (57.4% similar) in 1099 aa overlap (5-1097:37-935) 10 20 30 pF1KSD MATVPVYCVCRLPYDVTRPRAARPPARPGPTRAA ::::::: ::::.: . . CCDS43 AVAAGAAAGAAAAAVSVAAPGRASAPPPPPPVYCVCRQPYDVNRFMIECDICKDWFHGSC 10 20 30 40 50 60 40 50 60 70 80 90 pF1KSD QRRGRATAPDIDIYHCPNCEKTHGKSTLKKKRTWHKHGPGQAPD-VKPVQNGSQLFIKEL . : :::.:::::: ::.: .::.:.::.: . : :::: :.. ::::: CCDS43 VGVEEHHAVDIDLYHCPNCAVLHGSSLMKKRRNWHRHDYTEIDDGSKPVQAGTRTFIKEL 70 80 90 100 110 120 100 110 120 130 140 150 pF1KSD RSRTFPRAEDVVARVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYV :::.:: :.... .. ::::: :.:.::: ::.::: : ::: .:.::: : ::: :: CCDS43 RSRVFPSADEIIIKMHGSQLTQRYLEKHGFDVPIMVPKLDDLGLRLPSPTFSVMDVERYV 130 140 150 160 170 180 160 170 180 190 200 210 pF1KSD GPERSVDVTDVTKQKDCKMKLKEFVDYYYSTNRKRVLNVTNLEFSDTRMSSFVEPPDIVK : .. .:: ::..: : :: :...: :... :: .:::: .::::::.:: .:: :::.: CCDS43 GGDKVIDVIDVARQADSKMTLHNYVKYFMNPNRPKVLNVISLEFSDTKMSELVEVPDIAK 190 200 210 220 230 240 220 230 240 250 260 270 pF1KSD KLSWVENYWPDDALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRP ::::::::::::... :: : ::::. :.::::::::: ::.:.::::: ::: ::::.: CCDS43 KLSWVENYWPDDSVFPKPFVQKYCLMGVQDSYTDFHIDFGGTSVWYHVLWGEKIFYLIKP 250 260 270 280 290 300 280 290 300 310 320 330 pF1KSD ASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFA .. :.. :: : :. ..::.::.:.:::::::.::::.:::.:.:::.:.:: ::.::. CCDS43 TDENLARYESWSSSVTQSEVFFGDKVDKCYKCVVKQGHTLFVPTGWIHAVLTSQDCMAFG 310 320 330 340 350 360 340 350 360 370 380 390 pF1KSD GHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPP :.:::.:.. ::.: ::.:.::: .: .:: ::. ::...:.:::..: ...: : CCDS43 GNFLHNLNIGMQLRCYEMEKRLKTPDLFKFPFFEAICWFVAKNLLETLKELREDGFQPQT 370 380 390 400 410 420 400 410 420 430 440 450 pF1KSD HLVQGAKILNGAFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIR-LSENASKAVRPE .::::.: :. :.. : ::. ..:: :.:.. .:..:::.:.: :: . :. .: :. . CCDS43 YLVQGVKALHTALKLWMKKELVSEHAFEIPDNVRPGHLIKELSKVIRAIEEENGKPVKSQ 430 440 450 460 470 480 460 470 480 490 500 510 pF1KSD VNTVASSDEVCDGDREKEEPPSPIEATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPP . :: .: ..: :: .. CCDS43 GIPI-----VCPVSRSSNEATSPYHS---------------------------------- 490 500 520 530 540 550 560 570 pF1KSD KPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKME--PPKKGKATKS ..: .: :. : :::.:: ::.:.: ..: : .. ... CCDS43 ---------------RRKMRKLRDHNVRTPSNLDILELHTREVLKRLEMCPWEEDILSSK 510 520 530 540 550 580 590 600 610 620 630 pF1KSD VLSVPNKDVVHMQNDVERLEIREQTKSKSEAKWKYKNSKPDSLLKMEEEQKLEKSPLAGN . . :: :.: :.. .:. :.. :: . : :..:.: . CCDS43 LNGKFNK---HLQ------------PSSTVPEWRAKDNDLRLLLTNGRIIKDERQPFADQ 560 570 580 590 640 650 660 670 680 pF1KSD K-DNKFSFSFSNKKLLGSKALRPPTSPGVFGALQNFKEDKPKPVRDEYEYVSDDGELKID . . : . .:. . .. : :: :. . :.. ::. . :. .:: CCDS43 SLYTADSENEEDKRRTKKAKMKIEESSGVEGVEH---EESQKPLNGFFTRVK--SEL--- 600 610 620 630 640 690 700 710 720 730 740 pF1KSD EFPIRRKKNAPKRDLSFLLDKKAVLPTPVTKPKLDSAAYKSDDSSDEGSLHIDTDTKPGR :.... :.: :. : : : .. .:..:.:: . .: .. : CCDS43 -----RSRSSGYSDISESEDSG---PE-CTALKSIFTTEESESSGDEKKQEITSNFKEES 650 660 670 680 690 700 750 760 770 780 790 800 pF1KSD NARVKKESGSSAAGILDLLQASEEVGALEYNPSSQPPASPSTQE-AIQGMLSMANLQASD :. . ..:: :.. . : . . :.: ::.: :::::::::.:. : CCDS43 NV------------MRNFLQKSQKPSRSEIPIKRECPTSTSTEEEAIQGMLSMAGLHYS- 710 720 730 740 810 820 830 840 850 860 pF1KSD SCLQTTWGAGQAKGSSLAAHGARKNGGGSGKSAGKRLLKRAAKNSVDLDDYEEEQDHLDA .::: : .... .:.: ::. :: .. CCDS43 TCLQR-----QIQSTD---------------CSGER-------NSL--------QDP-SS 750 760 770 870 880 890 900 910 920 pF1KSD CFKDSDYVYPSLESDEDNPIFKSRSKKRKGSDDAPYSPTARVGPSVPRQDRPVREGTRVA : .. : :. : :. .. : : .: .: .. . CCDS43 CHGSNHEV---------------RQLYR-------YDKPVECGYHVKTEDPDLRTSSWIK 780 790 800 930 940 950 960 970 980 pF1KSD SIETGLAAAAAKLSQQEEQKSKKKKSAKRKLTPNTTSPSTSTSISAGTTSTSTTPASTTP ...: ... :. ..:.: :: . : ... . ....: .. CCDS43 QFDT------SRFHPQDLSRSQK---CIRKEGSSEISQRVQSRNYVDSSGSSLQNGKYMQ 810 820 830 840 850 860 990 1000 1010 1020 1030 1040 pF1KSD ASTTPASTTPASTSTASSQASQEGSSPEPPPESHSSSLADHEYTAAGTFTGAQAGRTSQP : . .... : :. . ::: : : :. : CCDS43 NS---------NLTSGACQISNGSLSPERPVGETSFSV---------------------P 870 880 890 1050 1060 1070 1080 1090 1100 pF1KSD MAPGVFLTQRRPSASSPNNNTAAKGKRTKKGMATAKQRLGKILKIHRNGKLLL . : :.: : : .: :.:::: ::::::::::::::::..::: CCDS43 LHP----TKRPASNPPPISNQATKGKRPKKGMATAKQRLGKILKLNRNGHARFFV 900 910 920 930 940 >>CCDS41849.1 KDM2B gene_id:84678|Hs108|chr12 (1265 aa) initn: 926 init1: 549 opt: 572 Z-score: 337.3 bits: 74.4 E(32554): 1.8e-12 Smith-Waterman score: 856; 34.4% identity (63.0% similar) in 454 aa overlap (78-506:27-467) 50 60 70 80 90 100 pF1KSD YHCPNCEKTHGKSTLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKE-LRSRTFPRAEDVVA ::. . . . ..: :::. . : : CCDS41 MEAEKDSGRRLRPIDRQRYDENEDLSDVEEIVSVRGFSLEEKLRSQLYQ--GDFVH 10 20 30 40 50 110 120 130 140 150 160 pF1KSD RVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTK . :.... :...... :.. .:::::. .: : : : ::. :: .: ::: ::. CCDS41 AMEGKDFNYEYVQREALRVPLIFREKDGLGIKMPDPDFTVRDVKLLVGSRRLVDVMDVNT 60 70 80 90 100 110 170 180 190 200 210 220 pF1KSD QKDCKMKLKEFVDYYYS--TNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPD :: .:....:: :: . ..: .. :: .:::: :.. .:. : .: ..::.:.::. CCDS41 QKGTEMSMSQFVRYYETPEAQRDKLYNVISLEFSHTKLEHLVKRPTVVDLVDWVDNMWPQ 120 130 140 150 160 170 230 240 250 260 270 pF1KSD D------------ALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIR : . ::: ::::. :: .:::::: ::.:.::::..: : :.:: CCDS41 HLKEKQTEATNAIAEMKYPKVKKYCLMSVKGCFTDFHIDFGGTSVWYHVFRGGKIFWLIP 180 190 200 210 220 230 280 290 300 310 320 330 pF1KSD PASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAF :. :..:::.: ....:..:..:.:..: . .::: :.:::::::.:. :::: :.: CCDS41 PTLHNLALYEEWVLSGKQSDIFLGDRVERCQRIELKQGYTFFIPSGWIHAVYTPVDSLVF 240 250 260 270 280 290 340 350 360 370 380 390 pF1KSD AGHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWY-MGKHLLEAFKGSHKSGK-Q .:..:::..: ::.: ::.: : .. ..: . ::: . ... . . :: . . : CCDS41 GGNILHSFNVPMQLRIYEIEDRTRVQPKFRYPFYYEMCWYVLERYVYCVTQRSHLTQEYQ 300 310 320 330 340 350 400 410 420 430 440 pF1KSD LPPHLVQGAKI--LNG-AFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIRLSENASK :... . ..: . :: . . : :. :.. . :: : : .. CCDS41 RESMLIDAPRKPSIDGFSSDSWLEMEE--EACDQQPQEEEE----KDEEGEGR-----DR 360 370 380 390 400 450 460 470 480 490 500 pF1KSD AVRPEVNTVASSDEVCDGDREK--EEPPSPIEATPPQSLLEKV--SKKKTPKTVKMPK-P : .: .. .: . . :.: ..: .: ..: .. : :.: .: .:: : CCDS41 APKPPTDGSTSPTSTPSEDQEALGKKPKAPALRFLKRTLSNESEESVKSTTLAVDYPKTP 410 420 430 440 450 460 510 520 530 540 550 560 pF1KSD SKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKMEPP . : CCDS41 TGSPATEVSAKWTHLTEFELKGLKALVEKLESLPENKKCVPEGIEDPQALLEGVKNVLKE 470 480 490 500 510 520 >>CCDS41850.1 KDM2B gene_id:84678|Hs108|chr12 (1336 aa) initn: 814 init1: 549 opt: 572 Z-score: 337.0 bits: 74.4 E(32554): 1.9e-12 Smith-Waterman score: 856; 34.4% identity (63.0% similar) in 454 aa overlap (78-506:58-498) 50 60 70 80 90 100 pF1KSD YHCPNCEKTHGKSTLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKE-LRSRTFPRAEDVVA ::. . . . ..: :::. . : : CCDS41 TVIYTKCFEFESATQRPIDRQRYDENEDLSDVEEIVSVRGFSLEEKLRSQLYQ--GDFVH 30 40 50 60 70 80 110 120 130 140 150 160 pF1KSD RVPGSQLTLGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTK . :.... :...... :.. .:::::. .: : : : ::. :: .: ::: ::. CCDS41 AMEGKDFNYEYVQREALRVPLIFREKDGLGIKMPDPDFTVRDVKLLVGSRRLVDVMDVNT 90 100 110 120 130 140 170 180 190 200 210 220 pF1KSD QKDCKMKLKEFVDYYYS--TNRKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWPD :: .:....:: :: . ..: .. :: .:::: :.. .:. : .: ..::.:.::. CCDS41 QKGTEMSMSQFVRYYETPEAQRDKLYNVISLEFSHTKLEHLVKRPTVVDLVDWVDNMWPQ 150 160 170 180 190 200 230 240 250 260 270 pF1KSD D------------ALLAKPKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIR : . ::: ::::. :: .:::::: ::.:.::::..: : :.:: CCDS41 HLKEKQTEATNAIAEMKYPKVKKYCLMSVKGCFTDFHIDFGGTSVWYHVFRGGKIFWLIP 210 220 230 240 250 260 280 290 300 310 320 330 pF1KSD PASANISLYERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAF :. :..:::.: ....:..:..:.:..: . .::: :.:::::::.:. :::: :.: CCDS41 PTLHNLALYEEWVLSGKQSDIFLGDRVERCQRIELKQGYTFFIPSGWIHAVYTPVDSLVF 270 280 290 300 310 320 340 350 360 370 380 390 pF1KSD AGHFLHSLSVEMQMRAYEVERRLKLGSLTQFPNFETACWY-MGKHLLEAFKGSHKSGK-Q .:..:::..: ::.: ::.: : .. ..: . ::: . ... . . :: . . : CCDS41 GGNILHSFNVPMQLRIYEIEDRTRVQPKFRYPFYYEMCWYVLERYVYCVTQRSHLTQEYQ 330 340 350 360 370 380 400 410 420 430 440 pF1KSD LPPHLVQGAKI--LNG-AFRSWTKKQALAEHEDELPEHFKPSQLIKDLAKEIRLSENASK :... . ..: . :: . . : :. :.. . :: : : .. CCDS41 RESMLIDAPRKPSIDGFSSDSWLEMEE--EACDQQPQEEEE----KDEEGEGR-----DR 390 400 410 420 430 450 460 470 480 490 500 pF1KSD AVRPEVNTVASSDEVCDGDREK--EEPPSPIEATPPQSLLEKV--SKKKTPKTVKMPK-P : .: .. .: . . :.: ..: .: ..: .. : :.: .: .:: : CCDS41 APKPPTDGSTSPTSTPSEDQEALGKKPKAPALRFLKRTLSNESEESVKSTTLAVDYPKTP 440 450 460 470 480 490 510 520 530 540 550 560 pF1KSD SKIPKPPKPPKPPRPPKTLKLKDGGKKKGKKSRESASPTIPNLDLLEAHTKEALTKMEPP . : CCDS41 TGSPATEVSAKWTHLTEFELKGLKALVEKLESLPENKKCVPEGIEDPQALLEGVKNVLKE 500 510 520 530 540 550 >>CCDS44657.1 KDM2A gene_id:22992|Hs108|chr11 (1162 aa) initn: 692 init1: 517 opt: 522 Z-score: 309.5 bits: 69.1 E(32554): 6.4e-11 Smith-Waterman score: 805; 33.1% identity (65.4% similar) in 402 aa overlap (85-467:34-431) 60 70 80 90 100 110 pF1KSD KTHGKSTLKKKRTWHKHGPGQAPDVKPVQNGSQLFIKELRSRTFPRAEDVVARVPGSQLT :.. : : . .: . :. . :.... CCDS44 EEERIRYSQRLRGTMRRRYEDDGISDDEIEGKRTFDLEEKLHTNKYNANFVTFMEGKDFN 10 20 30 40 50 60 120 130 140 150 160 170 pF1KSD LGYMEEHGFTEPILVPKKDGLGLAVPAPTFYVSDVENYVGPERSVDVTDVTKQKDCKMKL . :... :. .:.. ..::::. .: : : :.::. :: .: ::: ::. :: .: . CCDS44 VEYIQRGGLRDPLIFKNSDGLGIKMPDPDFTVNDVKMCVGSRRMVDVMDVNTQKGIEMTM 70 80 90 100 110 120 180 190 200 210 220 pF1KSD KEFVDYYYSTN--RKRVLNVTNLEFSDTRMSSFVEPPDIVKKLSWVENYWP--------- ... :: . . :... :: .:::: ::. ..:. :. : ..::.:.:: CCDS44 AQWTRYYETPEEEREKLYNVISLEFSHTRLENMVQRPSTVDFIDWVDNMWPRHLKESQTE 130 140 150 160 170 180 230 240 250 260 270 280 pF1KSD -DDALLAK--PKVTKYCLICVKDSYTDFHIDSGGASAWYHVLKGEKTFYLIRPASANISL .:.: ::: ::::. :. :::::.: ::.:.:::. .: :.:.:: :.. :. : CCDS44 STNAILEMQYPKVQKYCLMSVRGCYTDFHVDFGGTSVWYHIHQGGKVFWLIPPTAHNLEL 190 200 210 220 230 240 290 300 310 320 330 340 pF1KSD YERWRSASNHSEMFFADQVDKCYKCIVKQGQTLFIPSGWIYATLTPVDCLAFAGHFLHSL :: : .......:..:.:. : . .::: :. ::::::.:. ::.: :.:.:.::::. CCDS44 YENWLLSGKQGDIFLGDRVSDCQRIELKQGYTFVIPSGWIHAVYTPTDTLVFGGNFLHSF 250 260 270 280 290 300 350 360 370 380 390 400 pF1KSD SVEMQMRAYEVERRLKLGSLTQFPNFETACWYMGKHLLEAFKGSHKSGKQLPPHLVQGAK .. ::.. :..: : .. . ..: . :::. .. . . . . :.. . .. CCDS44 NIPMQLKIYNIEDRTRVPNKFRYPFYYEMCWYVLERYVYCITNRSHLTKEFQKESLSMDL 310 320 330 340 350 360 410 420 430 440 450 pF1KSD ILNGAFRSWTKKQALAEHEDELPEHF--KPSQLIKDLAKEIRLSENA-SKAVR--PEVNT ::: . ..:. :. :... . : : . .:. . :. .. .:. : : .. CCDS44 ELNGLESGNGDEEAV----DREPRRLSSRRSVLTSPVANGVNLDYDGLGKTCRSLPSLKK 370 380 390 400 410 460 470 480 490 500 510 pF1KSD VASSDEVCDGDREKEEPPSPIEATPPQSLLEKVSKKKTPKTVKMPKPSKIPKPPKPPKPP . ..: : .: CCDS44 TLAGDSSSDCSRGSHNGQVWDPQCAPRKDRQVHLTHFELEGLRCLVDKLESLPLHKKCVP 420 430 440 450 460 470 1101 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 02:35:04 2016 done: Thu Nov 3 02:35:05 2016 Total Scan time: 4.640 Total Display time: 0.340 Function used was FASTA [36.3.4 Apr, 2011]