FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6107, 580 aa 1>>>pF1KB6107 580 - 580 aa - 580 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.2604+/-0.000855; mu= 14.7456+/- 0.052 mean_var=100.1225+/-19.778, 0's: 0 Z-trim(109.7): 44 B-trim: 37 in 1/49 Lambda= 0.128177 statistics sampled from 11011 (11050) to 11011 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.703), E-opt: 0.2 (0.339), width: 16 Scan time: 3.390 The best scores are: opt bits E(32554) CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 ( 580) 4028 755.5 4e-218 CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 ( 599) 4028 755.5 4.2e-218 CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 ( 371) 2530 478.4 6.9e-135 CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 ( 593) 1673 320.0 5.1e-87 CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 ( 491) 1432 275.4 1.1e-73 CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 ( 567) 1409 271.2 2.5e-72 CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 ( 457) 1300 251.0 2.4e-66 CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 ( 536) 1274 246.2 7.7e-65 CCDS35117.1 PHF19 gene_id:26147|Hs108|chr9 ( 207) 1103 214.3 1.2e-55 >>CCDS35116.1 PHF19 gene_id:26147|Hs108|chr9 (580 aa) initn: 4028 init1: 4028 opt: 4028 Z-score: 4029.4 bits: 755.5 E(32554): 4e-218 Smith-Waterman score: 4028; 100.0% identity (100.0% similar) in 580 aa overlap (1-580:1-580) 10 20 30 40 50 60 pF1KB6 MENRALDPGTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MENRALDPGTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 KRVSSSKQSCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KRVSSSKQSCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 LGYHQQCHIPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LGYHQQCHIPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 EELEWDSPHRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EELEWDSPHRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 FFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFEEILAFVNHHWELLQLGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 FFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFEEILAFVNHHWELLQLGK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 LTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 ENSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLEDAIPSSDFTSAWSTNHHLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ENSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLEDAIPSSDFTSAWSTNHHLA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 SIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLAAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLAAK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 AYMPLRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFESISEDDSSLSHLKSSIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AYMPLRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFESISEDDSSLSHLKSSIT 490 500 510 520 530 540 550 560 570 580 pF1KB6 NYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY :::::::::::::::::::::::::::::::::::::::: CCDS35 NYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY 550 560 570 580 >>CCDS75889.1 PHF19 gene_id:26147|Hs108|chr9 (599 aa) initn: 4028 init1: 4028 opt: 4028 Z-score: 4029.2 bits: 755.5 E(32554): 4.2e-218 Smith-Waterman score: 4028; 100.0% identity (100.0% similar) in 580 aa overlap (1-580:20-599) 10 20 30 40 pF1KB6 MENRALDPGTRDSYGATSHLPNKGALAKVKNNFKDLMSKLT ::::::::::::::::::::::::::::::::::::::::: CCDS75 MLVLVIRGPYPSAQCQGKLMENRALDPGTRDSYGATSHLPNKGALAKVKNNFKDLMSKLT 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB6 EGQYVLCRWTDGLYYLGKIKRVSSSKQSCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 EGQYVLCRWTDGLYYLGKIKRVSSSKQSCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNI 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB6 CLGKTSGPLNEILICGKCGLGYHQQCHIPIAGSADQPLLTPWFCRRCIFALAVRKGGALK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 CLGKTSGPLNEILICGKCGLGYHQQCHIPIAGSADQPLLTPWFCRRCIFALAVRKGGALK 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB6 KGAIARTLQAVKMVLSYQPEELEWDSPHRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 KGAIARTLQAVKMVLSYQPEELEWDSPHRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFH 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB6 EACTQCLNEPMMFGDRFYLFFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 EACTQCLNEPMMFGDRFYLFFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFD 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB6 FEEILAFVNHHWELLQLGKLTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 FEEILAFVNHHWELLQLGKLTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRI 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB6 RVPPNPPGKLLPDKGLLPNENSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 RVPPNPPGKLLPDKGLLPNENSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLE 370 380 390 400 410 420 410 420 430 440 450 460 pF1KB6 DAIPSSDFTSAWSTNHHLASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 DAIPSSDFTSAWSTNHHLASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTS 430 440 450 460 470 480 470 480 490 500 510 520 pF1KB6 LSYDSRWTVGSRKRKLAAKAYMPLRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LSYDSRWTVGSRKRKLAAKAYMPLRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHT 490 500 510 520 530 540 530 540 550 560 570 580 pF1KB6 FESISEDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 FESISEDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY 550 560 570 580 590 >>CCDS69648.1 PHF19 gene_id:26147|Hs108|chr9 (371 aa) initn: 2530 init1: 2530 opt: 2530 Z-score: 2535.1 bits: 478.4 E(32554): 6.9e-135 Smith-Waterman score: 2530; 100.0% identity (100.0% similar) in 371 aa overlap (210-580:1-371) 180 190 200 210 220 230 pF1KB6 PEELEWDSPHRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFY :::::::::::::::::::::::::::::: CCDS69 MLQCYRCRQWFHEACTQCLNEPMMFGDRFY 10 20 30 240 250 260 270 280 290 pF1KB6 LFFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFEEILAFVNHHWELLQLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 LFFCSVCNQGPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFEEILAFVNHHWELLQLG 40 50 60 70 80 90 300 310 320 330 340 350 pF1KB6 KLTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 KLTSTPVTDRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLP 100 110 120 130 140 150 360 370 380 390 400 410 pF1KB6 NENSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLEDAIPSSDFTSAWSTNHHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 NENSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLEDAIPSSDFTSAWSTNHHL 160 170 180 190 200 210 420 430 440 450 460 470 pF1KB6 ASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 ASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLAA 220 230 240 250 260 270 480 490 500 510 520 530 pF1KB6 KAYMPLRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFESISEDDSSLSHLKSSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 KAYMPLRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFESISEDDSSLSHLKSSI 280 290 300 310 320 330 540 550 560 570 580 pF1KB6 TNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY ::::::::::::::::::::::::::::::::::::::::: CCDS69 TNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY 340 350 360 370 >>CCDS742.1 MTF2 gene_id:22823|Hs108|chr1 (593 aa) initn: 1651 init1: 1138 opt: 1673 Z-score: 1675.7 bits: 320.0 E(32554): 5.1e-87 Smith-Waterman score: 1686; 47.7% identity (70.8% similar) in 562 aa overlap (39-578:45-591) 10 20 30 40 50 60 pF1KB6 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ :. ::: :: ::.:::.::: ::... :: CCDS74 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB6 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH ::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: :: CCDS74 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB6 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP : :. :.::.:.:: ....::::::: :..::..:..: :. .::::. CCDS74 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB6 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ :.:: :::::::::::.:::.:::: .:.:::::::.:::..::.:::::: :.::::.. CCDS74 HKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVCSS 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB6 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT ::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. :.:..:: . CCDS74 GPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTPKS 260 270 280 290 300 310 310 320 330 340 350 360 pF1KB6 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPNENSASSE .: :.:.:::.::. :. :::::::: .: ::::::: ::. . . :. .: . CCDS74 ERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE-PEGTSHEFK 320 330 340 350 360 370 370 380 390 400 410 pF1KB6 LRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDFTSAWSTNHH .. : ::: .: .. .:. : : :.. . : : : : : : CCDS74 IKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESI-SENPT 380 390 400 410 420 430 420 430 440 450 460 470 pF1KB6 LASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLA : :. . .. .: :..: :::: : :.:.. ..:.:.: . :::: . CCDS74 L----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS-DSRKRTRT 440 450 460 470 480 480 490 500 510 520 pF1KB6 AKAY---MP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--------SIS .... .: :: .: :: : . : . ::: ... :. ... CCDS74 GRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLA 490 500 510 520 530 530 540 550 560 570 580 pF1KB6 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY ... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::.: CCDS74 DQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 540 550 560 570 580 590 >>CCDS53341.1 MTF2 gene_id:22823|Hs108|chr1 (491 aa) initn: 1410 init1: 897 opt: 1432 Z-score: 1436.0 bits: 275.4 E(32554): 1.1e-73 Smith-Waterman score: 1445; 46.6% identity (69.9% similar) in 502 aa overlap (99-578:3-489) 70 80 90 100 110 120 pF1KB6 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH :.:: . : ::..:: ::: :::: :: CCDS53 MVCTICQEEYSEAPNEMVICDKCGQGYHQLCH 10 20 30 130 140 150 160 170 180 pF1KB6 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP : :. :.::.:.:: ....::::::: :..::..:..: :. .::::. CCDS53 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB6 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ :.:: :::::::::::.:::.:::: .:.:::::::.:::..::.:::::: :.::::.. CCDS53 HKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVCSS 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB6 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT ::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. :.:..:: . CCDS53 GPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTPKS 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB6 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPPNPPGKLLPDKGLLPNENSASSE .: :.:.:::.::. :. :::::::: .: ::::::: ::. . . :. .: . CCDS53 ERYEHVLEALNDYKTMFMSGKEIKKKKHLFGLRIRVPPVPPNVAFKAEKE-PEGTSHEFK 220 230 240 250 260 270 370 380 390 400 410 pF1KB6 LRKRGKSKPGLLPHEFQQ------QKRRVYRRK---RSKFLLEDAIPSSDFTSAWSTNHH .. : ::: .: .. .:. : : :.. . : : : : : : CCDS53 IKGRKASKPISDSREVSNGIEKKGKKKSVGRPPGPYTRKMIQKTAEPLLDKESI-SENPT 280 290 300 310 320 330 420 430 440 450 460 470 pF1KB6 LASIFDFTLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLA : :. . .. .: :..: :::: : :.:.. ..:.:.: . :::: . CCDS53 L----DLPCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS-DSRKRTRT 340 350 360 370 380 480 490 500 510 520 pF1KB6 AKAY---MP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--------SIS .... .: :: .: :: : . : . ::: ... :. ... CCDS53 GRSWPAAIPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLA 390 400 410 420 430 530 540 550 560 570 580 pF1KB6 EDDSSLSHLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY ... .:.:::.:::.:::::::.::::::.::::::: .:::::::::::.: CCDS53 DQELQLNHLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 440 450 460 470 480 490 >>CCDS4777.1 PHF1 gene_id:5252|Hs108|chr6 (567 aa) initn: 1168 init1: 1073 opt: 1409 Z-score: 1412.2 bits: 271.2 E(32554): 2.5e-72 Smith-Waterman score: 1409; 43.1% identity (66.5% similar) in 547 aa overlap (39-576:30-563) 10 20 30 40 50 60 pF1KB6 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ .: ::: :: :::::: ::: ::.:.:... CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSARE 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH ::: :::.:.. ::::::. :..:::: : .: ..: : :... : :: .:::.:: CCDS47 VCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCH 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP .: : . . : : ::.:.::.:...::::::: ::.. ..:. : : . :.::. CCDS47 VPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB6 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ : .:.:: :::::::::: :.:::: : :::::::::::..:...::::: : : :: CCDS47 HLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB6 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT ::: ..:: ::::::.::.::.:.: :::::::. ::: :....:. : ::.:..:: CCDS47 GPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB6 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPP--NPP---GKLLP-DKGLLPNE .:. .::.::::.:.::. :.::::.::.: :. :.:: .:: : : .: :. CCDS47 ERSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTSFPSGQGPG- 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB6 NSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLEDAIPSSDFTSAWSTNHHLAS ...: : :: . .: : ..:: .: . . . .. :. . : :: CCDS47 GGVSRPLGKRRRPEPEPL---RRRQKGKVEELGPPSAVRNQPEPQEQRERAHLQRALQAS 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB6 IFDFTLDEIQSLKSASSGQTFF-SDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLAAK . . . :: .. ::: .: .:. .. :: : .. : :. . CCDS47 VSPPSPSPNQSYQG-SSGYNFRPTDARCLPSSPIRMFASFHPSASTAGTSGDS----GPP 420 430 440 450 460 470 490 500 510 520 530 pF1KB6 AYMPLRAK-RWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFESISEDDSSLSHLKSSI ::. . . ... : . .: ..:: :. :. .. : ::: .. CCDS47 DRSPLELHIGFPTDIPKSAPHSMTASSSSVSS-PSPGLPRRS-APPSPLCRSLS--PGTG 480 490 500 510 520 540 550 560 570 580 pF1KB6 TNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY . :..: :. :. .:::::: :.:.::::::: : CCDS47 GGVRGGVGYLSRGDPVRVLARRVRPDGSVQYLVEWGGGGIF 530 540 550 560 >>CCDS4778.1 PHF1 gene_id:5252|Hs108|chr6 (457 aa) initn: 1108 init1: 1073 opt: 1300 Z-score: 1304.6 bits: 251.0 E(32554): 2.4e-66 Smith-Waterman score: 1303; 51.9% identity (75.2% similar) in 351 aa overlap (39-374:30-380) 10 20 30 40 50 60 pF1KB6 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ .: ::: :: :::::: ::: ::.:.:... CCDS47 MAQPPRLSRSGASSLWDPASPAPTSGPRPRLWEGQDVLARWTDGLLYLGTIKKVDSARE 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH ::: :::.:.. ::::::. :..:::: : .: ..: : :... : :: .:::.:: CCDS47 VCLVQFEDDSQFLVLWKDISPAALPGEELLCCVCRSETVVPGNRLVSCEKCRHAYHQDCH 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP .: : . . : : ::.:.::.:...::::::: ::.. ..:. : : . :.::. CCDS47 VPRAPAPGEGEGTSWVCRQCVFAIATKRGGALKKGPYARAMLGMKLSLPYGLKGLDWDAG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB6 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ : .:.:: :::::::::: :.:::: : :::::::::::..:...::::: : : :: CCDS47 HLSNRQQSYCYCGGPGEWNLKMLQCRSCLQWFHEACTQCLSKPLLYGDRFYEFECCVCRG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB6 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT ::: ..:: ::::::.::.::.:.: :::::::. ::: :....:. : ::.:..:: CCDS47 GPEKVRRLQLRWVDVAHLVLYHLSVCCKKKYFDFDREILPFTSENWDSLLLGELSDTPKG 240 250 260 270 280 290 310 320 330 340 350 pF1KB6 DRGPHLLNALNSYKSRFLCGKEIKKKKCIFRLRIRVPP--NPP------------GKLLP .:. .::.::::.:.::. :.::::.::.: :. :.:: .:: :. : CCDS47 ERSSRLLSALNSHKDRFISGREIKKRKCLFGLHARMPPPVEPPTGDGALTRAGPWGRGLT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB6 DKGLLPNENSASSELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLEDAIPSSDFTSAW . : :. .. . : . .:.: CCDS47 SPGEAPEAGARAPEEEAEGESGGAGATLSSAQSARAPGAEGAGSSAEGTAAAPSGCLLPS 360 370 380 390 400 410 >>CCDS53340.1 MTF2 gene_id:22823|Hs108|chr1 (536 aa) initn: 1525 init1: 1138 opt: 1274 Z-score: 1277.6 bits: 246.2 E(32554): 7.7e-65 Smith-Waterman score: 1500; 45.2% identity (66.5% similar) in 555 aa overlap (39-578:45-534) 10 20 30 40 50 60 pF1KB6 GTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKIKRVSSSKQ :. ::: :: ::.:::.::: ::... :: CCDS53 RSPLRRNQKTPTSLTKLSLQDGHKAKKPACKFEEGQDVLARWSDGLFYLGTIKKINILKQ 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB6 SCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCGLGYHQQCH ::.. :::.:: :::::::: ... . : :.:: . : ::..:: ::: :::: :: CCDS53 SCFIIFEDSSKSWVLWKDIQTGATGSGEMVCTICQEEYSEAPNEMVICDKCGQGYHQLCH 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB6 IPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQPEELEWDSP : :. :.::.:.:: ....::::::: :..::..:..: :. .::::. CCDS53 TPHIDSSVIDSDEKWLCRQCVFATTTKRGGALKKGPNAKALQVMKQTLPYSVADLEWDAG 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB6 HRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYLFFCSVCNQ :.:: :::::::::::.:::.:::: .:.:::::::.:::..::.:::::: :.::::.. CCDS53 HKTNVQQCYCYCGGPGDWYLKMLQCCKCKQWFHEACVQCLQKPMLFGDRFYTFICSVCSS 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB6 GPEYIERLPLRWVDVVHLALYNLGVQSKKKYFDFE-EILAFVNHHWELLQLGKLTSTPVT ::::..::::.:::..:: ::::.: :::::: : :.....:..:. :. :.:..:: . CCDS53 GPEYLKRLPLQWVDIAHLCLYNLSVIHKKKYFDSELELMTYINENWDRLHPGELADTPKS 260 270 280 290 300 310 310 320 330 340 350 360 pF1KB6 DRGPHLLNALNSYKSRFLC-GKEIK-KKKCIFRLRIRVPPNPPGKLLPDKGLLPNENSAS .: :.:.:::.::. . : : : ::: . : ::.: CCDS53 ERYEHVLEALNDYKTMEVSNGIEKKGKKKSVGR-----PPGP------------------ 320 330 340 350 370 380 390 400 410 420 pF1KB6 SELRKRGKSKPGLLPHEFQQQKRRVYRRKRSKFLLEDAIPSSDFTSAWSTNHHLASIFDF : : :.. . : : : : : : : :. CCDS53 -------------------------YTR---KMIQKTAEPLLDKESI-SENPTL----DL 360 370 430 440 450 460 470 480 pF1KB6 TLDEIQSLKSASSGQTFFSDVDSTDAASTSGSASTSLSYDSRWTVGSRKRKLAAKAY--- . .. .: :..: :::: : :.:.. ..:.:.: . :::: ..... CCDS53 PCSIGRTEGTAHSSNT--SDVDFTGASSAKETTSSSISRHYGLS-DSRKRTRTGRSWPAA 380 390 400 410 420 430 490 500 510 520 530 pF1KB6 MP-LRAKRWAAELDGRCPSDSSAEGASVPERPDEGIDSHTFE--------SISEDDSSLS .: :: .: :: : . : . ::: ... :. ...... .:. CCDS53 IPHLRRRR------GRLPRRALQTQNSEIVKDDEGKEDYQFDELNTEILNNLADQELQLN 440 450 460 470 480 540 550 560 570 580 pF1KB6 HLKSSITNYFGAAGRLACGEKYQVLARRVTPEGKVQYLVEWEGTTPY :::.:::.:::::::.::::::.::::::: .:::::::::::.: CCDS53 HLKNSITSYFGAAGRIACGEKYRVLARRVTLDGKVQYLVEWEGATAS 490 500 510 520 530 >>CCDS35117.1 PHF19 gene_id:26147|Hs108|chr9 (207 aa) initn: 1103 init1: 1103 opt: 1103 Z-score: 1112.6 bits: 214.3 E(32554): 1.2e-55 Smith-Waterman score: 1103; 100.0% identity (100.0% similar) in 155 aa overlap (1-155:1-155) 10 20 30 40 50 60 pF1KB6 MENRALDPGTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MENRALDPGTRDSYGATSHLPNKGALAKVKNNFKDLMSKLTEGQYVLCRWTDGLYYLGKI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 KRVSSSKQSCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KRVSSSKQSCLVTFEDNSKYWVLWKDIQHAGVPGEEPKCNICLGKTSGPLNEILICGKCG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 LGYHQQCHIPIAGSADQPLLTPWFCRRCIFALAVRKGGALKKGAIARTLQAVKMVLSYQP ::::::::::::::::::::::::::::::::::: CCDS35 LGYHQQCHIPIAGSADQPLLTPWFCRRCIFALAVRVSLPSSPVPASPASSSGADQRLPSQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 EELEWDSPHRTNQQQCYCYCGGPGEWYLRMLQCYRCRQWFHEACTQCLNEPMMFGDRFYL CCDS35 SLSSKQKGHTWALETDSASATVLGQDL 190 200 580 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 10:54:46 2016 done: Sat Nov 5 10:54:47 2016 Total Scan time: 3.390 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]