FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5477, 391 aa 1>>>pF1KB5477 391 - 391 aa - 391 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.0361+/-0.000959; mu= 0.9236+/- 0.056 mean_var=284.3959+/-72.806, 0's: 0 Z-trim(114.3): 61 B-trim: 1484 in 2/49 Lambda= 0.076052 statistics sampled from 14821 (14890) to 14821 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.789), E-opt: 0.2 (0.457), width: 16 Scan time: 3.140 The best scores are: opt bits E(32554) CCDS8100.1 DPF2 gene_id:5977|Hs108|chr11 ( 391) 2773 317.4 1.4e-86 CCDS81583.1 DPF2 gene_id:5977|Hs108|chr11 ( 405) 1454 172.7 5.3e-43 CCDS46064.1 DPF1 gene_id:8193|Hs108|chr19 ( 414) 1265 152.0 9.3e-37 CCDS61497.1 DPF3 gene_id:8110|Hs108|chr14 ( 378) 1191 143.8 2.4e-34 CCDS46065.1 DPF1 gene_id:8193|Hs108|chr19 ( 332) 992 121.9 8.3e-28 CCDS45133.1 DPF3 gene_id:8110|Hs108|chr14 ( 357) 665 86.1 5.5e-17 CCDS61495.1 DPF3 gene_id:8110|Hs108|chr14 ( 367) 665 86.1 5.6e-17 CCDS61496.1 DPF3 gene_id:8110|Hs108|chr14 ( 412) 665 86.2 6.1e-17 CCDS33008.2 DPF1 gene_id:8193|Hs108|chr19 ( 380) 529 71.2 1.8e-12 CCDS58084.1 KAT6B gene_id:23522|Hs108|chr10 (1781) 508 69.6 2.6e-11 CCDS58085.1 KAT6B gene_id:23522|Hs108|chr10 (1890) 508 69.6 2.7e-11 CCDS7345.1 KAT6B gene_id:23522|Hs108|chr10 (2073) 508 69.7 2.8e-11 CCDS83290.1 KAT6A gene_id:7994|Hs108|chr8 ( 815) 489 67.1 6.3e-11 >>CCDS8100.1 DPF2 gene_id:5977|Hs108|chr11 (391 aa) initn: 2773 init1: 2773 opt: 2773 Z-score: 1667.9 bits: 317.4 E(32554): 1.4e-86 Smith-Waterman score: 2773; 100.0% identity (100.0% similar) in 391 aa overlap (1-391:1-391) 10 20 30 40 50 60 pF1KB5 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCAERSVRLPFLDSQTGVAQSNCYIWMEKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCAERSVRLPFLDSQTGVAQSNCYIWMEKR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 HRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEGLISQDGSSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 HRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEGLISQDGSSLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 ALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRARKRILEPDDFLDDLDDEDYEEDTPKRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 ALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRARKRILEPDDFLDDLDDEDYEEDTPKRR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 GKGKSKGKGVGSARKKLDASILEDRDKPYACDICGKRYKNRPGLSYHYAHSHLAEEEGED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GKGKSKGKGVGSARKKLDASILEDRDKPYACDICGKRYKNRPGLSYHYAHSHLAEEEGED 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKTGQPEELVSCSDCGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 KEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKTGQPEELVSCSDCGR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 SGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCDDCDRGYHMYCLTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 SGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCDDCDRGYHMYCLTPS 310 320 330 340 350 360 370 380 390 pF1KB5 MSEPPEGSWSCHLCLDLLKEKASIYQNQNSS ::::::::::::::::::::::::::::::: CCDS81 MSEPPEGSWSCHLCLDLLKEKASIYQNQNSS 370 380 390 >>CCDS81583.1 DPF2 gene_id:5977|Hs108|chr11 (405 aa) initn: 2758 init1: 1454 opt: 1454 Z-score: 885.6 bits: 172.7 E(32554): 5.3e-43 Smith-Waterman score: 2734; 96.3% identity (96.5% similar) in 405 aa overlap (1-391:1-405) 10 20 30 40 50 60 pF1KB5 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCAERSVRLPFLDSQTGVAQSNCYIWMEKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCAERSVRLPFLDSQTGVAQSNCYIWMEKR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 HRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEGLISQDGSSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 HRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEGLISQDGSSLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 ALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRARKRILEPDDFLDDLDDEDYEEDTPKRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 ALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRARKRILEPDDFLDDLDDEDYEEDTPKRR 130 140 150 160 170 180 190 200 210 220 pF1KB5 GKGKSKGKGVGSARKKLDASILEDRDKPYACD--------------ICGKRYKNRPGLSY :::::::::::::::::::::::::::::::: .::::::::::::: CCDS81 GKGKSKGKGVGSARKKLDASILEDRDKPYACDNSFKQKHTSKAPQRVCGKRYKNRPGLSY 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB5 HYAHSHLAEEEGEDKEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 HYAHSHLAEEEGEDKEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKT 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB5 GQPEELVSCSDCGRSGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GQPEELVSCSDCGRSGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCD 310 320 330 340 350 360 350 360 370 380 390 pF1KB5 DCDRGYHMYCLTPSMSEPPEGSWSCHLCLDLLKEKASIYQNQNSS ::::::::::::::::::::::::::::::::::::::::::::: CCDS81 DCDRGYHMYCLTPSMSEPPEGSWSCHLCLDLLKEKASIYQNQNSS 370 380 390 400 >>CCDS46064.1 DPF1 gene_id:8193|Hs108|chr19 (414 aa) initn: 1704 init1: 664 opt: 1265 Z-score: 773.4 bits: 152.0 E(32554): 9.3e-37 Smith-Waterman score: 1615; 59.7% identity (77.1% similar) in 402 aa overlap (1-385:28-410) 10 20 30 pF1KB5 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCA ::.:. . ..: ::..:..:.:.:..::::::: CCDS46 MGGLSARPTAGRTDPAGTCWGQDPGSKMATVIPGPLSL-GEDFYREAIEHCRSYNARLCA 10 20 30 40 50 40 50 60 70 80 90 pF1KB5 ERSVRLPFLDSQTGVAQSNCYIWMEKRHRGPGLASGQLYSYPARRWRKKRRAHPPEDPRL :::.:::::::::::::.:::::::: ::::::: ::.:.:::: :::::: . ::::: CCDS46 ERSLRLPFLDSQTGVAQNNCYIWMEKTHRGPGLAPGQIYTYPARCWRKKRRLNILEDPRL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB5 SFPSIKPDTDQTLKKEGLISQDGSSLEALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRA : : . ::::: . . : ::::: .. ::. .. : : . . CCDS46 RPCEYKIDCEAPLKKEGGLPE-GPVLEALLCAETGEKK------IE---LKEEETIMDCQ 120 130 140 150 160 160 170 180 190 200 210 pF1KB5 RKRILEPDDFLDDLDDEDYEEDTPKRRGKGKSKGKGVGSARKKLDASILEDRDKPYACDI ....:: : ::. :: :.: :.:....:.:. :.:. ::. :.. ::::::::.::: CCDS46 KQQLLE---FPHDLEVEDLEDDIPRRKNRAKGKAYGIGGLRKRQDTASLEDRDKPYVCDI 170 180 190 200 210 220 220 230 240 250 pF1KB5 CGKRYKNRPGLSYHYAHSHLAEEEGEDKEDSQP-P----------------TPVSQRSEE :::::::::::::::.:.::::::::.. . . : .: .:: . CCDS46 CGKRYKNRPGLSYHYTHTHLAEEEGEENAERHALPFHRKNNHKQFYKELAWVPEAQR--K 230 240 250 260 270 280 260 270 280 290 300 310 pF1KB5 QKSKKGPDGLALPNNYCDFCLGDSKINKKTGQPEELVSCSDCGRSGHPSCLQFTPVMMAA . .::.::: ..::.::::::: :: ::: ::.:.::.:::::::::::::: : :: CCDS46 HTAKKAPDGTVIPNGYCDFCLGGSK---KTGCPEDLISCADCGRSGHPSCLQFTVNMTAA 290 300 310 320 330 340 320 330 340 350 360 370 pF1KB5 VKTYRWQCIECKCCNICGTSENDDQLLFCDDCDRGYHMYCLTPSMSEPPEGSWSCHLCLD :.:::::::::: :..:::::::::::::::::::::::::.: :.::::::::::::: CCDS46 VRTYRWQCIECKSCSLCGTSENDDQLLFCDDCDRGYHMYCLSPPMAEPPEGSWSCHLCLR 350 360 370 380 390 400 380 390 pF1KB5 LLKEKASIYQNQNSS :::::: : CCDS46 HLKEKASAYITLT 410 >>CCDS61497.1 DPF3 gene_id:8110|Hs108|chr14 (378 aa) initn: 1867 init1: 1170 opt: 1191 Z-score: 730.0 bits: 143.8 E(32554): 2.4e-34 Smith-Waterman score: 1802; 63.0% identity (85.1% similar) in 389 aa overlap (1-388:1-377) 10 20 30 40 50 60 pF1KB5 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCAERSVRLPFLDSQTGVAQSNCYIWMEKR ::.:..: .: ::.:.::.:.:.:..::.:::::::::::::::::::::.::::::::: CCDS61 MATVIHNPLKALGDQFYKEAIEHCRSYNSRLCAERSVRLPFLDSQTGVAQNNCYIWMEKR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 HRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEGLISQDGSSLE ::::::: ::::.:::: :::::: ::::::.: . :::... :::.:. :.. ..:: CCDS61 HRGPGLAPGQLYTYPARCWRKKRRLHPPEDPKLRLLEIKPEVELPLKKDGFTSES-TTLE 70 80 90 100 110 130 140 150 160 170 pF1KB5 ALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRARKRILEPDDFLDDLDDE-DYEEDTPKR :::: . .::. : : ...:. :. .:.:: :. ... ..: : ::: ::: CCDS61 ALLRGEGVEKK--VDAR-EEESIQEI--------QRVLENDENVEEGNEEEDLEEDIPKR 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 RGKGKSKGKGVGSARKKLDASILEDRDKPYACDICGKRYKNRPGLSYHYAHSHLAEEEGE ... .....: ...:.. ::. ::.::::.::::::::::::::::::::.::: :::. CCDS61 KNRTRGRARGSAGGRRRHDAASQEDHDKPYVCDICGKRYKNRPGLSYHYAHTHLASEEGD 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 DKEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKTGQPEELVSCSDCG . .:.. .: ..:.:... .::::: ..:::::::::: :..:::.:.:::::::.::: CCDS61 EAQDQETRSPPNHRNENHRPQKGPDGTVIPNNYCDFCLGGSNMNKKSGRPEELVSCADCG 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 RSGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCDDCDRGYHMYCLTP :::::.::::: : :::::.::::::: : .:::::::::::::::::::::::::.: CCDS61 RSGHPTCLQFTLNMTEAVKTYKWQCIECKSCILCGTSENDDQLLFCDDCDRGYHMYCLNP 290 300 310 320 330 340 360 370 380 390 pF1KB5 SMSEPPEGSWSCHLCLDLLKEKASIYQNQNSS ..:::::::::::: .::::::: . : CCDS61 PVAEPPEGSWSCHLCWELLKEKASAFGCQA 350 360 370 >>CCDS46065.1 DPF1 gene_id:8193|Hs108|chr19 (332 aa) initn: 1457 init1: 664 opt: 992 Z-score: 612.7 bits: 121.9 E(32554): 8.3e-28 Smith-Waterman score: 1342; 58.4% identity (74.3% similar) in 346 aa overlap (57-385:1-328) 30 40 50 60 70 80 pF1KB5 YNARLCAERSVRLPFLDSQTGVAQSNCYIWMEKRHRGPGLASGQLYSYPARRWRKKRRAH ::: ::::::: ::.:.:::: :::::: . CCDS46 MEKTHRGPGLAPGQIYTYPARCWRKKRRLN 10 20 30 90 100 110 120 130 140 pF1KB5 PPEDPRLSFPSIKPDTDQTLKKEGLISQDGSSLEALLRTDPLEKRGAPDPRVDDDSLGEF ::::: : : . ::::: . . : ::::: .. ::. .. : : CCDS46 ILEDPRLRPCEYKIDCEAPLKKEGGLPE-GPVLEALLCAETGEKK------IE---LKEE 40 50 60 70 80 150 160 170 180 190 200 pF1KB5 PVTNSRARKRILEPDDFLDDLDDEDYEEDTPKRRGKGKSKGKGVGSARKKLDASILEDRD . . ....:: : ::. :: :.: :.:....:.:. :.:. ::. :.. ::::: CCDS46 ETIMDCQKQQLLE---FPHDLEVEDLEDDIPRRKNRAKGKAYGIGGLRKRQDTASLEDRD 90 100 110 120 130 210 220 230 240 pF1KB5 KPYACDICGKRYKNRPGLSYHYAHSHLAEEEGEDKEDSQP-P----------------TP :::.::::::::::::::::::.:.::::::::.. . . : .: CCDS46 KPYVCDICGKRYKNRPGLSYHYTHTHLAEEEGEENAERHALPFHRKNNHKQFYKELAWVP 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB5 VSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKTGQPEELVSCSDCGRSGHPSCLQF .:: .. .::.::: ..::.::::::: :: ::: ::.:.::.::::::::::::: CCDS46 EAQR--KHTAKKAPDGTVIPNGYCDFCLGGSK---KTGCPEDLISCADCGRSGHPSCLQF 200 210 220 230 240 250 310 320 330 340 350 360 pF1KB5 TPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCDDCDRGYHMYCLTPSMSEPPEGSW : : :::.:::::::::: :..:::::::::::::::::::::::::.: :.::::::: CCDS46 TVNMTAAVRTYRWQCIECKSCSLCGTSENDDQLLFCDDCDRGYHMYCLSPPMAEPPEGSW 260 270 280 290 300 310 370 380 390 pF1KB5 SCHLCLDLLKEKASIYQNQNSS :::::: :::::: : CCDS46 SCHLCLRHLKEKASAYITLT 320 330 >>CCDS45133.1 DPF3 gene_id:8110|Hs108|chr14 (357 aa) initn: 1263 init1: 648 opt: 665 Z-score: 418.4 bits: 86.1 E(32554): 5.5e-17 Smith-Waterman score: 1276; 58.6% identity (84.5% similar) in 304 aa overlap (1-303:1-292) 10 20 30 40 50 60 pF1KB5 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCAERSVRLPFLDSQTGVAQSNCYIWMEKR ::.:..: .: ::.:.::.:.:.:..::.:::::::::::::::::::::.::::::::: CCDS45 MATVIHNPLKALGDQFYKEAIEHCRSYNSRLCAERSVRLPFLDSQTGVAQNNCYIWMEKR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 HRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEGLISQDGSSLE ::::::: ::::.:::: :::::: ::::::.: . :::... :::.:. :.. ..:: CCDS45 HRGPGLAPGQLYTYPARCWRKKRRLHPPEDPKLRLLEIKPEVELPLKKDGFTSES-TTLE 70 80 90 100 110 130 140 150 160 170 pF1KB5 ALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRARKRILEPDDFLDDLDDE-DYEEDTPKR :::: . .::. : : ...:. :. .:.:: :. ... ..: : ::: ::: CCDS45 ALLRGEGVEKK--VDAR-EEESIQEI--------QRVLENDENVEEGNEEEDLEEDIPKR 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 RGKGKSKGKGVGSARKKLDASILEDRDKPYACDICGKRYKNRPGLSYHYAHSHLAEEEGE ... .....: ...:.. ::. ::.::::.::::::::::::::::::::.::: :::. CCDS45 KNRTRGRARGSAGGRRRHDAASQEDHDKPYVCDICGKRYKNRPGLSYHYAHTHLASEEGD 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 DKEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKTGQPEELVSCSDCG . .:.. .: ..:.:... .::::: ..:::::::::: :..:::.:.:::::::.::: CCDS45 EAQDQETRSPPNHRNENHRPQKGPDGTVIPNNYCDFCLGGSNMNKKSGRPEELVSCADCG 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 RSGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCDDCDRGYHMYCLTP ::.: CCDS45 RSAHLGGEGRKEKEAAAAARTTEDLFGSTSESDTSTFHGFDEDDLEEPRSCRGRRSGRGS 290 300 310 320 330 340 >>CCDS61495.1 DPF3 gene_id:8110|Hs108|chr14 (367 aa) initn: 1233 init1: 648 opt: 665 Z-score: 418.2 bits: 86.1 E(32554): 5.6e-17 Smith-Waterman score: 1246; 59.0% identity (84.6% similar) in 293 aa overlap (12-303:22-302) 10 20 30 40 50 pF1KB5 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCAERSVRLPFLDSQTGVAQ ::.:.::.:.:.:..::.::::::::::::::::::::: CCDS61 MGFTDLEEPISGCPGGPWALGLGDQFYKEAIEHCRSYNSRLCAERSVRLPFLDSQTGVAQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 SNCYIWMEKRHRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEG .:::::::::::::::: ::::.:::: :::::: ::::::.: . :::... :::.: CCDS61 NNCYIWMEKRHRGPGLAPGQLYTYPARCWRKKRRLHPPEDPKLRLLEIKPEVELPLKKDG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 LISQDGSSLEALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRARKRILEPDDFLDDLDDE . :.. ..:::::: . .::. : : ...:. :. .:.:: :. ... ..: CCDS61 FTSES-TTLEALLRGEGVEKK--VDAR-EEESIQEI--------QRVLENDENVEEGNEE 130 140 150 160 180 190 200 210 220 pF1KB5 -DYEEDTPKRRGKGKSKGKGVGSARKKLDASILEDRDKPYACDICGKRYKNRPGLSYHYA : ::: :::... .....: ...:.. ::. ::.::::.::::::::::::::::::: CCDS61 EDLEEDIPKRKNRTRGRARGSAGGRRRHDAASQEDHDKPYVCDICGKRYKNRPGLSYHYA 170 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 HSHLAEEEGEDKEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDFCLGDSKINKKTGQP :.::: :::.. .:.. .: ..:.:... .::::: ..:::::::::: :..:::.:.: CCDS61 HTHLASEEGDEAQDQETRSPPNHRNENHRPQKGPDGTVIPNNYCDFCLGGSNMNKKSGRP 230 240 250 260 270 280 290 300 310 320 330 340 pF1KB5 EELVSCSDCGRSGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGTSENDDQLLFCDDCD ::::::.:::::.: CCDS61 EELVSCADCGRSAHLGGEGRKEKEAAAAARTTEDLFGSTSESDTSTFHGFDEDDLEEPRS 290 300 310 320 330 340 >>CCDS61496.1 DPF3 gene_id:8110|Hs108|chr14 (412 aa) initn: 1233 init1: 648 opt: 665 Z-score: 417.6 bits: 86.2 E(32554): 6.1e-17 Smith-Waterman score: 1247; 57.8% identity (83.8% similar) in 303 aa overlap (5-303:57-347) 10 20 30 pF1KB5 MAAVVENVVKL---LGEQYYKDAMEQCHNYNARL .::. .. ::.:.::.:.:.:..::.:: CCDS61 LFLPNPQLIFSFPISSRNHITGLMPPGKLKLENLFHMCTRLGDQFYKEAIEHCRSYNSRL 30 40 50 60 70 80 40 50 60 70 80 90 pF1KB5 CAERSVRLPFLDSQTGVAQSNCYIWMEKRHRGPGLASGQLYSYPARRWRKKRRAHPPEDP :::::::::::::::::::.:::::::::::::::: ::::.:::: :::::: :::::: CCDS61 CAERSVRLPFLDSQTGVAQNNCYIWMEKRHRGPGLAPGQLYTYPARCWRKKRRLHPPEDP 90 100 110 120 130 140 100 110 120 130 140 150 pF1KB5 RLSFPSIKPDTDQTLKKEGLISQDGSSLEALLRTDPLEKRGAPDPRVDDDSLGEFPVTNS .: . :::... :::.:. :.. ..:::::: . .::. : : ...:. :. CCDS61 KLRLLEIKPEVELPLKKDGFTSES-TTLEALLRGEGVEKK--VDAR-EEESIQEI----- 150 160 170 180 190 160 170 180 190 200 210 pF1KB5 RARKRILEPDDFLDDLDDE-DYEEDTPKRRGKGKSKGKGVGSARKKLDASILEDRDKPYA .:.:: :. ... ..: : ::: :::... .....: ...:.. ::. ::.::::. CCDS61 ---QRVLENDENVEEGNEEEDLEEDIPKRKNRTRGRARGSAGGRRRHDAASQEDHDKPYV 200 210 220 230 240 250 220 230 240 250 260 270 pF1KB5 CDICGKRYKNRPGLSYHYAHSHLAEEEGEDKEDSQPPTPVSQRSEEQKSKKGPDGLALPN ::::::::::::::::::::.::: :::.. .:.. .: ..:.:... .::::: ..:: CCDS61 CDICGKRYKNRPGLSYHYAHTHLASEEGDEAQDQETRSPPNHRNENHRPQKGPDGTVIPN 260 270 280 290 300 310 280 290 300 310 320 330 pF1KB5 NYCDFCLGDSKINKKTGQPEELVSCSDCGRSGHPSCLQFTPVMMAAVKTYRWQCIECKCC :::::::: :..:::.:.:::::::.:::::.: CCDS61 NYCDFCLGGSNMNKKSGRPEELVSCADCGRSAHLGGEGRKEKEAAAAARTTEDLFGSTSE 320 330 340 350 360 370 340 350 360 370 380 390 pF1KB5 NICGTSENDDQLLFCDDCDRGYHMYCLTPSMSEPPEGSWSCHLCLDLLKEKASIYQNQNS CCDS61 SDTSTFHGFDEDDLEEPRSCRGRRSGRGSPTADKKGSC 380 390 400 410 >>CCDS33008.2 DPF1 gene_id:8193|Hs108|chr19 (380 aa) initn: 1311 init1: 496 opt: 529 Z-score: 337.4 bits: 71.2 E(32554): 1.8e-12 Smith-Waterman score: 1383; 55.2% identity (72.2% similar) in 395 aa overlap (1-385:28-376) 10 20 30 pF1KB5 MAAVVENVVKLLGEQYYKDAMEQCHNYNARLCA ::.:. . ..: ::..:..:.:.:..::::::: CCDS33 MGGLSARPTAGRTDPAGTCWGQDPGSKMATVIPGPLSL-GEDFYREAIEHCRSYNARLCA 10 20 30 40 50 40 50 60 70 80 90 pF1KB5 ERSVRLPFLDSQTGVAQSNCYIWMEKRHRGPGLASGQLYSYPARRWRKKRRAHPPEDPRL :::.:::::::::::::.:::::::: ::::::: ::.:.:::: :::::: . ::::: CCDS33 ERSLRLPFLDSQTGVAQNNCYIWMEKTHRGPGLAPGQIYTYPARCWRKKRRLNILEDPRL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB5 SFPSIKPDTDQTLKKEGLISQDGSSLEALLRTDPLEKRGAPDPRVDDDSLGEFPVTNSRA : : . ::::: . . : ::::: .. ::. .. : : . . CCDS33 RPCEYKIDCEAPLKKEGGLPE-GPVLEALLCAETGEKK------IE---LKEEETIMDCQ 120 130 140 150 160 160 170 180 190 200 210 pF1KB5 RKRILEPDDFLDDLDDEDYEEDTPKRRGKGKSKGKGVGSARKKLDASILEDRDKPYACDI ....:: : ::. :: :.: :.:....:.:. :.:. ::. :.. ::::::::.:: CCDS33 KQQLLE---FPHDLEVEDLEDDIPRRKNRAKGKAYGIGGLRKRQDTASLEDRDKPYVCD- 170 180 190 200 210 220 220 230 240 250 260 270 pF1KB5 CGKRYKNRPGLSYHYAHSHLAEEEGEDKEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYC : ::. :.. .: .:: .. .::.::: ..::.:: CCDS33 --KFYKE---LAW---------------------VPEAQR--KHTAKKAPDGTVIPNGYC 230 240 250 280 290 300 310 320 330 pF1KB5 DFCLGDSKINKKTGQPEELVSCSDCGRSGHPSCLQFTPVMMAAVKTYRWQCIECKCCNIC ::::: :: ::: ::.:.::.:::::::::::::: : :::.:::::::::: :..: CCDS33 DFCLGGSK---KTGCPEDLISCADCGRSGHPSCLQFTVNMTAAVRTYRWQCIECKSCSLC 260 270 280 290 300 310 340 350 360 370 380 pF1KB5 GTSEND----------DQLLFCDDCDRGYHMYCLTPSMSEPPEGSWSCHLCLDLLKEKAS :::::: ::::::::::::::::::.: :.::::::::::::: :::::: CCDS33 GTSENDGASWAGLTPQDQLLFCDDCDRGYHMYCLSPPMAEPPEGSWSCHLCLRHLKEKAS 320 330 340 350 360 370 390 pF1KB5 IYQNQNSS : CCDS33 AYITLT 380 >>CCDS58084.1 KAT6B gene_id:23522|Hs108|chr10 (1781 aa) initn: 427 init1: 255 opt: 508 Z-score: 316.7 bits: 69.6 E(32554): 2.6e-11 Smith-Waterman score: 508; 32.3% identity (56.9% similar) in 325 aa overlap (81-383:21-332) 60 70 80 90 100 110 pF1KB5 SNCYIWMEKRHRGPGLASGQLYSYPARRWRKKRRAHPPEDPRLSFPSIKPDTDQTLKKEG ::.. .: :. : . :. .: CCDS58 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQ 10 20 30 40 50 120 130 140 150 160 pF1KB5 L-IS-QDGSSLEALLRTDPLEKRGAPD-P-RVDDDSLGEFPVTNSRARKRILEPDDFLDD : .: :::: :. . . : . :: : : .. . : :: . . .: .: CCDS58 LELSVQDGSVLK--VTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSC-------ND 60 70 80 90 100 170 180 190 200 210 220 pF1KB5 LDDEDYEEDTPKR-RGKGKSKGKGVGSARKKL--DASILEDRDKP---YACDICGKRYKN : . :... . .: . .:... . .: : .... ..: . .:: : CCDS58 LRNVDWNKLLRRAIEGLEEPNGSSLKNIEKYLRSQSDLTSTTNNPAFQQRLRLGAKRAVN 110 120 130 140 150 160 230 240 250 260 270 pF1KB5 -----RPGLSYHYAHSHLAEEEGEDKEDSQPPTPVSQRSEEQKSKKGPDGLALPNNYCDF . : .:. .. : . .: . : :. . : . : : . .: :.: CCDS58 NGRLLKDGPQYRVNYGSL-DGKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIP--ICSF 170 180 190 200 210 280 290 300 310 320 330 pF1KB5 CLGDSKINKKTGQPEELVSCSDCGRSGHPSCLQFTPVMMAAVKTYRWQCIECKCCNICGT ::: .. :.. .::::.::.::: :::::::.: : . . ::. :::::::: :. : . CCDS58 CLGTKESNREK-KPEELLSCADCGSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRV 220 230 240 250 260 270 340 350 360 370 380 pF1KB5 S-ENDDQLLFCDDCDRGYHMYCLTPSMSEPPEGSWSCHLCLD------LLKEKASIYQNQ . .: :..::::.::::.:: : : .:. :.: : :..: ::.:::. CCDS58 QGRNADNMLFCDSCDRGFHMECCDPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRR 280 290 300 310 320 330 390 pF1KB5 NSS CCDS58 YAKPIGRPKNKLKQRLLSVTSDEGSMNAFTGRGSPDTEIKINIKQESADVNVIGNKDVVT 340 350 360 370 380 390 391 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 03:47:48 2016 done: Fri Nov 4 03:47:49 2016 Total Scan time: 3.140 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]