FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9664, 458 aa 1>>>pF1KB9664 458 - 458 aa - 458 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9962+/-0.0014; mu= 11.0474+/- 0.083 mean_var=227.7233+/-45.826, 0's: 0 Z-trim(106.0): 944 B-trim: 5 in 1/51 Lambda= 0.084991 statistics sampled from 7700 (8718) to 7700 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.268), width: 16 Scan time: 2.710 The best scores are: opt bits E(32554) CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 ( 458) 3237 410.7 1.6e-114 CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 ( 606) 1382 183.4 5.5e-46 CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 ( 748) 1335 177.8 3.4e-44 CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 ( 799) 1335 177.8 3.5e-44 CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 ( 819) 1330 177.2 5.5e-44 CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 ( 825) 1330 177.2 5.5e-44 CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 ( 682) 1312 174.9 2.3e-43 CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 ( 803) 1301 173.7 6.4e-43 CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 ( 738) 1300 173.5 6.6e-43 CCDS54939.1 ZNF300 gene_id:91975|Hs108|chr5 ( 568) 1295 172.7 8.6e-43 CCDS12637.1 ZNF112 gene_id:7771|Hs108|chr19 ( 907) 1298 173.4 8.8e-43 CCDS54276.1 ZNF112 gene_id:7771|Hs108|chr19 ( 913) 1298 173.4 8.9e-43 CCDS4311.2 ZNF300 gene_id:91975|Hs108|chr5 ( 604) 1295 172.8 8.9e-43 CCDS54940.1 ZNF300 gene_id:91975|Hs108|chr5 ( 620) 1295 172.8 9.1e-43 CCDS62707.1 ZNF180 gene_id:7733|Hs108|chr19 ( 665) 1289 172.1 1.6e-42 CCDS62708.1 ZNF180 gene_id:7733|Hs108|chr19 ( 667) 1289 172.1 1.6e-42 CCDS12639.1 ZNF180 gene_id:7733|Hs108|chr19 ( 692) 1289 172.1 1.6e-42 CCDS4440.1 ZFP2 gene_id:80108|Hs108|chr5 ( 461) 1269 169.4 6.9e-42 CCDS233.1 ZNF436 gene_id:80818|Hs108|chr1 ( 470) 1267 169.2 8.3e-42 CCDS46101.1 ZNF234 gene_id:10780|Hs108|chr19 ( 700) 1266 169.3 1.1e-41 CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 1262 168.8 1.6e-41 CCDS74472.1 ZNF135 gene_id:7694|Hs108|chr19 ( 616) 1260 168.5 1.8e-41 CCDS74471.1 ZNF135 gene_id:7694|Hs108|chr19 ( 658) 1260 168.5 1.8e-41 CCDS12970.2 ZNF135 gene_id:7694|Hs108|chr19 ( 670) 1260 168.5 1.9e-41 CCDS54329.1 ZNF135 gene_id:7694|Hs108|chr19 ( 682) 1260 168.5 1.9e-41 CCDS47352.1 ZNF879 gene_id:345462|Hs108|chr5 ( 563) 1254 167.7 2.8e-41 CCDS10329.2 ZSCAN2 gene_id:54993|Hs108|chr15 ( 614) 1253 167.6 3.2e-41 CCDS75971.1 ZNF630 gene_id:57232|Hs108|chrX ( 533) 1250 167.2 3.8e-41 CCDS2715.1 ZKSCAN7 gene_id:55888|Hs108|chr3 ( 754) 1251 167.5 4.3e-41 CCDS35237.2 ZNF630 gene_id:57232|Hs108|chrX ( 657) 1250 167.3 4.3e-41 CCDS12498.1 ZNF420 gene_id:147923|Hs108|chr19 ( 688) 1250 167.3 4.4e-41 CCDS82413.1 ZNF544 gene_id:27300|Hs108|chr19 ( 687) 1247 166.9 5.7e-41 CCDS12973.1 ZNF544 gene_id:27300|Hs108|chr19 ( 715) 1247 167.0 5.8e-41 CCDS75904.1 ZNF79 gene_id:7633|Hs108|chr9 ( 364) 1238 165.5 8.4e-41 CCDS69664.1 ZNF79 gene_id:7633|Hs108|chr9 ( 474) 1238 165.6 9.8e-41 CCDS74322.1 ZNF91 gene_id:7644|Hs108|chr19 (1159) 1244 166.9 1e-40 CCDS6871.1 ZNF79 gene_id:7633|Hs108|chr9 ( 498) 1238 165.6 1e-40 CCDS42541.1 ZNF91 gene_id:7644|Hs108|chr19 (1191) 1244 166.9 1e-40 CCDS6437.1 ZNF16 gene_id:7564|Hs108|chr8 ( 682) 1240 166.1 1e-40 CCDS11180.1 ZNF624 gene_id:57547|Hs108|chr17 ( 865) 1238 166.0 1.4e-40 CCDS56092.1 ZNF568 gene_id:374900|Hs108|chr19 ( 580) 1232 165.0 1.8e-40 CCDS42558.1 ZNF568 gene_id:374900|Hs108|chr19 ( 644) 1232 165.1 2e-40 CCDS32977.1 ZNF85 gene_id:7639|Hs108|chr19 ( 595) 1231 164.9 2e-40 CCDS82341.1 ZNF569 gene_id:148266|Hs108|chr19 ( 527) 1230 164.7 2.1e-40 CCDS12503.1 ZNF569 gene_id:148266|Hs108|chr19 ( 686) 1230 164.9 2.4e-40 CCDS2718.2 ZNF35 gene_id:7584|Hs108|chr3 ( 527) 1226 164.2 2.9e-40 CCDS12501.1 ZNF383 gene_id:163087|Hs108|chr19 ( 475) 1225 164.0 3e-40 CCDS11067.1 ZFP3 gene_id:124961|Hs108|chr17 ( 502) 1224 163.9 3.3e-40 CCDS33090.1 ZNF616 gene_id:90317|Hs108|chr19 ( 781) 1226 164.4 3.7e-40 CCDS32981.1 ZNF675 gene_id:171392|Hs108|chr19 ( 568) 1223 163.9 3.9e-40 >>CCDS41502.1 ZNF239 gene_id:8187|Hs108|chr10 (458 aa) initn: 3237 init1: 3237 opt: 3237 Z-score: 2169.6 bits: 410.7 E(32554): 1.6e-114 Smith-Waterman score: 3237; 99.6% identity (99.8% similar) in 458 aa overlap (1-458:1-458) 10 20 30 40 50 60 pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIES 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 ETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQVKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQVKL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 VSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRGHTEEKPCD :::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::: CCDS41 VSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRAHTEEKPCD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 HNNCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQC :::::::::::::::::::::::::::: ::::::::::::::::::::::::::::::: CCDS41 HNNCGKILNTSPDGHPYEKIHTAEKQYECSQCGKNFSQSSELLLHQRDHTEEKPYKCEQC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 GKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 SQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 NLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLI 370 380 390 400 410 420 430 440 450 pF1KB9 HQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR :::::::::::::::::::::::::::::::::::::: CCDS41 HQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR 430 440 450 >>CCDS31418.1 ZNF214 gene_id:7761|Hs108|chr11 (606 aa) initn: 3477 init1: 1295 opt: 1382 Z-score: 939.1 bits: 183.4 E(32554): 5.5e-46 Smith-Waterman score: 1405; 48.7% identity (68.3% similar) in 458 aa overlap (26-453:99-548) 10 20 30 40 50 pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCF : : ::.: :. . . .:..: . CCDS31 GWWNAGAQMYENQNYGETVQGTDSKDLTQQDRSQCQEWLILSTQVPGYGNYELTFESKSL 70 80 90 100 110 120 60 70 80 90 100 110 pF1KB9 ENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESR-RLFVMEESTERKVIKGESCSE .:.. ....: . ::: . .. . . : .: :: . :: .. :. . CCDS31 RNLKYKNFMPWQSLETKTTQDYGREIYMSGSHGFQGGRYRLGI-----SRKNLSMEK-EQ 130 140 150 160 170 180 120 130 140 150 160 pF1KB9 NLQVKLVSDGQELASPLLNGEATCQNGQLKESLDPIDCNC---KDIHGWKSQVV------ .: :. : : : : . ::. :..:.. :.: : :. :.:. : CCDS31 KLIVQHSYIPVEEALPQYVG-VICQEDLLRDSMEEKYCGCNKCKGIYYWNSRCVFHKRNQ 190 200 210 220 230 240 170 180 190 200 pF1KB9 ------------SCSQQRGHTEEKPCDH-----NNCGKI---LNTSPDGHPYEKIHTAEK .: .::. ..: .: .: .. .. : : ....: .: CCDS31 PGENLCQCSICKACFSQRSDLYRHPRNHIGKKLYGCDEVDGNFHQSSGVHFHQRVHIGEV 250 260 270 280 290 300 210 220 230 240 250 260 pF1KB9 QYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKPYKC : . :::.::: : : ::: ::::: :: : : : ..:.: : ::: .: :::.:: CCDS31 PYSCNACGKSFSQISSLHNHQRVHTEEKFYKIE-CDKDLSRNSLLHIHQRLHIGEKPFKC 310 320 330 340 350 360 270 280 290 300 310 320 pF1KB9 DKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECEECG ..:::.:.::: : .:. :::::::::::.:::::::::.:.::: :::::: :.::.:: CCDS31 NQCGKSFNRSSVLHVHQRVHTGEKPYKCDECGKGFSQSSNLRIHQLVHTGEKSYKCEDCG 370 380 390 400 410 420 330 340 350 360 370 380 pF1KB9 MSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGKGFS .:.:::::.:::::::::.:::: .::: ::.::.:.::. .::::::: : ::::::: CCDS31 KGFTQRSNLQIHQRVHTGEKPYKCDDCGKDFSHSSDLRIHQRVHTGEKPYTCPECGKGFS 430 440 450 460 470 480 390 400 410 420 430 440 pF1KB9 QSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQSSN .:: :. : :::::::::.: .::::::: :.::::::::::::::.: ::::::.::: CCDS31 KSSKLHTHQRVHTGEKPYKCEECGKGFSQRSHLLIHQRVHTGEKPYKCHDCGKGFSHSSN 490 500 510 520 530 540 450 pF1KB9 LHIHQRVHKKDPR :::::::: CCDS31 LHIHQRVHTGEKPYQCAKCGKGFSHSSALRIHQRVHAGEKPYKCREYYKGFDHNSHLHNN 550 560 570 580 590 600 >>CCDS74388.1 ZNF227 gene_id:7770|Hs108|chr19 (748 aa) initn: 2601 init1: 1334 opt: 1335 Z-score: 906.9 bits: 177.8 E(32554): 3.4e-44 Smith-Waterman score: 1341; 48.1% identity (70.6% similar) in 428 aa overlap (34-453:107-519) 10 20 30 40 50 60 pF1KB9 TITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIESETY :..: : .. : .: ..:: CCDS74 TRCLQGKSSQLLQGDSIQVSENENNIMNPKGDSSIYIENQEFPFWRTQHSC-----GNTY 80 90 100 110 120 130 70 80 90 100 110 pF1KB9 LPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGES----CSENLQVK : :::... ... ::. : :.. :..: .. :: .. :. : : CCDS74 LS---ESQIQSRGKQIDV-KNNLQIHED-----FMKKSPFHEHIKTDTEPKPCKGNEYGK 140 150 160 170 180 120 130 140 150 160 170 pF1KB9 LVSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRGHTEEKPC ..:::.. :: . : . : .: ..: .. . :. : : . .: CCDS74 IISDGSNQKLPLGEKPHPCGECGRGFSYSPRLPLHPNVHTGEKCFSQSSHLRTHQRIHPG 190 200 210 220 230 240 180 190 200 210 220 230 pF1KB9 DH-NNC---GKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPY .. : : : .: : . : :.. ::.::.:. ..:::.::.:. :..: : :: :::: CCDS74 EKLNRCHESGDCFNKS-SFHSYQSNHTGEKSYRCDSCGKGFSSSTGLIIHYRTHTGEKPY 250 260 270 280 290 300 240 250 260 270 280 290 pF1KB9 KCEQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDK :::.::: :..::.. :: :::.::::::..::::: : .: .:. :: :::::::.. CCDS74 KCEECGKCFSQSSNFQCHQRVHTEEKPYKCEECGKGFGWSVNLRVHQRVHRGEKPYKCEE 310 320 330 340 350 360 300 310 320 330 340 350 pF1KB9 CGKGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKG :::::.:....:::::::::::::.:. :: .::. : : :.::::::.:::: :::: CCDS74 CGKGFTQAAHFHIHQRVHTGEKPYKCDVCGKGFSHNSPLICHRRVHTGEKPYKCEACGKG 370 380 390 400 410 420 360 370 380 390 400 410 pF1KB9 FSQSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQS :.....:::: .:::::::.: ::::::::.:.:..: :::::: ..: :::::::: CCDS74 FTRNTDLHIHFRVHTGEKPYKCKECGKGFSQASNLQVHQNVHTGEKRFKCETCGKGFSQS 430 440 450 460 470 480 420 430 440 450 pF1KB9 SKLLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR ::: :::::::::::.:. ::: :: ::::..:: .: CCDS74 SKLQTHQRVHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLH 490 500 510 520 530 540 CCDS74 AHQRVHSGEKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQR 550 560 570 580 590 600 >-- initn: 2719 init1: 1041 opt: 1041 Z-score: 712.1 bits: 141.7 E(32554): 2.4e-33 Smith-Waterman score: 1041; 62.5% identity (79.9% similar) in 224 aa overlap (230-453:520-743) 200 210 220 230 240 250 pF1KB9 IHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTD : :::::::.:::::. :.: :: ::. CCDS74 VHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLHAHQRVHSG 490 500 510 520 530 540 260 270 280 290 300 310 pF1KB9 EKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPY ::::::..: :.:... .. .:. :::::::::: ::::::::: :. ::::::::::: CCDS74 EKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQRVHTGEKPY 550 560 570 580 590 600 320 330 340 350 360 370 pF1KB9 ECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYE .:. :: .: :.. ::: ::::.:::: ::::::..: ::. :. .::::::. : : CCDS74 KCDVCGKGFRYSSQFIYHQRGHTGEKPYKCEECGKGFGRSLNLRHHQRVHTGEKPHICEE 610 620 630 640 650 660 380 390 400 410 420 430 pF1KB9 CGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKG :::.:: :.::.:: ::: :: ..: .::::::::..: :::::::::::.:. : : CCDS74 CGKAFSLPSNLRVHLGVHTREKLFKCEECGKGFSQSARLEAHQRVHTGEKPYKCDICDKD 670 680 690 700 710 720 440 450 pF1KB9 FSQSSNLHIHQRVHKKDPR : . : : ::.:: CCDS74 FRHRSRLTYHQKVHTGKKL 730 740 >>CCDS12636.1 ZNF227 gene_id:7770|Hs108|chr19 (799 aa) initn: 2601 init1: 1334 opt: 1335 Z-score: 906.6 bits: 177.8 E(32554): 3.5e-44 Smith-Waterman score: 1341; 48.1% identity (70.6% similar) in 428 aa overlap (34-453:158-570) 10 20 30 40 50 60 pF1KB9 TITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSPISRNRDSVMTLQSGCFENIESETY :..: : .. : .: ..:: CCDS12 TRCLQGKSSQLLQGDSIQVSENENNIMNPKGDSSIYIENQEFPFWRTQHSC-----GNTY 130 140 150 160 170 180 70 80 90 100 110 pF1KB9 LPLKVSSQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGES----CSENLQVK : :::... ... ::. : :.. :..: .. :: .. :. : : CCDS12 LS---ESQIQSRGKQIDV-KNNLQIHED-----FMKKSPFHEHIKTDTEPKPCKGNEYGK 190 200 210 220 230 120 130 140 150 160 170 pF1KB9 LVSDGQELASPLLNGEATCQNGQLKESLDPIDCNCKDIHGWKSQVVSCSQQRGHTEEKPC ..:::.. :: . : . : .: ..: .. . :. : : . .: CCDS12 IISDGSNQKLPLGEKPHPCGECGRGFSYSPRLPLHPNVHTGEKCFSQSSHLRTHQRIHPG 240 250 260 270 280 290 180 190 200 210 220 230 pF1KB9 DH-NNC---GKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPY .. : : : .: : . : :.. ::.::.:. ..:::.::.:. :..: : :: :::: CCDS12 EKLNRCHESGDCFNKS-SFHSYQSNHTGEKSYRCDSCGKGFSSSTGLIIHYRTHTGEKPY 300 310 320 330 340 350 240 250 260 270 280 290 pF1KB9 KCEQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDK :::.::: :..::.. :: :::.::::::..::::: : .: .:. :: :::::::.. CCDS12 KCEECGKCFSQSSNFQCHQRVHTEEKPYKCEECGKGFGWSVNLRVHQRVHRGEKPYKCEE 360 370 380 390 400 410 300 310 320 330 340 350 pF1KB9 CGKGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKG :::::.:....:::::::::::::.:. :: .::. : : :.::::::.:::: :::: CCDS12 CGKGFTQAAHFHIHQRVHTGEKPYKCDVCGKGFSHNSPLICHRRVHTGEKPYKCEACGKG 420 430 440 450 460 470 360 370 380 390 400 410 pF1KB9 FSQSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQS :.....:::: .:::::::.: ::::::::.:.:..: :::::: ..: :::::::: CCDS12 FTRNTDLHIHFRVHTGEKPYKCKECGKGFSQASNLQVHQNVHTGEKRFKCETCGKGFSQS 480 490 500 510 520 530 420 430 440 450 pF1KB9 SKLLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR ::: :::::::::::.:. ::: :: ::::..:: .: CCDS12 SKLQTHQRVHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLH 540 550 560 570 580 590 CCDS12 AHQRVHSGEKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQR 600 610 620 630 640 650 >-- initn: 2719 init1: 1041 opt: 1041 Z-score: 711.8 bits: 141.8 E(32554): 2.5e-33 Smith-Waterman score: 1041; 62.5% identity (79.9% similar) in 224 aa overlap (230-453:571-794) 200 210 220 230 240 250 pF1KB9 IHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTD : :::::::.:::::. :.: :: ::. CCDS12 VHTGEKPYRCDVCGKDFSYSSNLKLHQVIHTGEKPYKCEECGKGFSWRSNLHAHQRVHSG 550 560 570 580 590 600 260 270 280 290 300 310 pF1KB9 EKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPY ::::::..: :.:... .. .:. :::::::::: ::::::::: :. ::::::::::: CCDS12 EKPYKCEQCDKSFSQAIDFRVHQRVHTGEKPYKCGVCGKGFSQSSGLQSHQRVHTGEKPY 610 620 630 640 650 660 320 330 340 350 360 370 pF1KB9 ECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYE .:. :: .: :.. ::: ::::.:::: ::::::..: ::. :. .::::::. : : CCDS12 KCDVCGKGFRYSSQFIYHQRGHTGEKPYKCEECGKGFGRSLNLRHHQRVHTGEKPHICEE 670 680 690 700 710 720 380 390 400 410 420 430 pF1KB9 CGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKG :::.:: :.::.:: ::: :: ..: .::::::::..: :::::::::::.:. : : CCDS12 CGKAFSLPSNLRVHLGVHTREKLFKCEECGKGFSQSARLEAHQRVHTGEKPYKCDICDKD 730 740 750 760 770 780 440 450 pF1KB9 FSQSSNLHIHQRVHKKDPR : . : : ::.:: CCDS12 FRHRSRLTYHQKVHTGKKL 790 >>CCDS62706.1 ZNF229 gene_id:7772|Hs108|chr19 (819 aa) initn: 2214 init1: 1294 opt: 1330 Z-score: 903.2 bits: 177.2 E(32554): 5.5e-44 Smith-Waterman score: 1330; 54.8% identity (74.4% similar) in 356 aa overlap (108-453:462-812) 80 90 100 110 120 130 pF1KB9 SVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQV-KLVSDGQELASPLLNGEA :: ::: .:. . . :.. . :.. CCDS62 CGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKG 440 450 460 470 480 490 140 150 160 170 180 pF1KB9 TCQNGQLKE------SLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEKP--CDHNNCGKI .:. :. . :: : ...: .. .:: :: ::: :. ::: CCDS62 FSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLM--HQRLHTGEKPYKCE---CGKS 500 510 520 530 540 190 200 210 220 230 240 pF1KB9 LNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRS .. : : : ....::.:: :. :.:::.: ..:.: ::: :: :.:: :. ::::: : CCDS62 FGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGKGFIYS 550 560 570 580 590 600 250 260 270 280 290 300 pF1KB9 SSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLH :.::::: ::: :::::: .:::::. ::.::::. ::::::::.:..::::: .:.:: CCDS62 SDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRCTSSLH 610 620 630 640 650 660 310 320 330 340 350 360 pF1KB9 IHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRC :::::::.::: :..:: .:: :::. :::.::::.:: : :::::: .:.: :. CCDS62 KHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGLLSHKR 670 680 690 700 710 720 370 380 390 400 410 420 pF1KB9 IHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTG .:::::::.:. ::::.:::: :. : :::::::::.: .:::::...: : .::::::: CCDS62 VHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQRVHTG 730 740 750 760 770 780 430 440 450 pF1KB9 EKPYECSKCGKGFSQSSNLHIHQRVHKKDPR :::: :. :::::: .:.:. ::::: CCDS62 EKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK 790 800 810 >-- initn: 1199 init1: 711 opt: 730 Z-score: 505.6 bits: 103.7 E(32554): 7.7e-22 Smith-Waterman score: 803; 37.1% identity (64.3% similar) in 361 aa overlap (1-353:106-461) 10 20 30 pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPC .:. . ::::: :: .:. : . : .: CCDS62 KNGKDTEYIQDEELRFFSHKELSSCKIWEEVAGELPGSQDCRVNLQGK-DFQFSEDAAPH 80 90 100 110 120 130 40 50 60 70 80 90 pF1KB9 QQWGEASSPISRNRDSVMTLQSGCFENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQ : : ::.: .. . .::. . ..:.. . .. : : : .: :. : : CCDS62 QGWEGASTPCFPIENFLDSLQGDGLIGLENQQFPAWRAIRPIPIQGSWAKAFVNQLGDVQ 140 150 160 170 180 190 100 110 120 130 140 pF1KB9 ESRRLFVMEESTERKVIKGES-CSENLQVKLVSDGQELASPLLNGEATCQNGQLKES--- : . . :... . .: : . .: :. .: : :.. .:.: CCDS62 ERCKNLDTEDTVYKCNWDDDSFCWISCHVD--HRFPEIDKP--CGCNKCRKDCIKNSVLH 200 210 220 230 240 250 150 160 170 180 190 200 pF1KB9 -LDPIDCNCKDI---HGWKSQVVSCSQQRGHTEEKPCDHNNCGKILNTSPDGHPYEKIHT ..: . . :. .:..... . : .:: :.... .. : : . .... : CCDS62 RINPGENGLKSNEYRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPT 260 270 280 290 300 310 210 220 230 240 250 260 pF1KB9 AEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKP .::. .. . :.. :.... : : . . ::.:. ::::: .: :::::.::: ..: CCDS62 GEKSVKSLERGRGVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRP 320 330 340 350 360 370 270 280 290 300 310 320 pF1KB9 YKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECE :::..:::.: :::.::.:. ::::::::::..:::::: :: :..:::.::::::: : CCDS62 YKCEECGKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCS 380 390 400 410 420 430 330 340 350 360 370 380 pF1KB9 ECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGK ::: .: .: :: ::..: ::.::.::::: CCDS62 ECGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGK 440 450 460 470 480 490 390 400 410 420 430 440 pF1KB9 GFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQ CCDS62 GFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMHQRLHTGEKPYKCECGKSFGRS 500 510 520 530 540 550 >>CCDS42574.1 ZNF229 gene_id:7772|Hs108|chr19 (825 aa) initn: 2214 init1: 1294 opt: 1330 Z-score: 903.2 bits: 177.2 E(32554): 5.5e-44 Smith-Waterman score: 1330; 54.8% identity (74.4% similar) in 356 aa overlap (108-453:468-818) 80 90 100 110 120 130 pF1KB9 SVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQV-KLVSDGQELASPLLNGEA :: ::: .:. . . :.. . :.. CCDS42 CGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGKG 440 450 460 470 480 490 140 150 160 170 180 pF1KB9 TCQNGQLKE------SLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEKP--CDHNNCGKI .:. :. . :: : ...: .. .:: :: ::: :. ::: CCDS42 FSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLM--HQRLHTGEKPYKCE---CGKS 500 510 520 530 540 550 190 200 210 220 230 240 pF1KB9 LNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRS .. : : : ....::.:: :. :.:::.: ..:.: ::: :: :.:: :. ::::: : CCDS42 FGRSSDLHIHQRVHTGEKPYKCSECGKGFRRNSDLHSHQRVHTGERPYVCDVCGKGFIYS 560 570 580 590 600 610 250 260 270 280 290 300 pF1KB9 SSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLH :.::::: ::: :::::: .:::::. ::.::::. ::::::::.:..::::: .:.:: CCDS42 SDLLIHQRVHTGEKPYKCAECGKGFSYSSGLLIHQRVHTGEKPYRCQECGKGFRCTSSLH 620 630 640 650 660 670 310 320 330 340 350 360 pF1KB9 IHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRC :::::::.::: :..:: .:: :::. :::.::::.:: : :::::: .:.: :. CCDS42 KHQRVHTGKKPYTCDQCGKGFSYGSNLRTHQRLHTGEKPYTCCECGKGFRYGSGLLSHKR 680 690 700 710 720 730 370 380 390 400 410 420 pF1KB9 IHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTG .:::::::.:. ::::.:::: :. : :::::::::.: .:::::...: : .::::::: CCDS42 VHTGEKPYRCHVCGKGYSQSSHLQGHQRVHTGEKPYKCEECGKGFGRNSCLHVHQRVHTG 740 750 760 770 780 790 430 440 450 pF1KB9 EKPYECSKCGKGFSQSSNLHIHQRVHKKDPR :::: :. :::::: .:.:. ::::: CCDS42 EKPYTCGVCGKGFSYTSGLRNHQRVHLGENPYK 800 810 820 >-- initn: 1199 init1: 711 opt: 730 Z-score: 505.6 bits: 103.7 E(32554): 7.7e-22 Smith-Waterman score: 803; 37.1% identity (64.3% similar) in 361 aa overlap (1-353:112-467) 10 20 30 pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPC .:. . ::::: :: .:. : . : .: CCDS42 KNGKDTEYIQDEELRFFSHKELSSCKIWEEVAGELPGSQDCRVNLQGK-DFQFSEDAAPH 90 100 110 120 130 140 40 50 60 70 80 90 pF1KB9 QQWGEASSPISRNRDSVMTLQSGCFENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQ : : ::.: .. . .::. . ..:.. . .. : : : .: :. : : CCDS42 QGWEGASTPCFPIENFLDSLQGDGLIGLENQQFPAWRAIRPIPIQGSWAKAFVNQLGDVQ 150 160 170 180 190 200 100 110 120 130 140 pF1KB9 ESRRLFVMEESTERKVIKGES-CSENLQVKLVSDGQELASPLLNGEATCQNGQLKES--- : . . :... . .: : . .: :. .: : :.. .:.: CCDS42 ERCKNLDTEDTVYKCNWDDDSFCWISCHVD--HRFPEIDKP--CGCNKCRKDCIKNSVLH 210 220 230 240 250 150 160 170 180 190 200 pF1KB9 -LDPIDCNCKDI---HGWKSQVVSCSQQRGHTEEKPCDHNNCGKILNTSPDGHPYEKIHT ..: . . :. .:..... . : .:: :.... .. : : . .... : CCDS42 RINPGENGLKSNEYRNGFRDDADLPPHPRVPLKEKLCQYDEFSEGLRHSAHLNRHQRVPT 260 270 280 290 300 310 210 220 230 240 250 260 pF1KB9 AEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKP .::. .. . :.. :.... : : . . ::.:. ::::: .: :::::.::: ..: CCDS42 GEKSVKSLERGRGVRQNTHIRNHPRAPVGDMPYRCDVCGKGFRYKSVLLIHQGVHTGRRP 320 330 340 350 360 370 270 280 290 300 310 320 pF1KB9 YKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECE :::..:::.: :::.::.:. ::::::::::..:::::: :: :..:::.::::::: : CCDS42 YKCEECGKAFGRSSNLLVHQRVHTGEKPYKCSECGKGFSYSSVLQVHQRLHTGEKPYTCS 380 390 400 410 420 430 330 340 350 360 370 380 pF1KB9 ECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGK ::: .: .: :: ::..: ::.::.::::: CCDS42 ECGKGFCAKSALHKHQHIHPGEKPYSCGECGKGFSCSSHLSSHQKTHTGERPYQCDKCGK 440 450 460 470 480 490 390 400 410 420 430 440 pF1KB9 GFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQ CCDS42 GFSHNSYLQAHQRVHMGQHLYKCNVCGKSFSYSSGLLMHQRLHTGEKPYKCECGKSFGRS 500 510 520 530 540 550 >>CCDS12632.1 ZNF45 gene_id:7596|Hs108|chr19 (682 aa) initn: 4809 init1: 1307 opt: 1312 Z-score: 892.1 bits: 174.9 E(32554): 2.3e-43 Smith-Waterman score: 1315; 53.5% identity (72.6% similar) in 361 aa overlap (100-453:251-606) 70 80 90 100 110 120 pF1KB9 SQIDTQDSSVKFCKNEPQDHQESRRLFVMEESTERKVIKGESCSENLQVKLVSDGQELAS : :.: :. :. : .: :.. . CCDS12 TNDASYRSFSQRSHLPHHQRVPTGENPYKYEECGRNVGKSSHCQAPL---IVHTGEKPYK 230 240 250 260 270 130 140 150 160 170 180 pF1KB9 PLLNGEATCQNGQLKESLD------PIDCN-CKDIHGWKSQVVSCSQQRGHTEEKPCDHN : . : . :. : : :. : .:.:.. ...: :: ::: : CCDS12 CEECGVGFSQRSYLQVHLKVHTGKKPYKCEECGKSFSWRSRLQ--AHERIHTGEKPYKCN 280 290 300 310 320 330 190 200 210 220 230 240 pF1KB9 NCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGK ::: .. : . . .:::.:: :. .:::.:: .:.: :: .:: :::::::.::: CCDS12 ACGKSFSYSSHLNIHCRIHTGEKPYKCEECGKGFSVGSHLQAHQISHTGEKPYKCEECGK 340 350 360 370 380 390 250 260 270 280 290 300 pF1KB9 GFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQ :: :.:.:: :: :: ::::.:: :::::.:::.. :: ::::::::::..::::::: CCDS12 GFCRASNLLDHQRGHTGEKPYQCDACGKGFSRSSDFNIHFRVHTGEKPYKCEECGKGFSQ 400 410 420 430 440 450 310 320 330 340 350 360 pF1KB9 SSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNL .:.: ::: :::::::.: :: .::. :.:..: :.::::.:::: .:::.::: :.: CCDS12 ASNLLAHQRGHTGEKPYKCGTCGKGFSRSSDLNVHCRIHTGEKPYKCERCGKAFSQFSSL 460 470 480 490 500 510 370 380 390 400 410 420 pF1KB9 HIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQ ..:. .::::::::: ::::::: .:.:. : : :::::::.: .::::: ..:..: :. CCDS12 QVHQRVHTGEKPYQCAECGKGFSVGSQLQAHQRCHTGEKPYQCEECGKGFCRASNFLAHR 520 530 540 550 560 570 430 440 450 pF1KB9 RVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR ::::::::.:. ::: : : : :. ::::: CCDS12 GVHTGEKPYRCDVCGKRFRQRSYLQAHQRVHTGERPYKCEECGKVFSWSSYLQAHQRVHT 580 590 600 610 620 630 CCDS12 GEKPYKCEECGKGFSWSSSLIIHQRVHADDEGDKDFPSSEDSHRKTR 640 650 660 670 680 >>CCDS46102.1 ZNF226 gene_id:7769|Hs108|chr19 (803 aa) initn: 2549 init1: 1293 opt: 1301 Z-score: 884.1 bits: 173.7 E(32554): 6.4e-43 Smith-Waterman score: 1301; 57.0% identity (78.6% similar) in 309 aa overlap (149-456:362-668) 120 130 140 150 160 170 pF1KB9 KLVSDGQELASPLLNGEATCQNGQLKESLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEK : .:. : . :.. ..:: :: :: CCDS46 EKPYKCKQCGKGFSRRSALNVHCKVHTAEKPYNCEECGRAFSQASHLQ--DHQRLHTGEK 340 350 360 370 380 180 190 200 210 220 230 pF1KB9 PCDHNNCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKC : . ::: .. . . ....::.:: :. .:::.: ::.: .::: :: :::::: CCDS46 PFKCDACGKSFSRNSHLQSHQRVHTGEKPYKCEECGKGFICSSNLYIHQRVHTGEKPYKC 390 400 410 420 430 440 240 250 260 270 280 290 pF1KB9 EQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCG :.:::::.: ::: ::.::: :: : : :::::: ::.: :. ::::::::::..:: CCDS46 EECGKGFSRPSSLQAHQGVHTGEKSYICTVCGKGFTLSSNLQAHQRVHTGEKPYKCNECG 450 460 470 480 490 500 300 310 320 330 340 350 pF1KB9 KGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFS :.: ..:. ..: ::::::::.:: :: .::: : :.:::..:. :.:.:: :::.::. CCDS46 KSFRRNSHYQVHLVVHTGEKPYKCEICGKGFSQSSYLQIHQKAHSIEKPFKCEECGQGFN 510 520 530 540 550 560 360 370 380 390 400 410 pF1KB9 QSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSK ::: :.::. ::::::::.: :::::::. .::.:: :.:::::::.: .::: : :.:. CCDS46 QSSRLQIHQLIHTGEKPYKCEECGKGFSRRADLKIHCRIHTGEKPYNCEECGKVFRQASN 570 580 590 600 610 620 420 430 440 450 pF1KB9 LLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR :: :::::.::::..: .:::.:..:..:. ::.:: : CCDS46 LLAHQRVHSGEKPFKCEECGKSFGRSAHLQAHQKVHTGDKPYKCDECGKGFKWSLNLDMH 630 640 650 660 670 680 CCDS46 QRVHTGEKPYKCGECGKYFSQASSLQLHQSVHTGEKPYKCDVCGKVFSRSSQLQSHQRVH 690 700 710 720 730 740 >-- initn: 1674 init1: 608 opt: 608 Z-score: 424.8 bits: 88.7 E(32554): 2.4e-17 Smith-Waterman score: 608; 63.3% identity (84.4% similar) in 128 aa overlap (233-360:669-796) 210 220 230 240 250 260 pF1KB9 AEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHTDEKP :::::..::::: : .: .:: ::: ::: CCDS46 GEKPFKCEECGKSFGRSAHLQAHQKVHTGDKPYKCDECGKGFKWSLNLDMHQRVHTGEKP 640 650 660 670 680 690 270 280 290 300 310 320 pF1KB9 YKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKPYECE ::: .::: :...::: .:..::::::::::: ::: ::.::.:. :::::::::::.:: CCDS46 YKCGECGKYFSQASSLQLHQSVHTGEKPYKCDVCGKVFSRSSQLQSHQRVHTGEKPYKCE 700 710 720 730 740 750 330 340 350 360 370 380 pF1KB9 ECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCYECGK :: ::: :::: .:.:.:.:.. :: .. ::.. .:. CCDS46 ICGKSFSWRSNLTVHHRIHVGDKSYKSNRGGKNIRESTQEKKSIK 760 770 780 790 800 390 400 410 420 430 440 pF1KB9 GFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGKGFSQ >>CCDS33048.1 ZNF235 gene_id:9310|Hs108|chr19 (738 aa) initn: 1296 init1: 1296 opt: 1300 Z-score: 883.8 bits: 173.5 E(32554): 6.6e-43 Smith-Waterman score: 1315; 46.0% identity (66.5% similar) in 465 aa overlap (10-453:226-677) 10 20 30 pF1KB9 MASTITGSQDCIVNHRGEVDGEPELDISPCQQWGEASSP : ::..: .: .. : : . :: CCDS33 RSCKQTQMKNKLCIFAPYVDIFSCISHHHDDNIVHKRDKVHSN-----SDCGKDTLKVSP 200 210 220 230 240 250 40 50 60 70 80 90 pF1KB9 ISRNRDSVMTLQSG-----CFENIESETYLPLKVSSQIDTQDSSVKFCKNEPQDHQESRR ... :. : :. : : ... . : :. . .. .. . :... .: . : CCDS33 LTQR--SIHTGQKTYQGNECEEAFNDSSSLELHKQVHLGKKSPA---CSTHEKDTSYSSG 260 270 280 290 300 100 110 120 130 140 pF1KB9 LFVMEE-STERKVI------KGESCSENLQV-KLVSDGQELASPLLNGEATCQNGQLKES . :.. : .: :: : : :::. . : :.. . :.. :...: CCDS33 IPVQQSVRTGKKRYWCHECGKGFSQSSNLQTHQRVHTGEKPYTCHECGKSFNQSSHLYAH 310 320 330 340 350 360 150 160 170 180 190 pF1KB9 LD------PIDCN-CKDIHGWKSQV-VSCSQQRGHTEEKPCDHNNCGKILNTSPDGHPYE : : :. : . .... . : : :: ::: . ::: .. . .: CCDS33 LPIHTGEKPYRCDSCGKGFSRSTDLNIHC---RVHTGEKPYKCEVCGKGFTQRSHLQAHE 370 380 390 400 410 420 200 210 220 230 240 250 pF1KB9 KIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKCEQCGKGFTRSSSLLIHQAVHT .:::.:: :. ..::: :: ::.: ::: :::::::::..::: :. : .: :: ::: CCDS33 RIHTGEKPYKCGDCGKRFSCSSNLHTHQRVHTEEKPYKCDECGKCFSLSFNLHSHQRVHT 430 440 450 460 470 480 260 270 280 290 300 310 pF1KB9 DEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCGKGFSQSSKLHIHQRVHTGEKP ::::::..:::::. .::. :. :::::::..:. ::::::::: .. :::::::::: CCDS33 GEKPYKCEECGKGFSSASSFQSHQRVHTGEKPFRCNVCGKGFSQSSYFQAHQRVHTGEKP 490 500 510 520 530 540 320 330 340 350 360 370 pF1KB9 YECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFSQSSNLHIHRCIHTGEKPYQCY :.:: :: :. ::: ::::::::.:::: ::::::::.:::. :. .::::::..: CCDS33 YKCEVCGKRFNWSLNLHNHQRVHTGEKPYKCEECGKGFSQASNLQAHQSVHTGEKPFKCD 550 560 570 580 590 600 380 390 400 410 420 430 pF1KB9 ECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSKLLIHQRVHTGEKPYECSKCGK : : :::.: :. : :::::::::.: :::.::: :.: .:: .::::::..: .::: CCDS33 ACQKRFSQASHLQAHQRVHTGEKPYKCDTCGKAFSQRSNLQVHQIIHTGEKPFKCEECGK 610 620 630 640 650 660 440 450 pF1KB9 GFSQSSNLHIHQRVHKKDPR :: :..: ::::: CCDS33 EFSWSAGLSAHQRVHTGEKPYTCQQCGKGFSQASHFHTHQRVHTGERPYICDVCCKGFSQ 670 680 690 700 710 720 >>CCDS54939.1 ZNF300 gene_id:91975|Hs108|chr5 (568 aa) initn: 6005 init1: 1277 opt: 1295 Z-score: 881.7 bits: 172.7 E(32554): 8.6e-43 Smith-Waterman score: 1295; 57.2% identity (81.7% similar) in 306 aa overlap (149-453:260-563) 120 130 140 150 160 170 pF1KB9 KLVSDGQELASPLLNGEATCQNGQLKESLDPIDCN-CKDIHGWKSQVVSCSQQRGHTEEK : ::. : . : ..: .:: :: :: CCDS54 EKSCVCVTCGKAFAKKSQLIVHQRIHTGKKPYDCGACGKAFSEKFHLV--VHQRTHTGEK 230 240 250 260 270 280 180 190 200 210 220 230 pF1KB9 PCDHNNCGKILNTSPDGHPYEKIHTAEKQYEGSQCGKNFSQSSELLLHQRDHTEEKPYKC : : ..::: .. . . ....::.:: :: :.::: :::.: :..::: :: ::::.: CCDS54 PYDCSECGKAFSQKSSLIIHQRVHTGEKPYECSECGKAFSQKSPLIIHQRIHTGEKPYEC 290 300 310 320 330 340 240 250 260 270 280 290 pF1KB9 EQCGKGFTRSSSLLIHQAVHTDEKPYKCDKCGKGFTRSSSLLIHHAVHTGEKPYKCDKCG ..:::.:...:.:.::. .:: ::::.: .:::.: ..: :.::. .::::::::: .: CCDS54 RECGKAFSQKSQLIIHHRAHTGEKPYECTECGKAFCEKSHLIIHKRIHTGEKPYKCAQCE 350 360 370 380 390 400 300 310 320 330 340 350 pF1KB9 KGFSQSSKLHIHQRVHTGEKPYECEECGMSFSQRSNLHIHQRVHTGERPYKCGECGKGFS ..::....: :: :::::::::: ::: .::..:.: ::::.::::.::::.::::.: CCDS54 EAFSRKTELITHQLVHTGEKPYECTECGKTFSRKSQLIIHQRTHTGEKPYKCSECGKAFC 410 420 430 440 450 460 360 370 380 390 400 410 pF1KB9 QSSNLHIHRCIHTGEKPYQCYECGKGFSQSSDLRIHLRVHTGEKPYHCGKCGKGFSQSSK :.:.: :. :::::::: : ::::.:::.: : : :.::::::: :..:::.:::.: CCDS54 QKSHLIGHQRIHTGEKPYICTECGKAFSQKSHLPGHQRIHTGEKPYICAECGKAFSQKSD 470 480 490 500 510 520 420 430 440 450 pF1KB9 LLIHQRVHTGEKPYECSKCGKGFSQSSNLHIHQRVHKKDPR :..:::.::::.::.:. :::.: :.:.: .:::.: CCDS54 LVLHQRIHTGERPYQCAICGKAFIQKSQLTVHQRIHTVVKS 530 540 550 560 458 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:03:50 2016 done: Fri Nov 4 18:03:50 2016 Total Scan time: 2.710 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]