FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7728, 479 aa 1>>>pF1KB7728 479 - 479 aa - 479 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0982+/-0.00085; mu= 14.4233+/- 0.051 mean_var=82.1166+/-16.179, 0's: 0 Z-trim(108.2): 17 B-trim: 3 in 1/50 Lambda= 0.141533 statistics sampled from 10072 (10086) to 10072 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.31), width: 16 Scan time: 3.200 The best scores are: opt bits E(32554) CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 ( 479) 3257 674.7 5.7e-194 CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 ( 502) 2414 502.6 3.9e-142 CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 ( 504) 1854 388.3 1e-107 CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 ( 540) 1403 296.2 5.7e-80 CCDS55827.1 TFCP2 gene_id:7024|Hs108|chr12 ( 450) 848 182.8 6.4e-46 CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 ( 618) 366 84.5 3.6e-16 CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 ( 609) 355 82.2 1.7e-15 CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 ( 625) 355 82.2 1.7e-15 CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 ( 556) 352 81.6 2.4e-15 CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 ( 602) 352 81.6 2.5e-15 CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 ( 607) 352 81.6 2.5e-15 CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 ( 626) 352 81.6 2.6e-15 >>CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 (479 aa) initn: 3257 init1: 3257 opt: 3257 Z-score: 3595.9 bits: 674.7 E(32554): 5.7e-194 Smith-Waterman score: 3257; 100.0% identity (100.0% similar) in 479 aa overlap (1-479:1-479) 10 20 30 40 50 60 pF1KB7 MLFWHTQPEHYNQHNSGSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 MLFWHTQPEHYNQHNSGSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 LHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 LHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGW 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 RWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 RWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 HGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 HGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 EKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 EKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 GSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 GSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 AIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 AIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIAN 370 380 390 400 410 420 430 440 450 460 470 pF1KB7 LYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS21 LYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL 430 440 450 460 470 >>CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 (502 aa) initn: 2065 init1: 1475 opt: 2414 Z-score: 2665.3 bits: 502.6 E(32554): 3.9e-142 Smith-Waterman score: 2414; 74.6% identity (91.5% similar) in 469 aa overlap (16-476:35-502) 10 20 30 40 pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL .:.: . :::::::::::: .: :.:: .. CCDS88 LKLPLADEVIESGLVQDFDASLSGIGQELGAGAYSMSDVLALPIFKQEESSLPPDNENKI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF :.:::::::::::::::.:::::::::::::::.:.:::::.. ..: : ::::.:::: CCDS88 LPFQYVLCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKLGELPEINGKLVKSIFRVVF 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS ::::::::::::::::::.::::::::::::.::::.::::.:::::.::::::::::.: CCDS88 HDRRLQYTEHQQLEGWRWNRPGDRILDIDIPMSVGIIDPRANPTQLNTVEFLWDPAKRTS 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD .:::::::::::: :::::::::::::::::::.:::::::::::::::::::::::::: CCDS88 VFIQVHCISTEFTMRKHGGEKGVPFRVQIDTFKENENGEYTEHLHSASCQIKVFKPKGAD 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL :::::::::::::: .:::::::::::::::::::::...: ::..:::..:.: .::.: CCDS88 RKQKTDREKMEKRTPHEKEKYQPSYETTILTECSPWPEITY-VNNSPSPGFNSSHSSFSL 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB7 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD ::::.::.: : : .:.:::... :.::::::::::: : :::..::::::::..:: CCDS88 GEGNGSPNHQPEPPPPVTDNLLPTTTPQEAQQWLHRNRFSTFTRLFTNFSGADLLKLTRD 310 320 330 340 350 360 350 360 370 380 390 pF1KB7 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQEL-----EQNRVPLQQKRDGSGDSNLS :..::::::::::::::.::: :::..::::::: .:.. ::.. .:::: . CCDS88 DVIQICGPADGIRLFNALKGRMVRPRLTIYVCQESLQLREQQQQQQQQQQKHEDGDSNGT 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB7 --VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESC :::::.:::::..:: ::::.:.:::: .: ..:.::::::::..:.::.::::.:.: CCDS88 FFVYHAIYLEELTAVELTEKIAQLFSISPCQISQIYKQGPTGIHVLISDEMIQNFQEEAC 430 440 450 460 470 480 460 470 pF1KB7 FVLSTIKAESNDGYHIILKCGL :.:.:.:::.::.:::::: CCDS88 FILDTMKAETNDSYHIILK 490 500 >>CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 (504 aa) initn: 2156 init1: 1446 opt: 1854 Z-score: 2047.3 bits: 388.3 E(32554): 1e-107 Smith-Waterman score: 2176; 68.1% identity (89.2% similar) in 474 aa overlap (16-476:32-504) 10 20 30 40 pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL .:.: . :::::::::::. .: ..:.. CCDS46 AWVLKMDEVIESGLVHDFDASLSGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEH 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF ::.:::.:::::::::::.:::::::::::::::.:.:::.::. ..: : ::::::::: CCDS46 PPFQYVMCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVF 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS ::::::::::::::::.:.:::::.::.:::.::::.: :..:.::::::::::::::.: CCDS46 HDRRLQYTEHQQLEGWKWNRPGDRLLDLDIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTS 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD ::::::::::::::::::::::::::.:.::::::::::::.:::::::::::::::::: CCDS46 AFIQVHCISTEFTPRKHGGEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGAD 190 200 210 220 230 240 230 240 250 260 270 pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDV--AYQVNSAPSPSYN-GSP-- :::::::::::::::.:::::::::.::::::::::::. :: ::..:::. . :: CCDS46 RKQKTDREKMEKRTAHEKEKYQPSYDTTILTECSPWPDAPTAY-VNNSPSPAPTFTSPQQ 250 260 270 280 290 300 280 290 300 310 320 330 pF1KB7 NSFGLGEGNAS-PTHPVE-ALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGAD .. .. ..:.: :.: . : ...... :::.::..:::: .::::.. :::..::::: CCDS46 STCSVPDSNSSSPNHQGDGASQTSGEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGAD 310 320 330 340 350 360 340 350 360 370 380 390 pF1KB7 LLKMSRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRV-PLQQKRDGSGDS :::....::::::: ::::::.:..:.:.:::..:::::.: .. : ::. .:.. CCDS46 LLKLTKEDLVQICGAADGIRLYNSLKSRSVRPRLTIYVCREQPSSTVLQGQQQAASSASE 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB7 NLS----VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNF : : :::::.:::. . :. .:.: ...: ..:..::::::::::..::..::::: CCDS46 NGSGAPYVYHAIYLEEMIASEVARKLALVFNIPLHQINQVYRQGPTGIHILVSDQMVQNF 430 440 450 460 470 480 460 470 pF1KB7 QDESCFVLSTIKAESNDGYHIILKCGL ::::::..::.::::.:: ::::: CCDS46 QDESCFLFSTVKAESSDGIHIILK 490 500 >>CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 (540 aa) initn: 2142 init1: 1385 opt: 1403 Z-score: 1549.1 bits: 296.2 E(32554): 5.7e-80 Smith-Waterman score: 2031; 62.9% identity (82.7% similar) in 498 aa overlap (16-464:32-528) 10 20 30 40 pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL .:.: . :::::::::::. .: ..:.. CCDS26 AWVLKMDEVIESGLVHDFDASLSGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEH 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF ::.:::.:::::::::::.:::::::::::::::.:.:::.::. ..: : ::::::::: CCDS26 PPFQYVMCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVF 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS ::::::::::::::::.:.:::::.::.:::.::::.: :..:.::::::::::::::.: CCDS26 HDRRLQYTEHQQLEGWKWNRPGDRLLDLDIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTS 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD ::::::::::::::::::::::::::.:.::::::::::::.:::::::::::::::::: CCDS26 AFIQVHCISTEFTPRKHGGEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGAD 190 200 210 220 230 240 230 240 250 pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTE---------------------------- :::::::::::::::.:::::::::.:::::: CCDS26 RKQKTDREKMEKRTAHEKEKYQPSYDTTILTEMRLEPIIEDAVEHEQKKSSKRTLPADYG 250 260 270 280 290 300 260 270 280 290 300 pF1KB7 --------CSPWPDV--AYQVNSAPSPSYN-GSP--NSFGLGEGNAS-PTHPVE-ALPVG ::::::. :: ::..:::. . :: .. .. ..:.: :.: . : .. CCDS26 DSLAKRGSCSPWPDAPTAY-VNNSPSPAPTFTSPQQSTCSVPDSNSSSPNHQGDGASQTS 310 320 330 340 350 360 310 320 330 340 350 360 pF1KB7 SDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNA .... :::.::..:::: .::::.. :::..::::::::....::::::: ::::::.:. CCDS26 GEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGADLLKLTKEDLVQICGAADGIRLYNS 370 380 390 400 410 420 370 380 390 400 410 pF1KB7 IKGRNVRPKMTIYVCQELEQNRV-PLQQKRDGSGDSNLS----VYHAIFLEELTTLELIE .:.:.:::..:::::.: .. : ::. .:.. : : :::::.:::. . :. . CCDS26 LKSRSVRPRLTIYVCREQPSSTVLQGQQQAASSASENGSGAPYVYHAIYLEEMIASEVAR 430 440 450 460 470 480 420 430 440 450 460 470 pF1KB7 KIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILK :.: ...: ..:..::::::::::..::..:::::::::::..::.: CCDS26 KLALVFNIPLHQINQVYRQGPTGIHILVSDQMVQNFQDESCFLFSTVKAESSDGIHIILK 490 500 510 520 530 540 pF1KB7 CGL >>CCDS55827.1 TFCP2 gene_id:7024|Hs108|chr12 (450 aa) initn: 1778 init1: 840 opt: 848 Z-score: 937.9 bits: 182.8 E(32554): 6.4e-46 Smith-Waterman score: 1948; 64.0% identity (80.6% similar) in 469 aa overlap (16-476:35-450) 10 20 30 40 pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL .:.: . :::::::::::: .: :.:: .. CCDS55 LKLPLADEVIESGLVQDFDASLSGIGQELGAGAYSMSDVLALPIFKQEESSLPPDNENKI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF :.:::::::::::::::.:::::::::::::::.:.:::::.. ..: : ::::.:::: CCDS55 LPFQYVLCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKLGELPEINGKLVKSIFRVVF 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS ::::::::::::::::::.::::::::::::.::::.::::.:::::.::::::::::.: CCDS55 HDRRLQYTEHQQLEGWRWNRPGDRILDIDIPMSVGIIDPRANPTQLNTVEFLWDPAKRTS 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD .::: ::::: CCDS55 VFIQ---------------------------------------------------PKGAD 190 230 240 250 260 270 280 pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL :::::::::::::: .:::::::::::::::::::::...: ::..:::..:.: .::.: CCDS55 RKQKTDREKMEKRTPHEKEKYQPSYETTILTECSPWPEITY-VNNSPSPGFNSSHSSFSL 200 210 220 230 240 250 290 300 310 320 330 340 pF1KB7 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD ::::.::.: : : .:.:::... :.::::::::::: : :::..::::::::..:: CCDS55 GEGNGSPNHQPEPPPPVTDNLLPTTTPQEAQQWLHRNRFSTFTRLFTNFSGADLLKLTRD 260 270 280 290 300 310 350 360 370 380 390 pF1KB7 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQEL-----EQNRVPLQQKRDGSGDSNLS :..::::::::::::::.::: :::..::::::: .:.. ::.. .:::: . CCDS55 DVIQICGPADGIRLFNALKGRMVRPRLTIYVCQESLQLREQQQQQQQQQQKHEDGDSNGT 320 330 340 350 360 370 400 410 420 430 440 450 pF1KB7 --VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESC :::::.:::::..:: ::::.:.:::: .: ..:.::::::::..:.::.::::.:.: CCDS55 FFVYHAIYLEELTAVELTEKIAQLFSISPCQISQIYKQGPTGIHVLISDEMIQNFQEEAC 380 390 400 410 420 430 460 470 pF1KB7 FVLSTIKAESNDGYHIILKCGL :.:.:.: :.::.:::::: CCDS55 FILDTMK-ETNDSYHIILK 440 450 >>CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 (618 aa) initn: 231 init1: 107 opt: 366 Z-score: 403.9 bits: 84.5 E(32554): 3.6e-16 Smith-Waterman score: 383; 27.4% identity (55.5% similar) in 438 aa overlap (47-475:252-615) 20 30 40 50 60 70 pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE ..:.: :. : : . :.::::.:: : CCDS33 QEVFFPSDLSLRMPGMNSEDYVFDSVSGNNFEYTLEASKSLRQKPGDSTMTYLNKGQFYP 230 240 250 260 270 280 80 90 100 110 120 130 pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD : : : . .. .: :.:.: ::: . . ....::. :. : :: .: .: CCDS33 ITLKEVSSSEGIHHPISK-VRSVIMVVFAEDK---SREDQLRHWKYWHSRQHTAKQRCID 290 300 310 320 330 140 150 160 170 180 190 pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR : : : . .. ::. : :: .:..::.:.:.::.:. .: : ::.:. CCDS33 IADYKESFNTIS-NIEEIAYNAISFTWDINDEAKVFISVNCLSTDFSSQK--GVKGLPLN 340 350 360 370 380 390 200 210 220 230 240 pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQE-KEKYQPSY .:.::.. :. . .. .: : :::::: :::.:: . ...:. :: ... : ::. CCDS33 IQVDTYSYNNRS--NKPVHRAYCQIKVFCDKGAERKIRDEERKQSKRKVSDVKVPLLPSH 400 410 420 430 440 450 250 260 270 280 290 300 pF1KB7 ETTILTECSPWPDVAYQ-VNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPS . .: .:. :. : : :. . . : .: :: .::..:..: CCDS33 KRMDITVFKPFIDLDTQPVLFIPDVHFAN------LQRG----TH---VLPIASEELEGE 460 470 480 490 310 320 330 340 350 360 pF1KB7 ASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVR .:. :.:. .. ..::.. :. . .: . CCDS33 GSV------LKRGPYG-----------------TEDDFA--VPPSTKL-------ARIEE 500 510 520 370 380 390 400 410 420 pF1KB7 PK-MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQ :: . .:: .: :. :. :..:. . :.: :.. :.. . CCDS33 PKRVLLYVRKESEE------------------VFDALMLKTPSLKGLMEAISDKYDVPHD 530 540 550 560 430 440 450 460 470 pF1KB7 HIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL .: ..... :: : .....:.....:. : :. :.. .:.. : CCDS33 KIGKIFKKCKKGILVNMDDNIVKHYSNEDTFQLQI--EEAGGSYKLTLTEI 570 580 590 600 610 >>CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 (609 aa) initn: 326 init1: 108 opt: 355 Z-score: 391.8 bits: 82.2 E(32554): 1.7e-15 Smith-Waterman score: 396; 28.9% identity (55.7% similar) in 436 aa overlap (47-475:232-606) 20 30 40 50 60 70 pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE .::.: :. : : : .::::.:: : CCDS83 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA 210 220 230 240 250 260 80 90 100 110 120 130 pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD : : :. :. .: :.:.. ::: . . .. .::. :. : :: .:.:: CCDS83 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD 270 280 290 300 310 140 150 160 170 180 190 pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR : : : . . ::: : :: ..:. :: :.:.::.:. .: : ::.:. CCDS83 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM 320 330 340 350 360 370 200 210 220 230 240 250 pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE .::::.. :. .. . .: : :::::: :::.:: . :.:. ..: .: : : : CCDS83 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ- 380 390 400 410 420 260 270 280 290 300 310 pF1KB7 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS :.: :: : .:. .. : . : ...: . : : CCDS83 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF 430 440 450 460 320 330 340 350 360 370 pF1KB7 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVRPK : :.. :... : . ..: . . . ::. :.: .. .. : CCDS83 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVK--------RMFRPME-EEFGPV 470 480 490 500 380 390 400 410 420 430 pF1KB7 MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHIH . . .: . :: : ... . : :. :..:. :. :.: :.. :.. ..: CCDS83 PSKQMKEEGTK-RVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKIA 510 520 530 540 550 560 440 450 460 470 pF1KB7 RVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESN-DGYHIILKCGL ..:... :: : ...........:. :.:. :: .:... : CCDS83 KLYKKSKKGILVNMDDNIIEHYSNEDTFILN---MESMVEGFKVTLMEI 570 580 590 600 >>CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 (625 aa) initn: 353 init1: 108 opt: 355 Z-score: 391.6 bits: 82.2 E(32554): 1.7e-15 Smith-Waterman score: 396; 28.9% identity (55.7% similar) in 436 aa overlap (47-475:248-622) 20 30 40 50 60 70 pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE .::.: :. : : : .::::.:: : CCDS34 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA 220 230 240 250 260 270 80 90 100 110 120 130 pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD : : :. :. .: :.:.. ::: . . .. .::. :. : :: .:.:: CCDS34 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD 280 290 300 310 320 330 140 150 160 170 180 190 pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR : : : . . ::: : :: ..:. :: :.:.::.:. .: : ::.:. CCDS34 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM 340 350 360 370 380 390 200 210 220 230 240 250 pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE .::::.. :. .. . .: : :::::: :::.:: . :.:. ..: .: : : : CCDS34 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ- 400 410 420 430 440 260 270 280 290 300 310 pF1KB7 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS :.: :: : .:. .. : . : ...: . : : CCDS34 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF 450 460 470 480 320 330 340 350 360 370 pF1KB7 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVRPK : :.. :... : . ..: . . . ::. :.: .. .. : CCDS34 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVK--------RMFRPME-EEFGPV 490 500 510 520 380 390 400 410 420 430 pF1KB7 MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHIH . . .: . :: : ... . : :. :..:. :. :.: :.. :.. ..: CCDS34 PSKQMKEEGTK-RVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKIA 530 540 550 560 570 440 450 460 470 pF1KB7 RVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESN-DGYHIILKCGL ..:... :: : ...........:. :.:. :: .:... : CCDS34 KLYKKSKKGILVNMDDNIIEHYSNEDTFILN---MESMVEGFKVTLMEI 580 590 600 610 620 >>CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 (556 aa) initn: 189 init1: 97 opt: 352 Z-score: 389.1 bits: 81.6 E(32554): 2.4e-15 Smith-Waterman score: 381; 25.6% identity (55.3% similar) in 465 aa overlap (21-476:157-554) 10 20 30 40 pF1KB7 MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ .. . .: :.: ::. : .. CCDS53 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE 130 140 150 160 170 180 50 60 70 80 90 100 pF1KB7 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR :.: . . .: : ..:::.:: : . : .. : :... :::.. ::: ... CCDS53 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK 190 200 210 220 230 240 110 120 130 140 150 160 pF1KB7 LQYTEHQQLEGWR-W-SR-PG--DRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKR . .::. :. : :: : .:..:. : . . .. . . ::. :.:. .. CCDS53 VPV---EQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEE 250 260 270 280 290 300 170 180 190 200 210 220 pF1KB7 ASAFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPK :..:: :.:.::.:. .: : ::::. .::::. . : ::.: : : ::::.: : CCDS53 AKVFIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDK 310 320 330 340 350 230 240 250 260 270 280 pF1KB7 GADRKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNS ::.::.. :..:. .: .. .. . . . .:. .. :. .. CCDS53 GAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETT 360 370 380 390 290 300 310 320 330 340 pF1KB7 FGLGEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKM . : .:. :: ..:. .: ::.. : .. .: . CCDS53 Y------LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSS 400 410 420 430 350 360 370 380 390 400 pF1KB7 SRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVY .: : . :.: . :. . ..... : . .:: : .:. . :. CCDS53 NRLPLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRE-----TEEVF 440 450 460 470 480 410 420 430 440 450 460 pF1KB7 HAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLS :..:. : . :.. :.. ..:..::.. :: : ..:...:..... :.:. CCDS53 DALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLD 490 500 510 520 530 540 470 pF1KB7 TIKAESNDGYHIILKCGL .: . .:::: CCDS53 M--GELDGKIQIILKEL 550 >>CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 (602 aa) initn: 189 init1: 97 opt: 352 Z-score: 388.6 bits: 81.6 E(32554): 2.5e-15 Smith-Waterman score: 381; 25.6% identity (55.3% similar) in 465 aa overlap (21-476:203-600) 10 20 30 40 pF1KB7 MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ .. . .: :.: ::. : .. CCDS44 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE 180 190 200 210 220 230 50 60 70 80 90 100 pF1KB7 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR :.: . . .: : ..:::.:: : . : .. : :... :::.. ::: ... CCDS44 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK 240 250 260 270 280 290 110 120 130 140 150 160 pF1KB7 LQYTEHQQLEGWR-W-SR-PG--DRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKR . .::. :. : :: : .:..:. : . . .. . . ::. :.:. .. CCDS44 VPV---EQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEE 300 310 320 330 340 170 180 190 200 210 220 pF1KB7 ASAFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPK :..:: :.:.::.:. .: : ::::. .::::. . : ::.: : : ::::.: : CCDS44 AKVFIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDK 350 360 370 380 390 400 230 240 250 260 270 280 pF1KB7 GADRKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNS ::.::.. :..:. .: .. .. . . . .:. .. :. .. CCDS44 GAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETT 410 420 430 440 290 300 310 320 330 340 pF1KB7 FGLGEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKM . : .:. :: ..:. .: ::.. : .. .: . CCDS44 Y------LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSS 450 460 470 480 350 360 370 380 390 400 pF1KB7 SRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVY .: : . :.: . :. . ..... : . .:: : .:. . :. CCDS44 NRLPLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRE-----TEEVF 490 500 510 520 410 420 430 440 450 460 pF1KB7 HAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLS :..:. : . :.. :.. ..:..::.. :: : ..:...:..... :.:. CCDS44 DALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLD 530 540 550 560 570 580 470 pF1KB7 TIKAESNDGYHIILKCGL .: . .:::: CCDS44 M--GELDGKIQIILKEL 590 600 479 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 04:46:22 2016 done: Mon Nov 7 04:46:23 2016 Total Scan time: 3.200 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]