FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7854, 625 aa 1>>>pF1KB7854 625 - 625 aa - 625 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9585+/-0.00113; mu= 16.0509+/- 0.068 mean_var=75.0003+/-14.722, 0's: 0 Z-trim(102.9): 24 B-trim: 0 in 0/50 Lambda= 0.148096 statistics sampled from 7156 (7170) to 7156 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.579), E-opt: 0.2 (0.22), width: 16 Scan time: 2.820 The best scores are: opt bits E(32554) CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 ( 625) 4094 884.7 0 CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 ( 609) 3994 863.3 0 CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 ( 618) 1646 361.6 1.7e-99 CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 ( 556) 1369 302.4 1e-81 CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 ( 602) 1369 302.5 1.1e-81 CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 ( 607) 1369 302.5 1.1e-81 CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 ( 626) 1255 278.1 2.4e-74 CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 ( 479) 355 85.8 1.5e-16 CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 ( 504) 343 83.2 9.1e-16 CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 ( 540) 340 82.6 1.5e-15 CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 ( 502) 336 81.7 2.6e-15 >>CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 (625 aa) initn: 4094 init1: 4094 opt: 4094 Z-score: 4726.3 bits: 884.7 E(32554): 0 Smith-Waterman score: 4094; 100.0% identity (100.0% similar) in 625 aa overlap (1-625:1-625) 10 20 30 40 50 60 pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB7 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH 550 560 570 580 590 600 610 620 pF1KB7 YSNEDTFILNMESMVEGFKVTLMEI ::::::::::::::::::::::::: CCDS34 YSNEDTFILNMESMVEGFKVTLMEI 610 620 >>CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 (609 aa) initn: 3994 init1: 3994 opt: 3994 Z-score: 4611.0 bits: 863.3 E(32554): 0 Smith-Waterman score: 3994; 100.0% identity (100.0% similar) in 609 aa overlap (17-625:1-609) 10 20 30 40 50 60 pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS :::::::::::::::::::::::::::::::::::::::::::: CCDS83 MPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS 10 20 30 40 70 80 90 100 110 120 pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB7 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB7 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB7 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB7 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB7 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB7 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL 410 420 430 440 450 460 490 500 510 520 530 540 pF1KB7 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL 470 480 490 500 510 520 550 560 570 580 590 600 pF1KB7 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH 530 540 550 560 570 580 610 620 pF1KB7 YSNEDTFILNMESMVEGFKVTLMEI ::::::::::::::::::::::::: CCDS83 YSNEDTFILNMESMVEGFKVTLMEI 590 600 >>CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 (618 aa) initn: 1907 init1: 1063 opt: 1646 Z-score: 1899.7 bits: 361.6 E(32554): 1.7e-99 Smith-Waterman score: 2234; 57.6% identity (78.9% similar) in 641 aa overlap (1-625:1-618) 10 20 30 40 50 60 pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS :.:: :: :: : :: . .. . ::.::::::::::.::::::::::::::::::::: CCDS33 MTQEYDN-KRPV-LV-LQNEALYPQRRSYTSEDEAWKSFLENPLTAATKAMMSINGDEDS 10 20 30 40 50 70 80 90 100 110 pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQE-DQEKRNCLGTSEAQSNLSGGENRVQVLKT :::::::::::::::..: ... . : :. ::: . : .:.:::::::::. CCDS33 AAALGLLYDYYKVPRERRSSTAKPEVEHPEPDHSKRNSIPIVTEQPLISAGENRVQVLKN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 VPVNLSLNQ-DHLENSKREQYSISFPESSAIIPVSGITV--VKAEDFTPVF---MAPPVH :: :. : . ..: .:: . .. :.... . .. . . .:.: : . : :. CCDS33 VPFNIVLPHGNQLGIDKRGH--LTAPDTTVTVSIATMPTHSIKTETQPHGFAVGIPPAVY 120 130 140 150 160 170 180 190 200 210 220 pF1KB7 YPRGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKF----- .:. .:::.:... .. .... .: . :: :::::.::.::... : : CCDS33 HPE---PTERVVVFDRN-LNTDQFSS-GAQAPNAQRRTPDSTFSETFKEGVQEVFFPSDL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB7 --RSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDN : ....:.:..:..:...:.:::::.:::::: :.. :::::::::: :::.:.... CCDS33 SLRMPGMNSEDYVFDSVSGNNFEYTLEASKSLRQKPGDSTMTYLNKGQFYPITLKEVSSS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB7 KCFRHPISKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGN . ..:::::::::.::::.:::.:..::..:::::::::::::: .::::::::::::.: CCDS33 EGIHHPISKVRSVIMVVFAEDKSREDQLRHWKYWHSRQHTAKQRCIDIADYKESFNTISN 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB7 IEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPI ::::::::.:::::.:.:::.::.::::::::::::::::::: ::.::::::::::::. CCDS33 IEEIAYNAISFTWDINDEAKVFISVNCLSTDFSSQKGVKGLPLNIQVDTYSYNNRSNKPV 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB7 HRAYCQIKVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDIT ::::::::::::::::::::::::::...: :: :. .: .:. ::: CCDS33 HRAYCQIKVFCDKGAERKIRDEERKQSKRK------------VSDVKVPLLPSHKRMDIT 420 430 440 450 470 480 490 500 510 520 pF1KB7 YFKTMPDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREG-GSVLVKRMFRPMEEEFGPV :: . :: .:::::::::::::::: .: ...: :: :::: :: :..:. CCDS33 VFKPFIDLDTQPVLFIPDVHFANLQRGTHVLPIASEELEGEGSVL-KRGPYGTEDDFAVP 460 470 480 490 500 510 530 540 550 560 570 580 pF1KB7 PSKQMKE-EGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKK :: .. . : ::::::::::...::::::::.:..::::::::.:: .: .::.:..:: CCDS33 PSTKLARIEEPKRVLLYVRKESEEVFDALMLKTPSLKGLMEAISDKYDVPHDKIGKIFKK 520 530 540 550 560 570 590 600 610 620 pF1KB7 SKKGILVNMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI ::::::::::::..:::::::: :..: ..:.:: :: CCDS33 CKKGILVNMDDNIVKHYSNEDTFQLQIEEAGGSYKLTLTEI 580 590 600 610 >>CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 (556 aa) initn: 1509 init1: 815 opt: 1369 Z-score: 1580.6 bits: 302.4 E(32554): 1e-81 Smith-Waterman score: 1509; 44.9% identity (70.5% similar) in 584 aa overlap (51-625:1-556) 30 40 50 60 70 80 pF1KB7 PPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRDKRLL :: .:::.::.:::..::::: :..::.: CCDS53 MMRVNGDDDSVAALSFLYDYYMGPKEKRIL 10 20 30 90 100 110 120 130 pF1KB7 SVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTVPVNLSLNQDHLENSKREQY- : : . ...:: :: : : ...:. :. ....: . :.: . .. . :... CCDS53 SSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLM 40 50 60 70 80 140 150 160 170 180 190 pF1KB7 ----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGEEQRVVIFEQTQYDVP .. : ..: .: .: . ..: . .. : :. . .:: . . :: CCDS53 SLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYDNGSLNS----LFE-SIHGVP 90 100 110 120 130 140 200 210 220 230 240 250 pF1KB7 SLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSASVGAEEYMYDQTSSGTFQYTLE :: ::::.... ... . .... : . .: :.::: CCDS53 PT----------QRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSD-FEYTLG 150 160 170 180 190 260 270 280 290 300 310 pF1KB7 ATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVVMVVFSEDKNRDEQ . :... :.::.::.:::::::: .:: . .: . .::.:::::::...: :: CCDS53 SPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQ 200 210 220 230 240 250 320 330 340 350 360 370 pF1KB7 LKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWDVNEEAKIFITVNC :..::.::::: ::::::.:.:: ::.:::. .:::.::::.::.:.::::::.:: ::: CCDS53 LRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNC 260 270 280 290 300 310 380 390 400 410 420 430 pF1KB7 LSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKGAERKIRDEERKQN :::::::::::::.:: .:::::. . ... .::: ::::.:::::::::.::.:::: CCDS53 LSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQF 320 330 340 350 360 370 440 450 460 470 480 490 pF1KB7 RKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTMPDLHSQPVLFIPDVHFANLQ :.: : : .::.. . . :. . .. ::.. ::.. ::::::.:::..:: CCDS53 RRKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQ 380 390 400 410 420 500 510 520 530 540 550 pF1KB7 RTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFD :.: . . .. . .:: :. ::: :.:::: :: .:::::::.::..::: CCDS53 RSGGAA-PSAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFD 430 440 450 460 470 480 560 570 580 590 600 610 pF1KB7 ALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEHYSNEDTFILNM :::::.: .::: .:::::::.: :.: :.::: :.:::::::.:::.::::. .:.:.: CCDS53 ALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDM 490 500 510 520 530 540 620 pF1KB7 ESMVEGFKVTLMEI . ... : :. CCDS53 GELDGKIQIILKEL 550 >>CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 (602 aa) initn: 1657 init1: 815 opt: 1369 Z-score: 1580.0 bits: 302.5 E(32554): 1.1e-81 Smith-Waterman score: 1660; 46.1% identity (70.8% similar) in 634 aa overlap (1-625:1-602) 10 20 30 40 50 60 pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS ::.: : : : : . .:: . .:::::::::.:::::::::::::: .:::.:: CCDS44 MSNELDF--RSVRL--LKNDPVNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDS 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV .:::..::::: :..::.:: : . ...:: :: : : ...:. :. ....: . CCDS44 VAALSFLYDYYMGPKEKRILSSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFL 60 70 80 90 100 110 130 140 150 160 170 pF1KB7 PVNLSLNQDHLENSKREQY-----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYP :.: . .. . :... .. : ..: .: .: . ..: . .. : CCDS44 TENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 RGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSASV :. . .::. . :: :: ::::.... ... . .... CCDS44 NGSLNS----LFESI-HGVPPT----------QRWQPDSTFKDDPQESMLFPDILKTSPE 180 190 200 210 240 250 260 270 280 290 pF1KB7 GAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPI : . .: :.::: . :... :.::.::.:::::::: .:: . .: . CCDS44 PPCPEDYPSLKSD-FEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSS 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB7 SKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYN .::.:::::::...: :::..::.::::: ::::::.:.:: ::.:::. .:::.::: CCDS44 NKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYN 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 AVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQI :.::.:.::::::.:: ::::::::::::::::.:: .:::::. . ... .::: ::: CCDS44 ALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQI 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB7 KVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTM :.:::::::::.::.:::: :.: : : .::.. . . :. . .. ::.. CCDS44 KIFCDKGAERKMRDDERKQFRRKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPE 400 410 420 430 440 480 490 500 510 520 530 pF1KB7 PDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMK ::.. ::::::.:::..:::.: . .. .. . .:: :. ::: :.:::: : CCDS44 TDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAK 450 460 470 480 490 500 540 550 560 570 580 590 pF1KB7 EEGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILV : .:::::::.::..::::::::.: .::: .:::::::.: :.: :.::: :.:::: CCDS44 EGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILV 510 520 530 540 550 560 600 610 620 pF1KB7 NMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI :::.:::.::::. .:.:.: . ... : :. CCDS44 NMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL 570 580 590 600 >>CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 (607 aa) initn: 1657 init1: 815 opt: 1369 Z-score: 1580.0 bits: 302.5 E(32554): 1.1e-81 Smith-Waterman score: 1657; 46.0% identity (71.5% similar) in 618 aa overlap (17-625:18-607) 10 20 30 40 50 pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDED . .:: . .:::::::::.:::::::::::::: .:::.: CCDS25 MWMNSILPIFLFRSVRLLKNDPVNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 SAAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKT :.:::..::::: :..::.:: : . ...:: :: : : ...:. :. ....: CCDS25 SVAALSFLYDYYMGPKEKRILSSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKF 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 VPVNLSLNQDHLENSKREQY-----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHY . :.: . .. . :... .. : ..: .: .: . ..: . .. : CCDS25 LTENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 PRGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSAS :. . .:: . . :: :: ::::.... ... . .... CCDS25 DNGSLNS----LFE-SIHGVPP----------TQRWQPDSTFKDDPQESMLFPDILKTSP 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 VGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHP : . .: :.::: . :... :.::.::.:::::::: .:: . .: . CCDS25 EPPCPEDYPSLKSD-FEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALS 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 ISKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAY .::.:::::::...: :::..::.::::: ::::::.:.:: ::.:::. .:::.:: CCDS25 SNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAY 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 NAVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQ ::.::.:.::::::.:: ::::::::::::::::.:: .:::::. . ... .::: :: CCDS25 NALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQ 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB7 IKVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKT ::.:::::::::.::.:::: :.: ..: .::.. . . :. . .. ::.. CCDS25 IKIFCDKGAERKMRDDERKQFRRK-------VKCPDSSNSGVKGCLLSGFRGNETTYLRP 410 420 430 440 450 480 490 500 510 520 530 pF1KB7 MPDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQM ::.. ::::::.:::..:::.: . .. .. . .:: :. ::: :.:::: CCDS25 ETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQA 460 470 480 490 500 510 540 550 560 570 580 590 pF1KB7 KEEGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGIL :: .:::::::.::..::::::::.: .::: .:::::::.: :.: :.::: :.::: CCDS25 KEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGIL 520 530 540 550 560 570 600 610 620 pF1KB7 VNMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI ::::.:::.::::. .:.:.: . ... : :. CCDS25 VNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL 580 590 600 >>CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 (626 aa) initn: 1559 init1: 825 opt: 1255 Z-score: 1448.1 bits: 278.1 E(32554): 2.4e-74 Smith-Waterman score: 1546; 45.9% identity (70.4% similar) in 597 aa overlap (1-588:1-565) 10 20 30 40 50 60 pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS ::.: : : : : . .:: . .:::::::::.:::::::::::::: .:::.:: CCDS25 MSNELDF--RSVRL--LKNDPVNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDS 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV .:::..::::: :..::.:: : . ...:: :: : : ...:. :. ....: . CCDS25 VAALSFLYDYYMGPKEKRILSSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFL 60 70 80 90 100 110 130 140 150 160 170 pF1KB7 PVNLSLNQDHLENSKREQY-----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYP :.: . .. . :... .. : ..: .: .: . ..: . .. : CCDS25 TENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 RGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSASV :. . .::. . :: :: ::::.... ... . .... CCDS25 NGSLNS----LFESI-HGVPPT----------QRWQPDSTFKDDPQESMLFPDILKTSPE 180 190 200 210 240 250 260 270 280 290 pF1KB7 GAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPI : . .: :.::: . :... :.::.::.:::::::: .:: . .: . CCDS25 PPCPEDYPSLKSD-FEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSS 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB7 SKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYN .::.:::::::...: :::..::.::::: ::::::.:.:: ::.:::. .:::.::: CCDS25 NKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYN 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 AVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQI :.::.:.::::::.:: ::::::::::::::::.:: .:::::. . ... .::: ::: CCDS25 ALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQI 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB7 KVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTM :.:::::::::.::.:::: :.: : : .::.. . . :. . .. ::.. CCDS25 KIFCDKGAERKMRDDERKQFRRKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPE 400 410 420 430 440 480 490 500 510 520 530 pF1KB7 PDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMK ::.. ::::::.:::..:::.: . .. .. . .:: :. ::: :.:::: : CCDS25 TDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAK 450 460 470 480 490 500 540 550 560 570 580 590 pF1KB7 EEGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILV : .:::::::.::..::::::::.: .::: .:::::::.: :.: :.::: :.: CCDS25 EGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGETS 510 520 530 540 550 560 600 610 620 pF1KB7 NMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI CCDS25 LLHPRLSRHPPPDCLECSHPVTQVRNMGFGDGFWRQRDLDSNPSPTTVNSLHFTVNSE 570 580 590 600 610 620 >>CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 (479 aa) initn: 326 init1: 108 opt: 355 Z-score: 410.7 bits: 85.8 E(32554): 1.5e-16 Smith-Waterman score: 377; 28.6% identity (55.8% similar) in 416 aa overlap (248-604:47-455) 220 230 240 250 260 270 pF1KB7 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA .::.: :. : : : .::::.:: : CCDS21 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE 20 30 40 50 60 70 280 290 300 310 320 330 pF1KB7 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD : : :. :. .: :.:.. ::: . . .. .::. :. : :: .:.:: CCDS21 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRP---GDRILD 80 90 100 110 120 130 340 350 360 370 380 390 pF1KB7 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM : : : . . ::: : :: ..:. :: :.:.::.:. .: : ::.:. CCDS21 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR 140 150 160 170 180 190 400 410 420 430 440 pF1KB7 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ- .::::.. :. .. . .: : :::::: :::.:: . :.:. ..: .: : : : CCDS21 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE 200 210 220 230 240 250 450 460 470 480 pF1KB7 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF :.: :: : .:. .. : . : ...: . : : CCDS21 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS 260 270 280 290 300 310 490 500 510 520 530 pF1KB7 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVKRMFRPME--EEFGPVPSKQMKE : :.. :... : . ..: . . . ::. . : . . :. . ..... CCDS21 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQ-ICGPADGIRLFNAIKGRNVRP 320 330 340 350 360 540 550 560 570 pF1KB7 EGT---------KRVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKI . : .:: : ... . : :. :..:. :. :.: :.. :.. ..: CCDS21 KMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHI 370 380 390 400 410 420 580 590 600 610 620 pF1KB7 AKLYKKSKKGILVNMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI ..:... :: : ...........: CCDS21 HRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL 430 440 450 460 470 >>CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 (504 aa) initn: 290 init1: 103 opt: 343 Z-score: 396.5 bits: 83.2 E(32554): 9.1e-16 Smith-Waterman score: 354; 30.9% identity (56.7% similar) in 291 aa overlap (242-512:58-335) 220 230 240 250 260 270 pF1KB7 PDSTYSESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLN .: :::.. :. : : . .:::: CCDS46 QELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETLTYLN 30 40 50 60 70 80 280 290 300 310 320 pF1KB7 KGQFYAITLSET---GDNKCFRHPISKVRSVVMVVFSEDK---NRDEQLKYWKYWHSRQH .:: : : . .. :: . . :.:.. ::: . . .. .::. :: :. CCDS46 QGQSYEIRMLDNRKMGDMPEINGKL--VKSIIRVVFHDRRLQYTEHQQLEGWK-WN---- 90 100 110 120 130 140 330 340 350 360 370 380 pF1KB7 TAKQRVLDIADYKESFNTIGN-IEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK-- .:.::. : : . : . . ::: : :: .... :: :.:.::.:. .: CCDS46 RPGDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRKHG 150 160 170 180 190 390 400 410 420 430 pF1KB7 GVKGLPLMIQIDTYSYNNRSNKP--IHRAYCQIKVFCDKGAERKIR-DEERKQNR---KK : ::.:. ::.::.. :. .. .: : :::::: :::.:: . :.:. ..: .: CCDS46 GEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAHEK 200 210 220 230 240 250 440 450 460 470 480 490 pF1KB7 GKGQASQ-----TQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVLFIPDVHFANLQ : : : :.:. :. : . . . :. : :. : . .:: . .. . CCDS46 EKYQPSYDTTILTECSPWPDAPTAYVNNSPSPAPTF--TSPQ---QSTCSVPDSNSSSPN 260 270 280 290 300 310 500 510 520 530 540 550 pF1KB7 RTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFD . :. .:. :. :. .. CCDS46 HQGDGASQTSGEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGADLLKLTKEDLVQICG 320 330 340 350 360 370 >>CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 (540 aa) initn: 290 init1: 103 opt: 340 Z-score: 392.6 bits: 82.6 E(32554): 1.5e-15 Smith-Waterman score: 340; 33.2% identity (59.5% similar) in 220 aa overlap (242-449:58-269) 220 230 240 250 260 270 pF1KB7 PDSTYSESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLN .: :::.. :. : : . .:::: CCDS26 QELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETLTYLN 30 40 50 60 70 80 280 290 300 310 320 pF1KB7 KGQFYAITLSET---GDNKCFRHPISKVRSVVMVVFSEDK---NRDEQLKYWKYWHSRQH .:: : : . .. :: . . :.:.. ::: . . .. .::. :: :. CCDS26 QGQSYEIRMLDNRKMGDMPEINGKL--VKSIIRVVFHDRRLQYTEHQQLEGWK-WN---- 90 100 110 120 130 140 330 340 350 360 370 380 pF1KB7 TAKQRVLDIADYKESFNTIGN-IEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK-- .:.::. : : . : . . ::: : :: .... :: :.:.::.:. .: CCDS26 RPGDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRKHG 150 160 170 180 190 390 400 410 420 430 pF1KB7 GVKGLPLMIQIDTYSYNNRSNKP--IHRAYCQIKVFCDKGAERKIR-DEERKQNRKKGKG : ::.:. ::.::.. :. .. .: : :::::: :::.:: . :.:. ..: . CCDS26 GEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAHEK 200 210 220 230 240 250 440 450 460 470 480 490 pF1KB7 QASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVLFIPDVHFANLQRTGQVYYN . : . ... CCDS26 EKYQPSYDTTILTEMRLEPIIEDAVEHEQKKSSKRTLPADYGDSLAKRGSCSPWPDAPTA 260 270 280 290 300 310 625 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 18:35:43 2016 done: Sat Nov 5 18:35:43 2016 Total Scan time: 2.820 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]