FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7854, 625 aa
1>>>pF1KB7854 625 - 625 aa - 625 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9585+/-0.00113; mu= 16.0509+/- 0.068
mean_var=75.0003+/-14.722, 0's: 0 Z-trim(102.9): 24 B-trim: 0 in 0/50
Lambda= 0.148096
statistics sampled from 7156 (7170) to 7156 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.579), E-opt: 0.2 (0.22), width: 16
Scan time: 2.820
The best scores are: opt bits E(32554)
CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 ( 625) 4094 884.7 0
CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 ( 609) 3994 863.3 0
CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 ( 618) 1646 361.6 1.7e-99
CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 ( 556) 1369 302.4 1e-81
CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 ( 602) 1369 302.5 1.1e-81
CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 ( 607) 1369 302.5 1.1e-81
CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 ( 626) 1255 278.1 2.4e-74
CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 ( 479) 355 85.8 1.5e-16
CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 ( 504) 343 83.2 9.1e-16
CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 ( 540) 340 82.6 1.5e-15
CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 ( 502) 336 81.7 2.6e-15
>>CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 (625 aa)
initn: 4094 init1: 4094 opt: 4094 Z-score: 4726.3 bits: 884.7 E(32554): 0
Smith-Waterman score: 4094; 100.0% identity (100.0% similar) in 625 aa overlap (1-625:1-625)
10 20 30 40 50 60
pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB7 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB7 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH
550 560 570 580 590 600
610 620
pF1KB7 YSNEDTFILNMESMVEGFKVTLMEI
:::::::::::::::::::::::::
CCDS34 YSNEDTFILNMESMVEGFKVTLMEI
610 620
>>CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 (609 aa)
initn: 3994 init1: 3994 opt: 3994 Z-score: 4611.0 bits: 863.3 E(32554): 0
Smith-Waterman score: 3994; 100.0% identity (100.0% similar) in 609 aa overlap (17-625:1-609)
10 20 30 40 50 60
pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS
::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS
10 20 30 40
70 80 90 100 110 120
pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB7 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 PVNLSLNQDHLENSKREQYSISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGE
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB7 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 EQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKFRSASVGAEEYMY
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB7 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 DQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVV
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB7 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWD
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB7 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 VNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKG
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB7 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 AERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVL
410 420 430 440 450 460
490 500 510 520 530 540
pF1KB7 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 FIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLL
470 480 490 500 510 520
550 560 570 580 590 600
pF1KB7 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 YVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEH
530 540 550 560 570 580
610 620
pF1KB7 YSNEDTFILNMESMVEGFKVTLMEI
:::::::::::::::::::::::::
CCDS83 YSNEDTFILNMESMVEGFKVTLMEI
590 600
>>CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 (618 aa)
initn: 1907 init1: 1063 opt: 1646 Z-score: 1899.7 bits: 361.6 E(32554): 1.7e-99
Smith-Waterman score: 2234; 57.6% identity (78.9% similar) in 641 aa overlap (1-625:1-618)
10 20 30 40 50 60
pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS
:.:: :: :: : :: . .. . ::.::::::::::.:::::::::::::::::::::
CCDS33 MTQEYDN-KRPV-LV-LQNEALYPQRRSYTSEDEAWKSFLENPLTAATKAMMSINGDEDS
10 20 30 40 50
70 80 90 100 110
pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQE-DQEKRNCLGTSEAQSNLSGGENRVQVLKT
:::::::::::::::..: ... . : :. ::: . : .:.:::::::::.
CCDS33 AAALGLLYDYYKVPRERRSSTAKPEVEHPEPDHSKRNSIPIVTEQPLISAGENRVQVLKN
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 VPVNLSLNQ-DHLENSKREQYSISFPESSAIIPVSGITV--VKAEDFTPVF---MAPPVH
:: :. : . ..: .:: . .. :.... . .. . . .:.: : . : :.
CCDS33 VPFNIVLPHGNQLGIDKRGH--LTAPDTTVTVSIATMPTHSIKTETQPHGFAVGIPPAVY
120 130 140 150 160 170
180 190 200 210 220
pF1KB7 YPRGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAATEKF-----
.:. .:::.:... .. .... .: . :: :::::.::.::... : :
CCDS33 HPE---PTERVVVFDRN-LNTDQFSS-GAQAPNAQRRTPDSTFSETFKEGVQEVFFPSDL
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB7 --RSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDN
: ....:.:..:..:...:.:::::.:::::: :.. :::::::::: :::.:....
CCDS33 SLRMPGMNSEDYVFDSVSGNNFEYTLEASKSLRQKPGDSTMTYLNKGQFYPITLKEVSSS
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB7 KCFRHPISKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGN
. ..:::::::::.::::.:::.:..::..:::::::::::::: .::::::::::::.:
CCDS33 EGIHHPISKVRSVIMVVFAEDKSREDQLRHWKYWHSRQHTAKQRCIDIADYKESFNTISN
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB7 IEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPI
::::::::.:::::.:.:::.::.::::::::::::::::::: ::.::::::::::::.
CCDS33 IEEIAYNAISFTWDINDEAKVFISVNCLSTDFSSQKGVKGLPLNIQVDTYSYNNRSNKPV
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB7 HRAYCQIKVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQKKSDIT
::::::::::::::::::::::::::...: :: :. .: .:. :::
CCDS33 HRAYCQIKVFCDKGAERKIRDEERKQSKRK------------VSDVKVPLLPSHKRMDIT
420 430 440 450
470 480 490 500 510 520
pF1KB7 YFKTMPDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREG-GSVLVKRMFRPMEEEFGPV
:: . :: .:::::::::::::::: .: ...: :: :::: :: :..:.
CCDS33 VFKPFIDLDTQPVLFIPDVHFANLQRGTHVLPIASEELEGEGSVL-KRGPYGTEDDFAVP
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB7 PSKQMKE-EGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKK
:: .. . : ::::::::::...::::::::.:..::::::::.:: .: .::.:..::
CCDS33 PSTKLARIEEPKRVLLYVRKESEEVFDALMLKTPSLKGLMEAISDKYDVPHDKIGKIFKK
520 530 540 550 560 570
590 600 610 620
pF1KB7 SKKGILVNMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI
::::::::::::..:::::::: :..: ..:.:: ::
CCDS33 CKKGILVNMDDNIVKHYSNEDTFQLQIEEAGGSYKLTLTEI
580 590 600 610
>>CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 (556 aa)
initn: 1509 init1: 815 opt: 1369 Z-score: 1580.6 bits: 302.4 E(32554): 1e-81
Smith-Waterman score: 1509; 44.9% identity (70.5% similar) in 584 aa overlap (51-625:1-556)
30 40 50 60 70 80
pF1KB7 PPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRDKRLL
:: .:::.::.:::..::::: :..::.:
CCDS53 MMRVNGDDDSVAALSFLYDYYMGPKEKRIL
10 20 30
90 100 110 120 130
pF1KB7 SVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTVPVNLSLNQDHLENSKREQY-
: : . ...:: :: : : ...:. :. ....: . :.: . .. . :...
CCDS53 SSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLM
40 50 60 70 80
140 150 160 170 180 190
pF1KB7 ----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGEEQRVVIFEQTQYDVP
.. : ..: .: .: . ..: . .. : :. . .:: . . ::
CCDS53 SLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYDNGSLNS----LFE-SIHGVP
90 100 110 120 130 140
200 210 220 230 240 250
pF1KB7 SLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSASVGAEEYMYDQTSSGTFQYTLE
:: ::::.... ... . .... : . .: :.:::
CCDS53 PT----------QRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSD-FEYTLG
150 160 170 180 190
260 270 280 290 300 310
pF1KB7 ATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVVMVVFSEDKNRDEQ
. :... :.::.::.:::::::: .:: . .: . .::.:::::::...: ::
CCDS53 SPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQ
200 210 220 230 240 250
320 330 340 350 360 370
pF1KB7 LKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWDVNEEAKIFITVNC
:..::.::::: ::::::.:.:: ::.:::. .:::.::::.::.:.::::::.:: :::
CCDS53 LRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNC
260 270 280 290 300 310
380 390 400 410 420 430
pF1KB7 LSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKGAERKIRDEERKQN
:::::::::::::.:: .:::::. . ... .::: ::::.:::::::::.::.::::
CCDS53 LSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQF
320 330 340 350 360 370
440 450 460 470 480 490
pF1KB7 RKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTMPDLHSQPVLFIPDVHFANLQ
:.: : : .::.. . . :. . .. ::.. ::.. ::::::.:::..::
CCDS53 RRKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQ
380 390 400 410 420
500 510 520 530 540 550
pF1KB7 RTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFD
:.: . . .. . .:: :. ::: :.:::: :: .:::::::.::..:::
CCDS53 RSGGAA-PSAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFD
430 440 450 460 470 480
560 570 580 590 600 610
pF1KB7 ALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEHYSNEDTFILNM
:::::.: .::: .:::::::.: :.: :.::: :.:::::::.:::.::::. .:.:.:
CCDS53 ALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDM
490 500 510 520 530 540
620
pF1KB7 ESMVEGFKVTLMEI
. ... : :.
CCDS53 GELDGKIQIILKEL
550
>>CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 (602 aa)
initn: 1657 init1: 815 opt: 1369 Z-score: 1580.0 bits: 302.5 E(32554): 1.1e-81
Smith-Waterman score: 1660; 46.1% identity (70.8% similar) in 634 aa overlap (1-625:1-602)
10 20 30 40 50 60
pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS
::.: : : : : . .:: . .:::::::::.:::::::::::::: .:::.::
CCDS44 MSNELDF--RSVRL--LKNDPVNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDS
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV
.:::..::::: :..::.:: : . ...:: :: : : ...:. :. ....: .
CCDS44 VAALSFLYDYYMGPKEKRILSSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFL
60 70 80 90 100 110
130 140 150 160 170
pF1KB7 PVNLSLNQDHLENSKREQY-----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYP
:.: . .. . :... .. : ..: .: .: . ..: . .. :
CCDS44 TENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB7 RGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSASV
:. . .::. . :: :: ::::.... ... . ....
CCDS44 NGSLNS----LFESI-HGVPPT----------QRWQPDSTFKDDPQESMLFPDILKTSPE
180 190 200 210
240 250 260 270 280 290
pF1KB7 GAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPI
: . .: :.::: . :... :.::.::.:::::::: .:: . .: .
CCDS44 PPCPEDYPSLKSD-FEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSS
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB7 SKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYN
.::.:::::::...: :::..::.::::: ::::::.:.:: ::.:::. .:::.:::
CCDS44 NKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYN
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB7 AVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQI
:.::.:.::::::.:: ::::::::::::::::.:: .:::::. . ... .::: :::
CCDS44 ALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQI
340 350 360 370 380 390
420 430 440 450 460 470
pF1KB7 KVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTM
:.:::::::::.::.:::: :.: : : .::.. . . :. . .. ::..
CCDS44 KIFCDKGAERKMRDDERKQFRRKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPE
400 410 420 430 440
480 490 500 510 520 530
pF1KB7 PDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMK
::.. ::::::.:::..:::.: . .. .. . .:: :. ::: :.:::: :
CCDS44 TDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAK
450 460 470 480 490 500
540 550 560 570 580 590
pF1KB7 EEGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILV
: .:::::::.::..::::::::.: .::: .:::::::.: :.: :.::: :.::::
CCDS44 EGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILV
510 520 530 540 550 560
600 610 620
pF1KB7 NMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI
:::.:::.::::. .:.:.: . ... : :.
CCDS44 NMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL
570 580 590 600
>>CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 (607 aa)
initn: 1657 init1: 815 opt: 1369 Z-score: 1580.0 bits: 302.5 E(32554): 1.1e-81
Smith-Waterman score: 1657; 46.0% identity (71.5% similar) in 618 aa overlap (17-625:18-607)
10 20 30 40 50
pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDED
. .:: . .:::::::::.:::::::::::::: .:::.:
CCDS25 MWMNSILPIFLFRSVRLLKNDPVNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDD
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 SAAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKT
:.:::..::::: :..::.:: : . ...:: :: : : ...:. :. ....:
CCDS25 SVAALSFLYDYYMGPKEKRILSSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKF
70 80 90 100 110
120 130 140 150 160 170
pF1KB7 VPVNLSLNQDHLENSKREQY-----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHY
. :.: . .. . :... .. : ..: .: .: . ..: . .. :
CCDS25 LTENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMY
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB7 PRGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSAS
:. . .:: . . :: :: ::::.... ... . ....
CCDS25 DNGSLNS----LFE-SIHGVPP----------TQRWQPDSTFKDDPQESMLFPDILKTSP
180 190 200 210 220
240 250 260 270 280 290
pF1KB7 VGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHP
: . .: :.::: . :... :.::.::.:::::::: .:: . .: .
CCDS25 EPPCPEDYPSLKSD-FEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALS
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 ISKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAY
.::.:::::::...: :::..::.::::: ::::::.:.:: ::.:::. .:::.::
CCDS25 SNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAY
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB7 NAVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQ
::.::.:.::::::.:: ::::::::::::::::.:: .:::::. . ... .::: ::
CCDS25 NALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQ
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB7 IKVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKT
::.:::::::::.::.:::: :.: ..: .::.. . . :. . .. ::..
CCDS25 IKIFCDKGAERKMRDDERKQFRRK-------VKCPDSSNSGVKGCLLSGFRGNETTYLRP
410 420 430 440 450
480 490 500 510 520 530
pF1KB7 MPDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQM
::.. ::::::.:::..:::.: . .. .. . .:: :. ::: :.::::
CCDS25 ETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQA
460 470 480 490 500 510
540 550 560 570 580 590
pF1KB7 KEEGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGIL
:: .:::::::.::..::::::::.: .::: .:::::::.: :.: :.::: :.:::
CCDS25 KEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGIL
520 530 540 550 560 570
600 610 620
pF1KB7 VNMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI
::::.:::.::::. .:.:.: . ... : :.
CCDS25 VNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL
580 590 600
>>CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 (626 aa)
initn: 1559 init1: 825 opt: 1255 Z-score: 1448.1 bits: 278.1 E(32554): 2.4e-74
Smith-Waterman score: 1546; 45.9% identity (70.4% similar) in 597 aa overlap (1-588:1-565)
10 20 30 40 50 60
pF1KB7 MSQESDNNKRLVALVPMPSDPPFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDS
::.: : : : : . .:: . .:::::::::.:::::::::::::: .:::.::
CCDS25 MSNELDF--RSVRL--LKNDPVNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDS
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 AAALGLLYDYYKVPRDKRLLSVSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTV
.:::..::::: :..::.:: : . ...:: :: : : ...:. :. ....: .
CCDS25 VAALSFLYDYYMGPKEKRILSSS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFL
60 70 80 90 100 110
130 140 150 160 170
pF1KB7 PVNLSLNQDHLENSKREQY-----SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYP
:.: . .. . :... .. : ..: .: .: . ..: . .. :
CCDS25 TENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB7 RGDGEEQRVVIFEQTQYDVPSLATHSAYLKDDQRSTPDSTYSESFKDAAT--EKFRSASV
:. . .::. . :: :: ::::.... ... . ....
CCDS25 NGSLNS----LFESI-HGVPPT----------QRWQPDSTFKDDPQESMLFPDILKTSPE
180 190 200 210
240 250 260 270 280 290
pF1KB7 GAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPI
: . .: :.::: . :... :.::.::.:::::::: .:: . .: .
CCDS25 PPCPEDYPSLKSD-FEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSS
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB7 SKVRSVVMVVFSEDKNRDEQLKYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYN
.::.:::::::...: :::..::.::::: ::::::.:.:: ::.:::. .:::.:::
CCDS25 NKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYN
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB7 AVSFTWDVNEEAKIFITVNCLSTDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQI
:.::.:.::::::.:: ::::::::::::::::.:: .:::::. . ... .::: :::
CCDS25 ALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQI
340 350 360 370 380 390
420 430 440 450 460 470
pF1KB7 KVFCDKGAERKIRDEERKQNRKKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTM
:.:::::::::.::.:::: :.: : : .::.. . . :. . .. ::..
CCDS25 KIFCDKGAERKMRDDERKQFRRKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPE
400 410 420 430 440
480 490 500 510 520 530
pF1KB7 PDLHSQPVLFIPDVHFANLQRTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMK
::.. ::::::.:::..:::.: . .. .. . .:: :. ::: :.:::: :
CCDS25 TDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAK
450 460 470 480 490 500
540 550 560 570 580 590
pF1KB7 EEGTKRVLLYVRKETDDVFDALMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILV
: .:::::::.::..::::::::.: .::: .:::::::.: :.: :.::: :.:
CCDS25 EGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGETS
510 520 530 540 550 560
600 610 620
pF1KB7 NMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI
CCDS25 LLHPRLSRHPPPDCLECSHPVTQVRNMGFGDGFWRQRDLDSNPSPTTVNSLHFTVNSE
570 580 590 600 610 620
>>CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 (479 aa)
initn: 326 init1: 108 opt: 355 Z-score: 410.7 bits: 85.8 E(32554): 1.5e-16
Smith-Waterman score: 377; 28.6% identity (55.8% similar) in 416 aa overlap (248-604:47-455)
220 230 240 250 260 270
pF1KB7 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA
.::.: :. : : : .::::.:: :
CCDS21 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE
20 30 40 50 60 70
280 290 300 310 320 330
pF1KB7 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD
: : :. :. .: :.:.. ::: . . .. .::. :. : :: .:.::
CCDS21 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRP---GDRILD
80 90 100 110 120 130
340 350 360 370 380 390
pF1KB7 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM
: : : . . ::: : :: ..:. :: :.:.::.:. .: : ::.:.
CCDS21 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR
140 150 160 170 180 190
400 410 420 430 440
pF1KB7 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ-
.::::.. :. .. . .: : :::::: :::.:: . :.:. ..: .: : : :
CCDS21 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE
200 210 220 230 240 250
450 460 470 480
pF1KB7 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF
:.: :: : .:. .. : . : ...: . : :
CCDS21 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS
260 270 280 290 300 310
490 500 510 520 530
pF1KB7 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVKRMFRPME--EEFGPVPSKQMKE
: :.. :... : . ..: . . . ::. . : . . :. . .....
CCDS21 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQ-ICGPADGIRLFNAIKGRNVRP
320 330 340 350 360
540 550 560 570
pF1KB7 EGT---------KRVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKI
. : .:: : ... . : :. :..:. :. :.: :.. :.. ..:
CCDS21 KMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHI
370 380 390 400 410 420
580 590 600 610 620
pF1KB7 AKLYKKSKKGILVNMDDNIIEHYSNEDTFILNMESMVEGFKVTLMEI
..:... :: : ...........:
CCDS21 HRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL
430 440 450 460 470
>>CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 (504 aa)
initn: 290 init1: 103 opt: 343 Z-score: 396.5 bits: 83.2 E(32554): 9.1e-16
Smith-Waterman score: 354; 30.9% identity (56.7% similar) in 291 aa overlap (242-512:58-335)
220 230 240 250 260 270
pF1KB7 PDSTYSESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLN
.: :::.. :. : : . .::::
CCDS46 QELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETLTYLN
30 40 50 60 70 80
280 290 300 310 320
pF1KB7 KGQFYAITLSET---GDNKCFRHPISKVRSVVMVVFSEDK---NRDEQLKYWKYWHSRQH
.:: : : . .. :: . . :.:.. ::: . . .. .::. :: :.
CCDS46 QGQSYEIRMLDNRKMGDMPEINGKL--VKSIIRVVFHDRRLQYTEHQQLEGWK-WN----
90 100 110 120 130 140
330 340 350 360 370 380
pF1KB7 TAKQRVLDIADYKESFNTIGN-IEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--
.:.::. : : . : . . ::: : :: .... :: :.:.::.:. .:
CCDS46 RPGDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRKHG
150 160 170 180 190
390 400 410 420 430
pF1KB7 GVKGLPLMIQIDTYSYNNRSNKP--IHRAYCQIKVFCDKGAERKIR-DEERKQNR---KK
: ::.:. ::.::.. :. .. .: : :::::: :::.:: . :.:. ..: .:
CCDS46 GEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAHEK
200 210 220 230 240 250
440 450 460 470 480 490
pF1KB7 GKGQASQ-----TQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVLFIPDVHFANLQ
: : : :.:. :. : . . . :. : :. : . .:: . .. .
CCDS46 EKYQPSYDTTILTECSPWPDAPTAYVNNSPSPAPTF--TSPQ---QSTCSVPDSNSSSPN
260 270 280 290 300 310
500 510 520 530 540 550
pF1KB7 RTGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFD
. :. .:. :. :. ..
CCDS46 HQGDGASQTSGEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGADLLKLTKEDLVQICG
320 330 340 350 360 370
>>CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 (540 aa)
initn: 290 init1: 103 opt: 340 Z-score: 392.6 bits: 82.6 E(32554): 1.5e-15
Smith-Waterman score: 340; 33.2% identity (59.5% similar) in 220 aa overlap (242-449:58-269)
220 230 240 250 260 270
pF1KB7 PDSTYSESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLN
.: :::.. :. : : . .::::
CCDS26 QELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETLTYLN
30 40 50 60 70 80
280 290 300 310 320
pF1KB7 KGQFYAITLSET---GDNKCFRHPISKVRSVVMVVFSEDK---NRDEQLKYWKYWHSRQH
.:: : : . .. :: . . :.:.. ::: . . .. .::. :: :.
CCDS26 QGQSYEIRMLDNRKMGDMPEINGKL--VKSIIRVVFHDRRLQYTEHQQLEGWK-WN----
90 100 110 120 130 140
330 340 350 360 370 380
pF1KB7 TAKQRVLDIADYKESFNTIGN-IEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--
.:.::. : : . : . . ::: : :: .... :: :.:.::.:. .:
CCDS26 RPGDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRKHG
150 160 170 180 190
390 400 410 420 430
pF1KB7 GVKGLPLMIQIDTYSYNNRSNKP--IHRAYCQIKVFCDKGAERKIR-DEERKQNRKKGKG
: ::.:. ::.::.. :. .. .: : :::::: :::.:: . :.:. ..: .
CCDS26 GEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAHEK
200 210 220 230 240 250
440 450 460 470 480 490
pF1KB7 QASQTQCNSSSDGKLAAIPLQKKSDITYFKTMPDLHSQPVLFIPDVHFANLQRTGQVYYN
. : . ...
CCDS26 EKYQPSYDTTILTEMRLEPIIEDAVEHEQKKSSKRTLPADYGDSLAKRGSCSPWPDAPTA
260 270 280 290 300 310
625 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 18:35:43 2016 done: Sat Nov 5 18:35:43 2016
Total Scan time: 2.820 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]