FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7728, 479 aa
1>>>pF1KB7728 479 - 479 aa - 479 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0982+/-0.00085; mu= 14.4233+/- 0.051
mean_var=82.1166+/-16.179, 0's: 0 Z-trim(108.2): 17 B-trim: 3 in 1/50
Lambda= 0.141533
statistics sampled from 10072 (10086) to 10072 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.31), width: 16
Scan time: 3.200
The best scores are: opt bits E(32554)
CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 ( 479) 3257 674.7 5.7e-194
CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 ( 502) 2414 502.6 3.9e-142
CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 ( 504) 1854 388.3 1e-107
CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 ( 540) 1403 296.2 5.7e-80
CCDS55827.1 TFCP2 gene_id:7024|Hs108|chr12 ( 450) 848 182.8 6.4e-46
CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 ( 618) 366 84.5 3.6e-16
CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 ( 609) 355 82.2 1.7e-15
CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 ( 625) 355 82.2 1.7e-15
CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 ( 556) 352 81.6 2.4e-15
CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 ( 602) 352 81.6 2.5e-15
CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 ( 607) 352 81.6 2.5e-15
CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 ( 626) 352 81.6 2.6e-15
>>CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 (479 aa)
initn: 3257 init1: 3257 opt: 3257 Z-score: 3595.9 bits: 674.7 E(32554): 5.7e-194
Smith-Waterman score: 3257; 100.0% identity (100.0% similar) in 479 aa overlap (1-479:1-479)
10 20 30 40 50 60
pF1KB7 MLFWHTQPEHYNQHNSGSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 MLFWHTQPEHYNQHNSGSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 LHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGW
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 RWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 RWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 HGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 HGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 EKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 EKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 GSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 AIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 AIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIAN
370 380 390 400 410 420
430 440 450 460 470
pF1KB7 LYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL
430 440 450 460 470
>>CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 (502 aa)
initn: 2065 init1: 1475 opt: 2414 Z-score: 2665.3 bits: 502.6 E(32554): 3.9e-142
Smith-Waterman score: 2414; 74.6% identity (91.5% similar) in 469 aa overlap (16-476:35-502)
10 20 30 40
pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
.:.: . :::::::::::: .: :.:: ..
CCDS88 LKLPLADEVIESGLVQDFDASLSGIGQELGAGAYSMSDVLALPIFKQEESSLPPDNENKI
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
:.:::::::::::::::.:::::::::::::::.:.:::::.. ..: : ::::.::::
CCDS88 LPFQYVLCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKLGELPEINGKLVKSIFRVVF
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
::::::::::::::::::.::::::::::::.::::.::::.:::::.::::::::::.:
CCDS88 HDRRLQYTEHQQLEGWRWNRPGDRILDIDIPMSVGIIDPRANPTQLNTVEFLWDPAKRTS
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
.:::::::::::: :::::::::::::::::::.::::::::::::::::::::::::::
CCDS88 VFIQVHCISTEFTMRKHGGEKGVPFRVQIDTFKENENGEYTEHLHSASCQIKVFKPKGAD
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL
:::::::::::::: .:::::::::::::::::::::...: ::..:::..:.: .::.:
CCDS88 RKQKTDREKMEKRTPHEKEKYQPSYETTILTECSPWPEITY-VNNSPSPGFNSSHSSFSL
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB7 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD
::::.::.: : : .:.:::... :.::::::::::: : :::..::::::::..::
CCDS88 GEGNGSPNHQPEPPPPVTDNLLPTTTPQEAQQWLHRNRFSTFTRLFTNFSGADLLKLTRD
310 320 330 340 350 360
350 360 370 380 390
pF1KB7 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQEL-----EQNRVPLQQKRDGSGDSNLS
:..::::::::::::::.::: :::..::::::: .:.. ::.. .:::: .
CCDS88 DVIQICGPADGIRLFNALKGRMVRPRLTIYVCQESLQLREQQQQQQQQQQKHEDGDSNGT
370 380 390 400 410 420
400 410 420 430 440 450
pF1KB7 --VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESC
:::::.:::::..:: ::::.:.:::: .: ..:.::::::::..:.::.::::.:.:
CCDS88 FFVYHAIYLEELTAVELTEKIAQLFSISPCQISQIYKQGPTGIHVLISDEMIQNFQEEAC
430 440 450 460 470 480
460 470
pF1KB7 FVLSTIKAESNDGYHIILKCGL
:.:.:.:::.::.::::::
CCDS88 FILDTMKAETNDSYHIILK
490 500
>>CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 (504 aa)
initn: 2156 init1: 1446 opt: 1854 Z-score: 2047.3 bits: 388.3 E(32554): 1e-107
Smith-Waterman score: 2176; 68.1% identity (89.2% similar) in 474 aa overlap (16-476:32-504)
10 20 30 40
pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
.:.: . :::::::::::. .: ..:..
CCDS46 AWVLKMDEVIESGLVHDFDASLSGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEH
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
::.:::.:::::::::::.:::::::::::::::.:.:::.::. ..: : :::::::::
CCDS46 PPFQYVMCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVF
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
::::::::::::::::.:.:::::.::.:::.::::.: :..:.::::::::::::::.:
CCDS46 HDRRLQYTEHQQLEGWKWNRPGDRLLDLDIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTS
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
::::::::::::::::::::::::::.:.::::::::::::.::::::::::::::::::
CCDS46 AFIQVHCISTEFTPRKHGGEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGAD
190 200 210 220 230 240
230 240 250 260 270
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDV--AYQVNSAPSPSYN-GSP--
:::::::::::::::.:::::::::.::::::::::::. :: ::..:::. . ::
CCDS46 RKQKTDREKMEKRTAHEKEKYQPSYDTTILTECSPWPDAPTAY-VNNSPSPAPTFTSPQQ
250 260 270 280 290 300
280 290 300 310 320 330
pF1KB7 NSFGLGEGNAS-PTHPVE-ALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGAD
.. .. ..:.: :.: . : ...... :::.::..:::: .::::.. :::..:::::
CCDS46 STCSVPDSNSSSPNHQGDGASQTSGEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGAD
310 320 330 340 350 360
340 350 360 370 380 390
pF1KB7 LLKMSRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRV-PLQQKRDGSGDS
:::....::::::: ::::::.:..:.:.:::..:::::.: .. : ::. .:..
CCDS46 LLKLTKEDLVQICGAADGIRLYNSLKSRSVRPRLTIYVCREQPSSTVLQGQQQAASSASE
370 380 390 400 410 420
400 410 420 430 440 450
pF1KB7 NLS----VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNF
: : :::::.:::. . :. .:.: ...: ..:..::::::::::..::..:::::
CCDS46 NGSGAPYVYHAIYLEEMIASEVARKLALVFNIPLHQINQVYRQGPTGIHILVSDQMVQNF
430 440 450 460 470 480
460 470
pF1KB7 QDESCFVLSTIKAESNDGYHIILKCGL
::::::..::.::::.:: :::::
CCDS46 QDESCFLFSTVKAESSDGIHIILK
490 500
>>CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 (540 aa)
initn: 2142 init1: 1385 opt: 1403 Z-score: 1549.1 bits: 296.2 E(32554): 5.7e-80
Smith-Waterman score: 2031; 62.9% identity (82.7% similar) in 498 aa overlap (16-464:32-528)
10 20 30 40
pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
.:.: . :::::::::::. .: ..:..
CCDS26 AWVLKMDEVIESGLVHDFDASLSGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEH
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
::.:::.:::::::::::.:::::::::::::::.:.:::.::. ..: : :::::::::
CCDS26 PPFQYVMCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVF
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
::::::::::::::::.:.:::::.::.:::.::::.: :..:.::::::::::::::.:
CCDS26 HDRRLQYTEHQQLEGWKWNRPGDRLLDLDIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTS
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
::::::::::::::::::::::::::.:.::::::::::::.::::::::::::::::::
CCDS26 AFIQVHCISTEFTPRKHGGEKGVPFRIQVDTFKQNENGEYTDHLHSASCQIKVFKPKGAD
190 200 210 220 230 240
230 240 250
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTE----------------------------
:::::::::::::::.:::::::::.::::::
CCDS26 RKQKTDREKMEKRTAHEKEKYQPSYDTTILTEMRLEPIIEDAVEHEQKKSSKRTLPADYG
250 260 270 280 290 300
260 270 280 290 300
pF1KB7 --------CSPWPDV--AYQVNSAPSPSYN-GSP--NSFGLGEGNAS-PTHPVE-ALPVG
::::::. :: ::..:::. . :: .. .. ..:.: :.: . : ..
CCDS26 DSLAKRGSCSPWPDAPTAY-VNNSPSPAPTFTSPQQSTCSVPDSNSSSPNHQGDGASQTS
310 320 330 340 350 360
310 320 330 340 350 360
pF1KB7 SDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNA
.... :::.::..:::: .::::.. :::..::::::::....::::::: ::::::.:.
CCDS26 GEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGADLLKLTKEDLVQICGAADGIRLYNS
370 380 390 400 410 420
370 380 390 400 410
pF1KB7 IKGRNVRPKMTIYVCQELEQNRV-PLQQKRDGSGDSNLS----VYHAIFLEELTTLELIE
.:.:.:::..:::::.: .. : ::. .:.. : : :::::.:::. . :. .
CCDS26 LKSRSVRPRLTIYVCREQPSSTVLQGQQQAASSASENGSGAPYVYHAIYLEEMIASEVAR
430 440 450 460 470 480
420 430 440 450 460 470
pF1KB7 KIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILK
:.: ...: ..:..::::::::::..::..:::::::::::..::.:
CCDS26 KLALVFNIPLHQINQVYRQGPTGIHILVSDQMVQNFQDESCFLFSTVKAESSDGIHIILK
490 500 510 520 530 540
pF1KB7 CGL
>>CCDS55827.1 TFCP2 gene_id:7024|Hs108|chr12 (450 aa)
initn: 1778 init1: 840 opt: 848 Z-score: 937.9 bits: 182.8 E(32554): 6.4e-46
Smith-Waterman score: 1948; 64.0% identity (80.6% similar) in 469 aa overlap (16-476:35-450)
10 20 30 40
pF1KB7 MLFWHTQPEHYNQHNSGSY-LRDVLALPIFKQEEPQLSPENEARL
.:.: . :::::::::::: .: :.:: ..
CCDS55 LKLPLADEVIESGLVQDFDASLSGIGQELGAGAYSMSDVLALPIFKQEESSLPPDNENKI
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 PPLQYVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVF
:.:::::::::::::::.:::::::::::::::.:.:::::.. ..: : ::::.::::
CCDS55 LPFQYVLCAATSPAVKLHDETLTYLNQGQSYEIRMLDNRKLGELPEINGKLVKSIFRVVF
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 HDRRLQYTEHQQLEGWRWSRPGDRILDIDIPLSVGILDPRASPTQLNAVEFLWDPAKRAS
::::::::::::::::::.::::::::::::.::::.::::.:::::.::::::::::.:
CCDS55 HDRRLQYTEHQQLEGWRWNRPGDRILDIDIPMSVGIIDPRANPTQLNTVEFLWDPAKRTS
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 AFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHLHSASCQIKVFKPKGAD
.::: :::::
CCDS55 VFIQ---------------------------------------------------PKGAD
190
230 240 250 260 270 280
pF1KB7 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL
:::::::::::::: .:::::::::::::::::::::...: ::..:::..:.: .::.:
CCDS55 RKQKTDREKMEKRTPHEKEKYQPSYETTILTECSPWPEITY-VNNSPSPGFNSSHSSFSL
200 210 220 230 240 250
290 300 310 320 330 340
pF1KB7 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD
::::.::.: : : .:.:::... :.::::::::::: : :::..::::::::..::
CCDS55 GEGNGSPNHQPEPPPPVTDNLLPTTTPQEAQQWLHRNRFSTFTRLFTNFSGADLLKLTRD
260 270 280 290 300 310
350 360 370 380 390
pF1KB7 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQEL-----EQNRVPLQQKRDGSGDSNLS
:..::::::::::::::.::: :::..::::::: .:.. ::.. .:::: .
CCDS55 DVIQICGPADGIRLFNALKGRMVRPRLTIYVCQESLQLREQQQQQQQQQQKHEDGDSNGT
320 330 340 350 360 370
400 410 420 430 440 450
pF1KB7 --VYHAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESC
:::::.:::::..:: ::::.:.:::: .: ..:.::::::::..:.::.::::.:.:
CCDS55 FFVYHAIYLEELTAVELTEKIAQLFSISPCQISQIYKQGPTGIHVLISDEMIQNFQEEAC
380 390 400 410 420 430
460 470
pF1KB7 FVLSTIKAESNDGYHIILKCGL
:.:.:.: :.::.::::::
CCDS55 FILDTMK-ETNDSYHIILK
440 450
>>CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 (618 aa)
initn: 231 init1: 107 opt: 366 Z-score: 403.9 bits: 84.5 E(32554): 3.6e-16
Smith-Waterman score: 383; 27.4% identity (55.5% similar) in 438 aa overlap (47-475:252-615)
20 30 40 50 60 70
pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE
..:.: :. : : . :.::::.:: :
CCDS33 QEVFFPSDLSLRMPGMNSEDYVFDSVSGNNFEYTLEASKSLRQKPGDSTMTYLNKGQFYP
230 240 250 260 270 280
80 90 100 110 120 130
pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD
: : : . .. .: :.:.: ::: . . ....::. :. : :: .: .:
CCDS33 ITLKEVSSSEGIHHPISK-VRSVIMVVFAEDK---SREDQLRHWKYWHSRQHTAKQRCID
290 300 310 320 330
140 150 160 170 180 190
pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR
: : : . .. ::. : :: .:..::.:.:.::.:. .: : ::.:.
CCDS33 IADYKESFNTIS-NIEEIAYNAISFTWDINDEAKVFISVNCLSTDFSSQK--GVKGLPLN
340 350 360 370 380 390
200 210 220 230 240
pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQE-KEKYQPSY
.:.::.. :. . .. .: : :::::: :::.:: . ...:. :: ... : ::.
CCDS33 IQVDTYSYNNRS--NKPVHRAYCQIKVFCDKGAERKIRDEERKQSKRKVSDVKVPLLPSH
400 410 420 430 440 450
250 260 270 280 290 300
pF1KB7 ETTILTECSPWPDVAYQ-VNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPS
. .: .:. :. : : :. . . : .: :: .::..:..:
CCDS33 KRMDITVFKPFIDLDTQPVLFIPDVHFAN------LQRG----TH---VLPIASEELEGE
460 470 480 490
310 320 330 340 350 360
pF1KB7 ASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVR
.:. :.:. .. ..::.. :. . .: .
CCDS33 GSV------LKRGPYG-----------------TEDDFA--VPPSTKL-------ARIEE
500 510 520
370 380 390 400 410 420
pF1KB7 PK-MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQ
:: . .:: .: :. :. :..:. . :.: :.. :.. .
CCDS33 PKRVLLYVRKESEE------------------VFDALMLKTPSLKGLMEAISDKYDVPHD
530 540 550 560
430 440 450 460 470
pF1KB7 HIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESNDGYHIILKCGL
.: ..... :: : .....:.....:. : :. :.. .:.. :
CCDS33 KIGKIFKKCKKGILVNMDDNIVKHYSNEDTFQLQI--EEAGGSYKLTLTEI
570 580 590 600 610
>>CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 (609 aa)
initn: 326 init1: 108 opt: 355 Z-score: 391.8 bits: 82.2 E(32554): 1.7e-15
Smith-Waterman score: 396; 28.9% identity (55.7% similar) in 436 aa overlap (47-475:232-606)
20 30 40 50 60 70
pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE
.::.: :. : : : .::::.:: :
CCDS83 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA
210 220 230 240 250 260
80 90 100 110 120 130
pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD
: : :. :. .: :.:.. ::: . . .. .::. :. : :: .:.::
CCDS83 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD
270 280 290 300 310
140 150 160 170 180 190
pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR
: : : . . ::: : :: ..:. :: :.:.::.:. .: : ::.:.
CCDS83 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM
320 330 340 350 360 370
200 210 220 230 240 250
pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE
.::::.. :. .. . .: : :::::: :::.:: . :.:. ..: .: : : :
CCDS83 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ-
380 390 400 410 420
260 270 280 290 300 310
pF1KB7 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS
:.: :: : .:. .. : . : ...: . : :
CCDS83 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF
430 440 450 460
320 330 340 350 360 370
pF1KB7 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVRPK
: :.. :... : . ..: . . . ::. :.: .. .. :
CCDS83 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVK--------RMFRPME-EEFGPV
470 480 490 500
380 390 400 410 420 430
pF1KB7 MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHIH
. . .: . :: : ... . : :. :..:. :. :.: :.. :.. ..:
CCDS83 PSKQMKEEGTK-RVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKIA
510 520 530 540 550 560
440 450 460 470
pF1KB7 RVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESN-DGYHIILKCGL
..:... :: : ...........:. :.:. :: .:... :
CCDS83 KLYKKSKKGILVNMDDNIIEHYSNEDTFILN---MESMVEGFKVTLMEI
570 580 590 600
>>CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 (625 aa)
initn: 353 init1: 108 opt: 355 Z-score: 391.6 bits: 82.2 E(32554): 1.7e-15
Smith-Waterman score: 396; 28.9% identity (55.7% similar) in 436 aa overlap (47-475:248-622)
20 30 40 50 60 70
pF1KB7 GSYLRDVLALPIFKQEEPQLSPENEARLPPLQYVLCAATSPAVKLHEETLTYLNQGQSYE
.::.: :. : : : .::::.:: :
CCDS34 ESFKDAATEKFRSASVGAEEYMYDQTSSGTFQYTLEATKSLRQKQGEGPMTYLNKGQFYA
220 230 240 250 260 270
80 90 100 110 120 130
pF1KB7 IRLLENRKLGDFQDLNTKYVKSIIRVVFHDRRLQYTEHQQLEGWR-W-SRPG---DRILD
: : :. :. .: :.:.. ::: . . .. .::. :. : :: .:.::
CCDS34 ITLSETGDNKCFRHPISK-VRSVVMVVFSEDK---NRDEQLKYWKYWHSRQHTAKQRVLD
280 290 300 310 320 330
140 150 160 170 180 190
pF1KB7 I-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASAFIQVHCISTEFTPRKHGGEKGVPFR
: : : . . ::: : :: ..:. :: :.:.::.:. .: : ::.:.
CCDS34 IADYKESFNTIG-NIEEIAYNAVSFTWDVNEEAKIFITVNCLSTDFSSQK--GVKGLPLM
340 350 360 370 380 390
200 210 220 230 240 250
pF1KB7 VQIDTFKQNENGEYTEHLHSASCQIKVFKPKGADRKQKTDREKMEKRTAQEKEKYQPSYE
.::::.. :. .. . .: : :::::: :::.:: . :.:. ..: .: : : :
CCDS34 IQIDTYSYNNRSN--KPIHRAYCQIKVFCDKGAERKIR-DEERKQNR---KKGKGQASQ-
400 410 420 430 440
260 270 280 290 300 310
pF1KB7 TTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGLGEGNASPTHPVEALPVGSDHLLPSAS
:.: :: : .:. .. : . : ...: . : :
CCDS34 ----TQC----------NS----SSDGKLAAIPLQK--KSDITYFKTMP--DLHSQPVLF
450 460 470 480
320 330 340 350 360 370
pF1KB7 IQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRDDLVQICGPADGIRLFNAIKGRNVRPK
: :.. :... : . ..: . . . ::. :.: .. .. :
CCDS34 IPDVH-------FANLQRTGQVYYNTDDEREGGSVLVK--------RMFRPME-EEFGPV
490 500 510 520
380 390 400 410 420 430
pF1KB7 MTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAIFLEELTTLELIEKIANLYSISPQHIH
. . .: . :: : ... . : :. :..:. :. :.: :.. :.. ..:
CCDS34 PSKQMKEEGTK-RVLLYVRKE-TDD----VFDALMLKSPTVKGLMEAISEKYGLPVEKIA
530 540 550 560 570
440 450 460 470
pF1KB7 RVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIKAESN-DGYHIILKCGL
..:... :: : ...........:. :.:. :: .:... :
CCDS34 KLYKKSKKGILVNMDDNIIEHYSNEDTFILN---MESMVEGFKVTLMEI
580 590 600 610 620
>>CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 (556 aa)
initn: 189 init1: 97 opt: 352 Z-score: 389.1 bits: 81.6 E(32554): 2.4e-15
Smith-Waterman score: 381; 25.6% identity (55.3% similar) in 465 aa overlap (21-476:157-554)
10 20 30 40
pF1KB7 MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ
.. . .: :.: ::. : ..
CCDS53 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE
130 140 150 160 170 180
50 60 70 80 90 100
pF1KB7 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR
:.: . . .: : ..:::.:: : . : .. : :... :::.. ::: ...
CCDS53 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK
190 200 210 220 230 240
110 120 130 140 150 160
pF1KB7 LQYTEHQQLEGWR-W-SR-PG--DRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKR
. .::. :. : :: : .:..:. : . . .. . . ::. :.:. ..
CCDS53 VPV---EQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEE
250 260 270 280 290 300
170 180 190 200 210 220
pF1KB7 ASAFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPK
:..:: :.:.::.:. .: : ::::. .::::. . : ::.: : : ::::.: :
CCDS53 AKVFIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDK
310 320 330 340 350
230 240 250 260 270 280
pF1KB7 GADRKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNS
::.::.. :..:. .: .. .. . . . .:. .. :. ..
CCDS53 GAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETT
360 370 380 390
290 300 310 320 330 340
pF1KB7 FGLGEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKM
. : .:. :: ..:. .: ::.. : .. .: .
CCDS53 Y------LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSS
400 410 420 430
350 360 370 380 390 400
pF1KB7 SRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVY
.: : . :.: . :. . ..... : . .:: : .:. . :.
CCDS53 NRLPLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRE-----TEEVF
440 450 460 470 480
410 420 430 440 450 460
pF1KB7 HAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLS
:..:. : . :.. :.. ..:..::.. :: : ..:...:..... :.:.
CCDS53 DALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLD
490 500 510 520 530 540
470
pF1KB7 TIKAESNDGYHIILKCGL
.: . .::::
CCDS53 M--GELDGKIQIILKEL
550
>>CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 (602 aa)
initn: 189 init1: 97 opt: 352 Z-score: 388.6 bits: 81.6 E(32554): 2.5e-15
Smith-Waterman score: 381; 25.6% identity (55.3% similar) in 465 aa overlap (21-476:203-600)
10 20 30 40
pF1KB7 MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ
.. . .: :.: ::. : ..
CCDS44 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE
180 190 200 210 220 230
50 60 70 80 90 100
pF1KB7 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR
:.: . . .: : ..:::.:: : . : .. : :... :::.. ::: ...
CCDS44 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK
240 250 260 270 280 290
110 120 130 140 150 160
pF1KB7 LQYTEHQQLEGWR-W-SR-PG--DRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKR
. .::. :. : :: : .:..:. : . . .. . . ::. :.:. ..
CCDS44 VPV---EQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEE
300 310 320 330 340
170 180 190 200 210 220
pF1KB7 ASAFIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPK
:..:: :.:.::.:. .: : ::::. .::::. . : ::.: : : ::::.: :
CCDS44 AKVFIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDK
350 360 370 380 390 400
230 240 250 260 270 280
pF1KB7 GADRKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNS
::.::.. :..:. .: .. .. . . . .:. .. :. ..
CCDS44 GAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETT
410 420 430 440
290 300 310 320 330 340
pF1KB7 FGLGEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKM
. : .:. :: ..:. .: ::.. : .. .: .
CCDS44 Y------LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSS
450 460 470 480
350 360 370 380 390 400
pF1KB7 SRDDLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVY
.: : . :.: . :. . ..... : . .:: : .:. . :.
CCDS44 NRLPLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRE-----TEEVF
490 500 510 520
410 420 430 440 450 460
pF1KB7 HAIFLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLS
:..:. : . :.. :.. ..:..::.. :: : ..:...:..... :.:.
CCDS44 DALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLD
530 540 550 560 570 580
470
pF1KB7 TIKAESNDGYHIILKCGL
.: . .::::
CCDS44 M--GELDGKIQIILKEL
590 600
479 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 04:46:22 2016 done: Mon Nov 7 04:46:23 2016
Total Scan time: 3.200 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]