FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5292, 412 aa
1>>>pF1KB5292 412 - 412 aa - 412 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9845+/-0.000355; mu= 18.7140+/- 0.022
mean_var=63.2445+/-12.533, 0's: 0 Z-trim(114.0): 27 B-trim: 0 in 0/51
Lambda= 0.161273
statistics sampled from 23517 (23544) to 23517 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.276), width: 16
Scan time: 8.600
The best scores are: opt bits E(85289)
NP_001900 (OMIM: 116840,610127) cathepsin D prepro ( 412) 2751 648.8 7.1e-186
XP_011507546 (OMIM: 116890) PREDICTED: cathepsin E ( 401) 1220 292.6 1.2e-78
NP_001901 (OMIM: 116890) cathepsin E isoform a pre ( 396) 903 218.8 1.9e-56
XP_016883001 (OMIM: 605631) PREDICTED: napsin-A is ( 411) 901 218.4 2.7e-56
NP_004842 (OMIM: 605631) napsin-A preproprotein [H ( 420) 901 218.4 2.7e-56
XP_011525842 (OMIM: 605631) PREDICTED: napsin-A is ( 420) 901 218.4 2.7e-56
NP_001073275 (OMIM: 169710) pepsin A-3 preproprote ( 388) 758 185.1 2.6e-46
NP_001073276 (OMIM: 169720) pepsin A-4 preproprote ( 388) 758 185.1 2.6e-46
XP_016854970 (OMIM: 169720) PREDICTED: pepsin A-4 ( 388) 758 185.1 2.6e-46
NP_055039 (OMIM: 169730) pepsin A-5 preproprotein ( 388) 756 184.6 3.7e-46
XP_011507547 (OMIM: 116890) PREDICTED: cathepsin E ( 368) 713 174.6 3.6e-43
NP_002621 (OMIM: 169740) gastricsin isoform 1 prep ( 388) 606 149.7 1.2e-35
NP_001159896 (OMIM: 169740) gastricsin isoform 2 p ( 315) 439 110.8 4.9e-24
NP_000528 (OMIM: 179820,267430,613092) renin prepr ( 406) 429 108.5 3e-23
NP_001304260 (OMIM: 116890) cathepsin E isoform c ( 288) 396 100.8 4.7e-21
NP_683865 (OMIM: 116890) cathepsin E isoform b pre ( 363) 396 100.8 5.7e-21
XP_016883803 (OMIM: 605668) PREDICTED: beta-secret ( 423) 274 72.5 2.2e-12
NP_036236 (OMIM: 604252) beta-secretase 1 isoform ( 501) 267 70.9 8e-12
NP_001193977 (OMIM: 604252) beta-secretase 1 isofo ( 401) 204 56.2 1.7e-07
NP_620476 (OMIM: 605668) beta-secretase 2 isoform ( 468) 186 52.0 3.6e-06
NP_620477 (OMIM: 605668) beta-secretase 2 isoform ( 396) 185 51.8 3.7e-06
NP_036237 (OMIM: 605668) beta-secretase 2 isoform ( 518) 185 51.8 4.5e-06
NP_620428 (OMIM: 604252) beta-secretase 1 isoform ( 476) 178 50.2 1.3e-05
>>NP_001900 (OMIM: 116840,610127) cathepsin D preproprot (412 aa)
initn: 2751 init1: 2751 opt: 2751 Z-score: 3458.0 bits: 648.8 E(85289): 7.1e-186
Smith-Waterman score: 2751; 100.0% identity (100.0% similar) in 412 aa overlap (1-412:1-412)
10 20 30 40 50 60
pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ
310 320 330 340 350 360
370 380 390 400 410
pF1KB5 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
370 380 390 400 410
>>XP_011507546 (OMIM: 116890) PREDICTED: cathepsin E iso (401 aa)
initn: 1227 init1: 565 opt: 1220 Z-score: 1533.0 bits: 292.6 E(85289): 1.2e-78
Smith-Waterman score: 1242; 45.0% identity (74.3% similar) in 409 aa overlap (1-409:1-399)
10 20 30 40 50 60
pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP
:. :: :.: :. ..: :.::.. :... . .. ... .. . .. . .
XP_011 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKL-RARSQLSEFWKSHNLDMIQFTES
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH
. : : ::.: .:.: :.::.::: :::.::::::::::::..: . :: :
XP_011 CSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCT--SPACKTH
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB5 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG
... ..:::: . : ::.:.::.::::: .. : ::. .. . ...: : ::
XP_011 SRFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSAFSYQVEGLTVVG------QQFG
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB5 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ
:.. .:: ::. :.::::::..:: ..:..: :::::.: :.::: .:: :.: .:..
XP_011 ESVTEPGQTFVDAEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGG
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB5 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL
:.::..:: : ....:::... ::..::::. ::...:.. . .:.:::.:::::::::
XP_011 AGSELIFGGYDHSHFSGSLNWVPVTKQAYWQIALDNIQVGGTVMFCSEGCQAIVDTGTSL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB5 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ
..:: :....::.::::.: ..::: . : .....: .:. ..: : ::: :::
XP_011 ITGPSDKIKQLQNAIGAAP-VDGEYAVECANLNVMPDVTFTINGVPYTLSPTAYTLLDFV
300 310 320 330 340 350
370 380 390 400 410
pF1KB5 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
: .: :::.:.:: ::.::::::::::: ..:.:::: :::::.: :
XP_011 DGMQFCSSGFQGLDIHPPAGPLWILGDVFIRQFYSVFDRGNNRVGLAPAVP
360 370 380 390 400
>>NP_001901 (OMIM: 116890) cathepsin E isoform a preprop (396 aa)
initn: 1230 init1: 565 opt: 903 Z-score: 1134.5 bits: 218.8 E(85289): 1.9e-56
Smith-Waterman score: 1241; 45.5% identity (73.3% similar) in 409 aa overlap (1-409:1-394)
10 20 30 40 50 60
pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP
:. :: :.: :. ..: :.::.. :... . .. ... .. . .. . .
NP_001 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKL-RARSQLSEFWKSHNLDMIQFTES
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH
. : : ::.: .:.: :.::.::: :::.::::::::::::..: . :: :
NP_001 CSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCT--SPACKTH
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB5 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG
... ..:::: . : ::.:.::.::::: .. : ::: :. : : ::
NP_001 SRFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSVE-----------GLTVVGQQFG
120 130 140 150 160
190 200 210 220 230 240
pF1KB5 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ
:.. .:: ::. :.::::::..:: ..:..: :::::.: :.::: .:: :.: .:..
NP_001 ESVTEPGQTFVDAEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGG
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB5 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL
:.::..:: : ....:::... ::..::::. ::...:.. . .:.:::.:::::::::
NP_001 AGSELIFGGYDHSHFSGSLNWVPVTKQAYWQIALDNIQVGGTVMFCSEGCQAIVDTGTSL
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB5 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ
..:: :....::.::::.: ..::: . : .....: .:. ..: : ::: :::
NP_001 ITGPSDKIKQLQNAIGAAP-VDGEYAVECANLNVMPDVTFTINGVPYTLSPTAYTLLDFV
290 300 310 320 330 340
370 380 390 400 410
pF1KB5 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
: .: :::.:.:: ::.::::::::::: ..:.:::: :::::.: :
NP_001 DGMQFCSSGFQGLDIHPPAGPLWILGDVFIRQFYSVFDRGNNRVGLAPAVP
350 360 370 380 390
>>XP_016883001 (OMIM: 605631) PREDICTED: napsin-A isofor (411 aa)
initn: 1264 init1: 888 opt: 901 Z-score: 1131.7 bits: 218.4 E(85289): 2.7e-56
Smith-Waterman score: 1253; 46.2% identity (72.2% similar) in 418 aa overlap (1-409:1-392)
10 20 30 40 50
pF1KB5 MQPSSLL-PLALCLL---AAPASA-LVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKY
:.: :: :: : : . :..: :.:::::. :: .. . : : :.
XP_016 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILNLLRGWRE------PAELP
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SQAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDI
. ..:. . :: :.:: :.::.::::.::::: :::.:::::::::::: .:.....
XP_016 KLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 ACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVE
: .::.. :::.: :.::.: ..: ::.: ... ::.:
XP_016 PC---------SSSSFQANGTKFAIQYGTGRVDGILSEDKLTI-----------GGIKGA
120 130 140 150
180 190 200 210 220 230
pF1KB5 RQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSR
.:::: .:...: :.::::::...: .::..: : .: :..: :.:. .:::::.:
XP_016 SVIFGEALWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNR
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB5 DPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVD
::. ::::.:::.: .: :... :: ::::.:...:.:. ::::: .:: ::.:
XP_016 DPEEPDGGELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILD
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB5 TGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYT
:::::..::..:.: :. :::..::. :::.: : .. :::... ::: ..:. .::.
XP_016 TGTSLITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYV
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB5 LKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDN----NRVGFAEAAR
..... : ::::::...:.:::.::.:::::::.: : .:::: . :::.:.:
XP_016 IQTTRNGVRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARART
340 350 360 370 380 390
pF1KB5 L
XP_016 RGADLGWGETAQAQFPG
400 410
>>NP_004842 (OMIM: 605631) napsin-A preproprotein [Homo (420 aa)
initn: 1321 init1: 888 opt: 901 Z-score: 1131.6 bits: 218.4 E(85289): 2.7e-56
Smith-Waterman score: 1324; 46.9% identity (73.7% similar) in 418 aa overlap (1-409:1-401)
10 20 30 40 50
pF1KB5 MQPSSLL-PLALCLL---AAPASA-LVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKY
:.: :: :: : : . :..: :.:::::. :: .. . : : :.
NP_004 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILNLLRGWRE------PAELP
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SQAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDI
. ..:. . :: :.:: :.::.::::.::::: :::.:::::::::::: .:.....
NP_004 KLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 ACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVE
::.::... ::.. :::.: :.::.: ..: ::.: ... ::.:
NP_004 PCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTI-----------GGIKGA
120 130 140 150 160
180 190 200 210 220 230
pF1KB5 RQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSR
.:::: .:...: :.::::::...: .::..: : .: :..: :.:. .:::::.:
NP_004 SVIFGEALWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNR
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB5 DPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVD
::. ::::.:::.: .: :... :: ::::.:...:.:. ::::: .:: ::.:
NP_004 DPEEPDGGELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILD
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB5 TGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYT
:::::..::..:.: :. :::..::. :::.: : .. :::... ::: ..:. .::.
NP_004 TGTSLITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYV
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB5 LKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDN----NRVGFAEAAR
..... : ::::::...:.:::.::.:::::::.: : .:::: . :::.:.:
NP_004 IQTTRNGVRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARART
350 360 370 380 390 400
pF1KB5 L
NP_004 RGADLGWGETAQAQFPG
410 420
>>XP_011525842 (OMIM: 605631) PREDICTED: napsin-A isofor (420 aa)
initn: 1321 init1: 888 opt: 901 Z-score: 1131.6 bits: 218.4 E(85289): 2.7e-56
Smith-Waterman score: 1324; 46.9% identity (73.7% similar) in 418 aa overlap (1-409:1-401)
10 20 30 40 50
pF1KB5 MQPSSLL-PLALCLL---AAPASA-LVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKY
:.: :: :: : : . :..: :.:::::. :: .. . : : :.
XP_011 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILNLLRGWRE------PAELP
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SQAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDI
. ..:. . :: :.:: :.::.::::.::::: :::.:::::::::::: .:.....
XP_011 KLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 ACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVE
::.::... ::.. :::.: :.::.: ..: ::.: ... ::.:
XP_011 PCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTI-----------GGIKGA
120 130 140 150 160
180 190 200 210 220 230
pF1KB5 RQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSR
.:::: .:...: :.::::::...: .::..: : .: :..: :.:. .:::::.:
XP_011 SVIFGEALWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNR
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB5 DPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVD
::. ::::.:::.: .: :... :: ::::.:...:.:. ::::: .:: ::.:
XP_011 DPEEPDGGELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILD
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB5 TGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYT
:::::..::..:.: :. :::..::. :::.: : .. :::... ::: ..:. .::.
XP_011 TGTSLITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYV
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB5 LKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDN----NRVGFAEAAR
..... : ::::::...:.:::.::.:::::::.: : .:::: . :::.:.:
XP_011 IQTTRNGVRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARART
350 360 370 380 390 400
pF1KB5 L
XP_011 RGADLGWGETAQAQFPG
410 420
>>NP_001073275 (OMIM: 169710) pepsin A-3 preproprotein [ (388 aa)
initn: 1072 init1: 300 opt: 758 Z-score: 952.3 bits: 185.1 E(85289): 2.6e-46
Smith-Waterman score: 1124; 44.9% identity (70.1% similar) in 408 aa overlap (9-410:5-388)
10 20 30 40 50
pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY--
: : :.: . ..:: . :.:::.:: : ..:.. : .:. ::
NP_001 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD
. .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. .
NP_001 QWKAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S
60 70 80 90 100
120 130 140 150 160 170
pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV
.:: :...: . :::: ... . .: ::.::..: :. :::.: ::..
NP_001 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD
110 120 130 140 150
180 190 200 210 220 230
pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS
:.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: :::
NP_001 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV
: : :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.:::
NP_001 ADD--QSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIV
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY
::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : :
NP_001 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
:. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .:
NP_001 ILQ--SEGS--CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA
340 350 360 370 380
>>NP_001073276 (OMIM: 169720) pepsin A-4 preproprotein [ (388 aa)
initn: 1072 init1: 300 opt: 758 Z-score: 952.3 bits: 185.1 E(85289): 2.6e-46
Smith-Waterman score: 1124; 44.9% identity (70.1% similar) in 408 aa overlap (9-410:5-388)
10 20 30 40 50
pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY--
: : :.: . ..:: . :.:::.:: : ..:.. : .:. ::
NP_001 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD
. .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. .
NP_001 QWEAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S
60 70 80 90 100
120 130 140 150 160 170
pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV
.:: :...: . :::: ... . .: ::.::..: :. :::.: ::..
NP_001 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD
110 120 130 140 150
180 190 200 210 220 230
pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS
:.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: :::
NP_001 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV
: : :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.:::
NP_001 ADD--QSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIV
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY
::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : :
NP_001 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
:. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .:
NP_001 ILQ--SEGS--CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA
340 350 360 370 380
>>XP_016854970 (OMIM: 169720) PREDICTED: pepsin A-4 isof (388 aa)
initn: 1072 init1: 300 opt: 758 Z-score: 952.3 bits: 185.1 E(85289): 2.6e-46
Smith-Waterman score: 1124; 44.9% identity (70.1% similar) in 408 aa overlap (9-410:5-388)
10 20 30 40 50
pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY--
: : :.: . ..:: . :.:::.:: : ..:.. : .:. ::
XP_016 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD
. .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. .
XP_016 QWEAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S
60 70 80 90 100
120 130 140 150 160 170
pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV
.:: :...: . :::: ... . .: ::.::..: :. :::.: ::..
XP_016 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD
110 120 130 140 150
180 190 200 210 220 230
pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS
:.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: :::
XP_016 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV
: : :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.:::
XP_016 ADD--QSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIV
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY
::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : :
XP_016 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
:. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .:
XP_016 ILQ--SEGS--CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA
340 350 360 370 380
>>NP_055039 (OMIM: 169730) pepsin A-5 preproprotein [Hom (388 aa)
initn: 1075 init1: 301 opt: 756 Z-score: 949.8 bits: 184.6 E(85289): 3.7e-46
Smith-Waterman score: 1122; 44.6% identity (70.1% similar) in 408 aa overlap (9-410:5-388)
10 20 30 40 50
pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY--
: : :.: . ..:: . :.:::.:: : ..:.. : .:. ::
NP_055 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD
. .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. .
NP_055 QWEAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S
60 70 80 90 100
120 130 140 150 160 170
pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV
.:: :...: . :::: ... . .: ::.::..: :. :::.: ::..
NP_055 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD
110 120 130 140 150
180 190 200 210 220 230
pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS
:.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: :::
NP_055 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV
: . :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.:::
NP_055 ADD--KSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGETIACAEGCQAIV
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY
::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : :
NP_055 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL
:. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .:
NP_055 ILQ--SEGS--CISGFQGMNVPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA
340 350 360 370 380
412 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 12:25:11 2016 done: Sat Nov 5 12:25:13 2016
Total Scan time: 8.600 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]