FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5292, 412 aa 1>>>pF1KB5292 412 - 412 aa - 412 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9845+/-0.000355; mu= 18.7140+/- 0.022 mean_var=63.2445+/-12.533, 0's: 0 Z-trim(114.0): 27 B-trim: 0 in 0/51 Lambda= 0.161273 statistics sampled from 23517 (23544) to 23517 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.276), width: 16 Scan time: 8.600 The best scores are: opt bits E(85289) NP_001900 (OMIM: 116840,610127) cathepsin D prepro ( 412) 2751 648.8 7.1e-186 XP_011507546 (OMIM: 116890) PREDICTED: cathepsin E ( 401) 1220 292.6 1.2e-78 NP_001901 (OMIM: 116890) cathepsin E isoform a pre ( 396) 903 218.8 1.9e-56 XP_016883001 (OMIM: 605631) PREDICTED: napsin-A is ( 411) 901 218.4 2.7e-56 NP_004842 (OMIM: 605631) napsin-A preproprotein [H ( 420) 901 218.4 2.7e-56 XP_011525842 (OMIM: 605631) PREDICTED: napsin-A is ( 420) 901 218.4 2.7e-56 NP_001073275 (OMIM: 169710) pepsin A-3 preproprote ( 388) 758 185.1 2.6e-46 NP_001073276 (OMIM: 169720) pepsin A-4 preproprote ( 388) 758 185.1 2.6e-46 XP_016854970 (OMIM: 169720) PREDICTED: pepsin A-4 ( 388) 758 185.1 2.6e-46 NP_055039 (OMIM: 169730) pepsin A-5 preproprotein ( 388) 756 184.6 3.7e-46 XP_011507547 (OMIM: 116890) PREDICTED: cathepsin E ( 368) 713 174.6 3.6e-43 NP_002621 (OMIM: 169740) gastricsin isoform 1 prep ( 388) 606 149.7 1.2e-35 NP_001159896 (OMIM: 169740) gastricsin isoform 2 p ( 315) 439 110.8 4.9e-24 NP_000528 (OMIM: 179820,267430,613092) renin prepr ( 406) 429 108.5 3e-23 NP_001304260 (OMIM: 116890) cathepsin E isoform c ( 288) 396 100.8 4.7e-21 NP_683865 (OMIM: 116890) cathepsin E isoform b pre ( 363) 396 100.8 5.7e-21 XP_016883803 (OMIM: 605668) PREDICTED: beta-secret ( 423) 274 72.5 2.2e-12 NP_036236 (OMIM: 604252) beta-secretase 1 isoform ( 501) 267 70.9 8e-12 NP_001193977 (OMIM: 604252) beta-secretase 1 isofo ( 401) 204 56.2 1.7e-07 NP_620476 (OMIM: 605668) beta-secretase 2 isoform ( 468) 186 52.0 3.6e-06 NP_620477 (OMIM: 605668) beta-secretase 2 isoform ( 396) 185 51.8 3.7e-06 NP_036237 (OMIM: 605668) beta-secretase 2 isoform ( 518) 185 51.8 4.5e-06 NP_620428 (OMIM: 604252) beta-secretase 1 isoform ( 476) 178 50.2 1.3e-05 >>NP_001900 (OMIM: 116840,610127) cathepsin D preproprot (412 aa) initn: 2751 init1: 2751 opt: 2751 Z-score: 3458.0 bits: 648.8 E(85289): 7.1e-186 Smith-Waterman score: 2751; 100.0% identity (100.0% similar) in 412 aa overlap (1-412:1-412) 10 20 30 40 50 60 pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL :::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL 370 380 390 400 410 >>XP_011507546 (OMIM: 116890) PREDICTED: cathepsin E iso (401 aa) initn: 1227 init1: 565 opt: 1220 Z-score: 1533.0 bits: 292.6 E(85289): 1.2e-78 Smith-Waterman score: 1242; 45.0% identity (74.3% similar) in 409 aa overlap (1-409:1-399) 10 20 30 40 50 60 pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP :. :: :.: :. ..: :.::.. :... . .. ... .. . .. . . XP_011 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKL-RARSQLSEFWKSHNLDMIQFTES 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH . : : ::.: .:.: :.::.::: :::.::::::::::::..: . :: : XP_011 CSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCT--SPACKTH 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG ... ..:::: . : ::.:.::.::::: .. : ::. .. . ...: : :: XP_011 SRFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSAFSYQVEGLTVVG------QQFG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB5 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ :.. .:: ::. :.::::::..:: ..:..: :::::.: :.::: .:: :.: .:.. XP_011 ESVTEPGQTFVDAEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB5 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL :.::..:: : ....:::... ::..::::. ::...:.. . .:.:::.::::::::: XP_011 AGSELIFGGYDHSHFSGSLNWVPVTKQAYWQIALDNIQVGGTVMFCSEGCQAIVDTGTSL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB5 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ ..:: :....::.::::.: ..::: . : .....: .:. ..: : ::: ::: XP_011 ITGPSDKIKQLQNAIGAAP-VDGEYAVECANLNVMPDVTFTINGVPYTLSPTAYTLLDFV 300 310 320 330 340 350 370 380 390 400 410 pF1KB5 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL : .: :::.:.:: ::.::::::::::: ..:.:::: :::::.: : XP_011 DGMQFCSSGFQGLDIHPPAGPLWILGDVFIRQFYSVFDRGNNRVGLAPAVP 360 370 380 390 400 >>NP_001901 (OMIM: 116890) cathepsin E isoform a preprop (396 aa) initn: 1230 init1: 565 opt: 903 Z-score: 1134.5 bits: 218.8 E(85289): 1.9e-56 Smith-Waterman score: 1241; 45.5% identity (73.3% similar) in 409 aa overlap (1-409:1-394) 10 20 30 40 50 60 pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKYSQAVP :. :: :.: :. ..: :.::.. :... . .. ... .. . .. . . NP_001 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKL-RARSQLSEFWKSHNLDMIQFTES 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 AVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDIACWIH . : : ::.: .:.: :.::.::: :::.::::::::::::..: . :: : NP_001 CSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCT--SPACKTH 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 HKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVERQVFG ... ..:::: . : ::.:.::.::::: .. : ::: :. : : :: NP_001 SRFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSVE-----------GLTVVGQQFG 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 EATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSRDPDAQ :.. .:: ::. :.::::::..:: ..:..: :::::.: :.::: .:: :.: .:.. NP_001 ESVTEPGQTFVDAEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB5 PGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVDTGTSL :.::..:: : ....:::... ::..::::. ::...:.. . .:.:::.::::::::: NP_001 AGSELIFGGYDHSHFSGSLNWVPVTKQAYWQIALDNIQVGGTVMFCSEGCQAIVDTGTSL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB5 MVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYTLKVSQ ..:: :....::.::::.: ..::: . : .....: .:. ..: : ::: ::: NP_001 ITGPSDKIKQLQNAIGAAP-VDGEYAVECANLNVMPDVTFTINGVPYTLSPTAYTLLDFV 290 300 310 320 330 340 370 380 390 400 410 pF1KB5 AGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL : .: :::.:.:: ::.::::::::::: ..:.:::: :::::.: : NP_001 DGMQFCSSGFQGLDIHPPAGPLWILGDVFIRQFYSVFDRGNNRVGLAPAVP 350 360 370 380 390 >>XP_016883001 (OMIM: 605631) PREDICTED: napsin-A isofor (411 aa) initn: 1264 init1: 888 opt: 901 Z-score: 1131.7 bits: 218.4 E(85289): 2.7e-56 Smith-Waterman score: 1253; 46.2% identity (72.2% similar) in 418 aa overlap (1-409:1-392) 10 20 30 40 50 pF1KB5 MQPSSLL-PLALCLL---AAPASA-LVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKY :.: :: :: : : . :..: :.:::::. :: .. . : : :. XP_016 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILNLLRGWRE------PAELP 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SQAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDI . ..:. . :: :.:: :.::.::::.::::: :::.:::::::::::: .:..... XP_016 KLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 ACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVE : .::.. :::.: :.::.: ..: ::.: ... ::.: XP_016 PC---------SSSSFQANGTKFAIQYGTGRVDGILSEDKLTI-----------GGIKGA 120 130 140 150 180 190 200 210 220 230 pF1KB5 RQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSR .:::: .:...: :.::::::...: .::..: : .: :..: :.:. .:::::.: XP_016 SVIFGEALWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNR 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB5 DPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVD ::. ::::.:::.: .: :... :: ::::.:...:.:. ::::: .:: ::.: XP_016 DPEEPDGGELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILD 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 TGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYT :::::..::..:.: :. :::..::. :::.: : .. :::... ::: ..:. .::. XP_016 TGTSLITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYV 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 LKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDN----NRVGFAEAAR ..... : ::::::...:.:::.::.:::::::.: : .:::: . :::.:.: XP_016 IQTTRNGVRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARART 340 350 360 370 380 390 pF1KB5 L XP_016 RGADLGWGETAQAQFPG 400 410 >>NP_004842 (OMIM: 605631) napsin-A preproprotein [Homo (420 aa) initn: 1321 init1: 888 opt: 901 Z-score: 1131.6 bits: 218.4 E(85289): 2.7e-56 Smith-Waterman score: 1324; 46.9% identity (73.7% similar) in 418 aa overlap (1-409:1-401) 10 20 30 40 50 pF1KB5 MQPSSLL-PLALCLL---AAPASA-LVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKY :.: :: :: : : . :..: :.:::::. :: .. . : : :. NP_004 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILNLLRGWRE------PAELP 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SQAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDI . ..:. . :: :.:: :.::.::::.::::: :::.:::::::::::: .:..... NP_004 KLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 ACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVE ::.::... ::.. :::.: :.::.: ..: ::.: ... ::.: NP_004 PCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTI-----------GGIKGA 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 RQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSR .:::: .:...: :.::::::...: .::..: : .: :..: :.:. .:::::.: NP_004 SVIFGEALWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 DPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVD ::. ::::.:::.: .: :... :: ::::.:...:.:. ::::: .:: ::.: NP_004 DPEEPDGGELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILD 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 TGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYT :::::..::..:.: :. :::..::. :::.: : .. :::... ::: ..:. .::. NP_004 TGTSLITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYV 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB5 LKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDN----NRVGFAEAAR ..... : ::::::...:.:::.::.:::::::.: : .:::: . :::.:.: NP_004 IQTTRNGVRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARART 350 360 370 380 390 400 pF1KB5 L NP_004 RGADLGWGETAQAQFPG 410 420 >>XP_011525842 (OMIM: 605631) PREDICTED: napsin-A isofor (420 aa) initn: 1321 init1: 888 opt: 901 Z-score: 1131.6 bits: 218.4 E(85289): 2.7e-56 Smith-Waterman score: 1324; 46.9% identity (73.7% similar) in 418 aa overlap (1-409:1-401) 10 20 30 40 50 pF1KB5 MQPSSLL-PLALCLL---AAPASA-LVRIPLHKFTSIRRTMSEVGGSVEDLIAKGPVSKY :.: :: :: : : . :..: :.:::::. :: .. . : : :. XP_011 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILNLLRGWRE------PAELP 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SQAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLDI . ..:. . :: :.:: :.::.::::.::::: :::.:::::::::::: .:..... XP_011 KLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCHFFSV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 ACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKVE ::.::... ::.. :::.: :.::.: ..: ::.: ... ::.: XP_011 PCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTI-----------GGIKGA 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 RQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLSR .:::: .:...: :.::::::...: .::..: : .: :..: :.:. .:::::.: XP_011 SVIFGEALWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 DPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIVD ::. ::::.:::.: .: :... :: ::::.:...:.:. ::::: .:: ::.: XP_011 DPEEPDGGELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILD 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 TGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDYT :::::..::..:.: :. :::..::. :::.: : .. :::... ::: ..:. .::. XP_011 TGTSLITGPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYV 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB5 LKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDN----NRVGFAEAAR ..... : ::::::...:.:::.::.:::::::.: : .:::: . :::.:.: XP_011 IQTTRNGVRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARART 350 360 370 380 390 400 pF1KB5 L XP_011 RGADLGWGETAQAQFPG 410 420 >>NP_001073275 (OMIM: 169710) pepsin A-3 preproprotein [ (388 aa) initn: 1072 init1: 300 opt: 758 Z-score: 952.3 bits: 185.1 E(85289): 2.6e-46 Smith-Waterman score: 1124; 44.9% identity (70.1% similar) in 408 aa overlap (9-410:5-388) 10 20 30 40 50 pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY-- : : :.: . ..:: . :.:::.:: : ..:.. : .:. :: NP_001 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD . .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. . NP_001 QWKAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV .:: :...: . :::: ... . .: ::.::..: :. :::.: ::.. NP_001 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD 110 120 130 140 150 180 190 200 210 220 230 pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS :.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: ::: NP_001 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV : : :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.::: NP_001 ADD--QSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIV 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY ::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : : NP_001 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL :. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .: NP_001 ILQ--SEGS--CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA 340 350 360 370 380 >>NP_001073276 (OMIM: 169720) pepsin A-4 preproprotein [ (388 aa) initn: 1072 init1: 300 opt: 758 Z-score: 952.3 bits: 185.1 E(85289): 2.6e-46 Smith-Waterman score: 1124; 44.9% identity (70.1% similar) in 408 aa overlap (9-410:5-388) 10 20 30 40 50 pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY-- : : :.: . ..:: . :.:::.:: : ..:.. : .:. :: NP_001 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD . .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. . NP_001 QWEAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV .:: :...: . :::: ... . .: ::.::..: :. :::.: ::.. NP_001 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD 110 120 130 140 150 180 190 200 210 220 230 pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS :.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: ::: NP_001 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV : : :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.::: NP_001 ADD--QSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIV 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY ::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : : NP_001 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL :. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .: NP_001 ILQ--SEGS--CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA 340 350 360 370 380 >>XP_016854970 (OMIM: 169720) PREDICTED: pepsin A-4 isof (388 aa) initn: 1072 init1: 300 opt: 758 Z-score: 952.3 bits: 185.1 E(85289): 2.6e-46 Smith-Waterman score: 1124; 44.9% identity (70.1% similar) in 408 aa overlap (9-410:5-388) 10 20 30 40 50 pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY-- : : :.: . ..:: . :.:::.:: : ..:.. : .:. :: XP_016 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD . .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. . XP_016 QWEAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV .:: :...: . :::: ... . .: ::.::..: :. :::.: ::.. XP_016 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD 110 120 130 140 150 180 190 200 210 220 230 pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS :.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: ::: XP_016 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV : : :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.::: XP_016 ADD--QSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIV 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY ::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : : XP_016 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL :. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .: XP_016 ILQ--SEGS--CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA 340 350 360 370 380 >>NP_055039 (OMIM: 169730) pepsin A-5 preproprotein [Hom (388 aa) initn: 1075 init1: 301 opt: 756 Z-score: 949.8 bits: 184.6 E(85289): 3.7e-46 Smith-Waterman score: 1122; 44.6% identity (70.1% similar) in 408 aa overlap (9-410:5-388) 10 20 30 40 50 pF1KB5 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKY-- : : :.: . ..:: . :.:::.:: : ..:.. : .:. :: NP_055 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SQAVPA-VTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD . .:. : : : :.::.: .:.: :::::: : ::::::::::::::::..:. . NP_055 QWEAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS--S 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV .:: :...: . :::: ... . .: ::.::..: :. :::.: ::.. NP_055 LACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD 110 120 130 140 150 180 190 200 210 220 230 pF1KB5 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS :.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: ::: NP_055 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB5 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV : . :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.::: NP_055 ADD--KSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGETIACAEGCQAIV 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY ::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : : NP_055 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL :. . :. :.:::.::..: :: ::::::::: .:.::::: ::.::.: .: NP_055 ILQ--SEGS--CISGFQGMNVPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA 340 350 360 370 380 412 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 12:25:11 2016 done: Sat Nov 5 12:25:13 2016 Total Scan time: 8.600 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]