FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0243, 388 aa 1>>>pF1KE0243 388 - 388 aa - 388 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8107+/-0.00104; mu= 14.0614+/- 0.062 mean_var=69.0600+/-14.057, 0's: 0 Z-trim(103.9): 34 B-trim: 0 in 0/51 Lambda= 0.154334 statistics sampled from 7607 (7632) to 7607 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.609), E-opt: 0.2 (0.234), width: 16 Scan time: 2.740 The best scores are: opt bits E(32554) CCDS31575.1 PGA4 gene_id:643847|Hs108|chr11 ( 388) 2585 584.8 4.3e-167 CCDS31574.1 PGA3 gene_id:643834|Hs108|chr11 ( 388) 2580 583.7 9.3e-167 CCDS8001.1 PGA5 gene_id:5222|Hs108|chr11 ( 388) 2571 581.7 3.7e-166 CCDS73013.1 CTSE gene_id:1510|Hs108|chr1 ( 396) 1381 316.8 2.2e-86 CCDS4859.1 PGC gene_id:5225|Hs108|chr6 ( 388) 1311 301.2 1.1e-81 CCDS12794.1 NAPSA gene_id:9476|Hs108|chr19 ( 420) 986 228.8 6.9e-60 CCDS30981.1 REN gene_id:5972|Hs108|chr1 ( 406) 900 209.7 3.9e-54 CCDS73012.1 CTSE gene_id:1510|Hs108|chr1 ( 363) 898 209.2 4.8e-54 CCDS7725.1 CTSD gene_id:1509|Hs108|chr11 ( 412) 758 178.1 1.3e-44 CCDS55000.1 PGC gene_id:5225|Hs108|chr6 ( 315) 728 171.3 1e-42 >>CCDS31575.1 PGA4 gene_id:643847|Hs108|chr11 (388 aa) initn: 2585 init1: 2585 opt: 2585 Z-score: 3113.3 bits: 584.8 E(32554): 4.3e-167 Smith-Waterman score: 2585; 100.0% identity (100.0% similar) in 388 aa overlap (1-388:1-388) 10 20 30 40 50 60 pF1KE0 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQWEAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQWEAP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 TLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNRFNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNRFNP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 EDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 GILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQSGSVVIFGGIDSSYYTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQSGSVVIFGGIDSSYYTGS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 LNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQSDIGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQSDIGAS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 ENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNLPTESGEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNLPTESGEL 310 320 330 340 350 360 370 380 pF1KE0 WILGDVFIRQYFTVFDRANNQVGLAPVA :::::::::::::::::::::::::::: CCDS31 WILGDVFIRQYFTVFDRANNQVGLAPVA 370 380 >>CCDS31574.1 PGA3 gene_id:643834|Hs108|chr11 (388 aa) initn: 2580 init1: 2580 opt: 2580 Z-score: 3107.3 bits: 583.7 E(32554): 9.3e-167 Smith-Waterman score: 2580; 99.7% identity (100.0% similar) in 388 aa overlap (1-388:1-388) 10 20 30 40 50 60 pF1KE0 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQWEAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::.:: CCDS31 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQWKAP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 TLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNRFNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNRFNP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 EDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 GILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQSGSVVIFGGIDSSYYTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQSGSVVIFGGIDSSYYTGS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 LNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQSDIGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQSDIGAS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 ENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNLPTESGEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNLPTESGEL 310 320 330 340 350 360 370 380 pF1KE0 WILGDVFIRQYFTVFDRANNQVGLAPVA :::::::::::::::::::::::::::: CCDS31 WILGDVFIRQYFTVFDRANNQVGLAPVA 370 380 >>CCDS8001.1 PGA5 gene_id:5222|Hs108|chr11 (388 aa) initn: 2571 init1: 2571 opt: 2571 Z-score: 3096.5 bits: 581.7 E(32554): 3.7e-166 Smith-Waterman score: 2571; 99.2% identity (100.0% similar) in 388 aa overlap (1-388:1-388) 10 20 30 40 50 60 pF1KE0 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQWEAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQWEAP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 TLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNRFNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 TLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNRFNP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 EDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 EDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 GILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQSGSVVIFGGIDSSYYTGS :::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::: CCDS80 GILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDKSGSVVIFGGIDSSYYTGS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 LNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQSDIGAS ::::::::::::::::::::::::.::::::::::::::::::::::::::::::::::: CCDS80 LNWVPVTVEGYWQITVDSITMNGETIACAEGCQAIVDTGTSLLTGPTSPIANIQSDIGAS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 ENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNLPTESGEL ::::::::::::::::::::::::::::::::::::::::::::::::::::.::::::: CCDS80 ENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNVPTESGEL 310 320 330 340 350 360 370 380 pF1KE0 WILGDVFIRQYFTVFDRANNQVGLAPVA :::::::::::::::::::::::::::: CCDS80 WILGDVFIRQYFTVFDRANNQVGLAPVA 370 380 >>CCDS73013.1 CTSE gene_id:1510|Hs108|chr1 (396 aa) initn: 1426 init1: 657 opt: 1381 Z-score: 1664.4 bits: 316.8 E(32554): 2.2e-86 Smith-Waterman score: 1381; 53.3% identity (78.3% similar) in 396 aa overlap (1-386:1-393) 10 20 30 40 50 pF1KE0 MKWLLLLGLVAL----SECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQ :: :::: :: : .. ...::: :. ::.. : :. :..: :.:::. . : . CCDS73 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKLRARSQLSEFWKSHNLDMIQ--FTE 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 WEAPTLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHN . ..:: :::::::::::.::.: :.:::.:::::::::::::::.: :: .:. CCDS73 SCSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCTSPACKTHS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 RFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYY ::.: .::::.. ... :: :::::..::.: : :.: :.. ..: :: : ::::. . CCDS73 RFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSVEGLTVVGQQFGESVTEPGQTFVD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 APFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQ--SGSVVIFGGIDS : :::::::.:::.. .:.::::::. :.::. .::::.:.. . .:: .:::: : CCDS73 AEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGGAGSELIFGGYDH 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 SYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQ :...::::::::: ..::::..:.: ..: .. :.:::::::::::::.:::.. : ..: CCDS73 SHFSGSLNWVPVTKQAYWQIALDNIQVGGTVMFCSEGCQAIVDTGTSLITGPSDKIKQLQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 SDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQS--EGS--CISGFQG . :::. ::...: :. .. .::..:::::: : . :.:: : . .: : ::::: CCDS73 NAIGAAP-VDGEYAVECANLNVMPDVTFTINGVPYTLSPTAYTLLDFVDGMQFCSSGFQG 300 310 320 330 340 350 360 370 380 pF1KE0 MNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA ... .: :::::::::::...::::.::.::::: CCDS73 LDIHPPAGPLWILGDVFIRQFYSVFDRGNNRVGLAPAVP 360 370 380 390 >>CCDS4859.1 PGC gene_id:5225|Hs108|chr6 (388 aa) initn: 1255 init1: 581 opt: 1311 Z-score: 1580.3 bits: 301.2 E(32554): 1.1e-81 Smith-Waterman score: 1311; 50.5% identity (79.7% similar) in 394 aa overlap (1-388:1-388) 10 20 30 40 50 pF1KE0 MKWLLLLGLVALS--ECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKY-FPQW :::.... :: :. : . :::: . ::.:.:..:.::: .::. :. .:: :: : CCDS48 MKWMVVV-LVCLQLLEAAVVKVPLKKFKSIRETMKEKGLLGEFLRTHKYDPAWKYRF--- 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 EAPTLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNR . : .:. :.: ::: :.:::: :.: :.:::::::::::::::.: :::.:.: CCDS48 -GDLSVTYEPMA-YMDAAYFGEISIGTPPQNFLVLFDTGSSNLWVPSVYCQSQACTSHSR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 FNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYA ::: .::::.....: :. ::.::.::..::::. : .:. :: :::::.:::. . :: CCDS48 FNPSESSTYSTNGQTFSLQYGSGSLTGFFGYDTLTVQSIQVPNQEFGLSENEPGTNFVYA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 PFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADD-QSGSVVIFGGIDSSY ::::.:::::..: . :: ..... ..: ... .:::::: .. .::..:.:::.::: CCDS48 QFDGIMGLAYPALSVDEATTAMQGMVQEGALTSPVFSVYLSNQQGSSGGAVVFGGVDSSL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 YTGSLNWVPVTVEGYWQITVDSITMNGEAIA-CAEGCQAIVDTGTSLLTGPTSPIANIQS :::.. :.::: : :::: .. . ..:.: . :.::::::::::::::: : . .. . . CCDS48 YTGQIYWAPVTQELYWQIGIEEFLIGGQASGWCSEGCQAIVDTGTSLLTVPQQYMSALLQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 DIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNLPT ::.:. :...:.:..:..::...: ::::..:.:::.:::...: : : . : . CCDS48 ATGAQEDEYGQFLVNCNSIQNLPSLTFIINGVEFPLPPSSYILSNNGYCTVGVEPTYLSS 300 310 320 330 340 350 360 370 380 pF1KE0 ESGE-LWILGDVFIRQYFTVFDRANNQVGLAPVA ..:. ::::::::.:.:..:.: .::.::.: .: CCDS48 QNGQPLWILGDVFLRSYYSVYDLGNNRVGFATAA 360 370 380 >>CCDS12794.1 NAPSA gene_id:9476|Hs108|chr19 (420 aa) initn: 923 init1: 292 opt: 986 Z-score: 1188.6 bits: 228.8 E(32554): 6.9e-60 Smith-Waterman score: 991; 41.4% identity (66.9% similar) in 399 aa overlap (4-385:11-399) 10 20 30 40 50 pF1KE0 MKWLLLLGLVAL--SECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPAR :::: :. . : . ..:: : . :: :. ::. . . ::. CCDS12 MSPPPLLQPLLLLLPLLNVEPSGATLIRIPLHRVQPGRRILN---LLRGWRE-----PAE 10 20 30 40 50 60 70 80 90 100 pF1KE0 KYFPQWEAPTLVDEQ---PLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCS .:. ::. :. :: :: :..::: ::.::: :.:::.:::::::::::: : CCDS12 --LPKLGAPSPGDKPIFVPLSNYRDVQYFGEIGLGTPPQNFTVAFDTGSSNLWVPSRRCH 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE0 --SLACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLS :. : :.::.:. ::..:... .: :::: . :::. : . .:::. .. ::: . CCDS12 FFSVPCWLHHRFDPKASSSFQANGTKFAIQYGTGRVDGILSEDKLTIGGIKGASVIFGEA 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE0 ETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQ--SG ::. . .: :::::::..: .: :. : .: . .:::... .:: ::. : . .: CCDS12 LWEPSLVFAFAHFDGILGLGFPILSVEGVRPPMDVLVEQGLLDKPVFSFYLNRDPEEPDG 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE0 SVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLT . ...:: : ..: :..::::: .:::: .. . .. ::.:: ::.::::::.: CCDS12 GELVLGGSDPAHYIPPLTFVPVTVPAYWQIHMERVKVGPGLTLCAKGCAAILDTGTSLIT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE0 GPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGS- ::: : ... ::. :.... :: : .:: . : ..:: . . :..:. . CCDS12 GPTEEIRALHAAIGGIPLLAGEYIILCSEIPKLPAVSFLLGGVWFNLTAHDYVIQTTRNG 300 310 320 330 340 350 350 360 370 380 pF1KE0 ---CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQ----VGLAPVA :.::::....: .: .:::::::. : .::::.. . :::: CCDS12 VRLCLSGFQALDVPPPAGPFWILGDVFLGTYVAVFDRGDMKSSARVGLARARTRGADLGW 360 370 380 390 400 410 CCDS12 GETAQAQFPG 420 >>CCDS30981.1 REN gene_id:5972|Hs108|chr1 (406 aa) initn: 801 init1: 213 opt: 900 Z-score: 1085.4 bits: 209.7 E(32554): 3.9e-54 Smith-Waterman score: 900; 36.4% identity (66.1% similar) in 401 aa overlap (2-385:9-403) 10 20 30 40 50 pF1KE0 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKY .: ::: : . : . .: : :.. ... ::..... :: CCDS30 MDGWRRMPRWGLLLLL--WGSCT-FGLPTDTTTFKRIFLKRMPSIRESLKERGVDMAR-L 10 20 30 40 50 60 70 80 90 100 pF1KE0 FPQWEAP----TLVDEQP---LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVY :.: : :: . : ::.: .:.: :::::: : : :::::::::.:::: CCDS30 GPEWSQPMKRLTLGNTTSSVILTNYMDTQYYGEIGIGTPPQTFKVVFDTGSSNVWVPSSK 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE0 CSSL--ACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFG :: : ::. :. :. :::.:. .. ... :.::...:.:. : . ::::. : :.:: CCDS30 CSRLYTACVYHKLFDASDSSSYKHNGTELTLRYSTGTVSGFLSQDIITVGGITVT-QMFG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE0 LSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQS- :. .. : :::..:... . . .::.:::: .::....:.:: : . :... CCDS30 EVTEMPALPFMLAEFDGVVGMGFIEQAIGRVTPIFDNIISQGVLKEDVFSFYYNRDSENS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE0 ---GSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGT :. ...:: : ..: :..... . : ::: . ...... .. : .:: :.::::. CCDS30 QSLGGQIVLGGSDPQHYEGNFHYINLIKTGVWQIQMKGVSVGSSTLLCEDGCLALVDTGA 240 250 260 270 280 290 290 300 310 320 330 pF1KE0 SLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQ- : ..: :: : ... .::.. :.::.:. .:::: : ..: .: . . :..: CCDS30 SYISGSTSSIEKLMEALGAKKRL-FDYVVKCNEGPTLPDISFHLGGKEYTLTSADYVFQE 300 310 320 330 340 350 340 350 360 370 380 pF1KE0 ---SEGSCISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA :. : ....:..: .: : :: .:::...: ::: ::..:.: CCDS30 SYSSKKLCTLAIHAMDIPPPTGPTWALGATFIRKFYTEFDRRNNRIGFALAR 360 370 380 390 400 >>CCDS73012.1 CTSE gene_id:1510|Hs108|chr1 (363 aa) initn: 934 init1: 657 opt: 898 Z-score: 1083.8 bits: 209.2 E(32554): 4.8e-54 Smith-Waterman score: 898; 52.8% identity (77.7% similar) in 265 aa overlap (1-259:1-263) 10 20 30 40 50 pF1KE0 MKWLLLLGLVAL----SECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQ :: :::: :: : .. ...::: :. ::.. : :. :..: :.:::. . : . CCDS73 MKTLLLLLLVLLELGEAQGSLHRVPLRRHPSLKKKLRARSQLSEFWKSHNLDMIQ--FTE 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 WEAPTLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHN . ..:: :::::::::::.::.: :.:::.:::::::::::::::.: :: .:. CCDS73 SCSMDQSAKEPLINYLDMEYFGTISIGSPPQNFTVIFDTGSSNLWVPSVYCTSPACKTHS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 RFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYY ::.: .::::.. ... :: :::::..::.: : :.: :.. ..: :: : ::::. . CCDS73 RFQPSQSSTYSQPGQSFSIQYGTGSLSGIIGADQVSVEGLTVVGQQFGESVTEPGQTFVD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 APFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQ--SGSVVIFGGIDS : :::::::.:::.. .:.::::::. :.::. .::::.:.. . .:: .:::: : CCDS73 AEFDGILGLGYPSLAVGGVTPVFDNMMAQNLVDLPMFSVYMSSNPEGGAGSELIFGGYDH 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 SYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQ :...::::::::: ..::::..:.. CCDS73 SHFSGSLNWVPVTKQAYWQIALDNMLWSVPTLTSCRMSPSPLTESPIPSAQLPTPYWTSW 240 250 260 270 280 290 >>CCDS7725.1 CTSD gene_id:1509|Hs108|chr11 (412 aa) initn: 1072 init1: 300 opt: 758 Z-score: 914.4 bits: 178.1 E(32554): 1.3e-44 Smith-Waterman score: 1124; 45.1% identity (69.6% similar) in 408 aa overlap (5-388:9-410) 10 20 30 40 50 pF1KE0 MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERG-LLKDFLKKHNLNPARKYFP : : :.: . ..:: . :.:::.:: : ..:.. : .:. :: CCDS77 MQPSSLLPLALCLLAAPASALVRIPLHKFTSIRRTMSEVGGSVEDLIAK---GPVSKYS- 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 QWEAPTLVDEQP----LENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSL- .: : : : :.::.: .:.: :::::: : ::::::::::::::::..:. : CCDS77 --QAVPAVTEGPIPEVLKNYMDAQYYGEIGIGTPPQCFTVVFDTGSSNLWVPSIHCKLLD 60 70 80 90 100 110 120 130 140 150 pF1KE0 -ACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQV-----------GGISD :: :...: . :::: ... . .: ::.::..: :. :::.: ::.. CCDS77 IACWIHHKYNSDKSSTYVKNGTSFDIHYGSGSLSGYLSQDTVSVPCQSASSASALGGVKV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 TNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLS :.:: . .:: . : ::::::.::: :: ... :::::. .: ::.:..:: ::: CCDS77 ERQVFGEATKQPGITFIAAKFDGILGMAYPRISVNNVLPVFDNLMQQKLVDQNIFSFYLS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE0 ADD--QSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIV : : :. ...:: ::.:: :::... :: ..:::. .:.. . . : :::.::: CCDS77 RDPDAQPGGELMLGGTDSKYYKGSLSYLNVTRKAYWQVHLDQVEVASGLTLCKEGCEAIV 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE0 DTGTSLLTGPTSPIANIQSDIGASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAY ::::::..::.. . ..:. ::: .:.... : .:.:: :.. ..: : . : : CCDS77 DTGTSLMVGPVDEVRELQKAIGAVPLIQGEYMIPCEKVSTLPAITLKLGGKGYKLSPEDY 300 310 320 330 340 350 340 350 360 370 380 pF1KE0 ILQ-SEGS---CISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA :. :... :.:::.::..: :: ::::::::: .:.::::: ::.::.: .: CCDS77 TLKVSQAGKTLCLSGFMGMDIPPPSGPLWILGDVFIGRYYTVFDRDNNRVGFAEAARL 360 370 380 390 400 410 >>CCDS55000.1 PGC gene_id:5225|Hs108|chr6 (315 aa) initn: 737 init1: 596 opt: 728 Z-score: 880.2 bits: 171.3 E(32554): 1e-42 Smith-Waterman score: 728; 52.0% identity (78.3% similar) in 221 aa overlap (1-218:1-215) 10 20 30 40 50 pF1KE0 MKWLLLLGLVALS--ECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKY-FPQW :::.... :: :. : . :::: . ::.:.:..:.::: .::. :. .:: :: : CCDS55 MKWMVVV-LVCLQLLEAAVVKVPLKKFKSIRETMKEKGLLGEFLRTHKYDPAWKYRF--- 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 EAPTLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNR . : .:. :.: ::: :.:::: :.: :.:::::::::::::::.: :::.:.: CCDS55 -GDLSVTYEPMA-YMDAAYFGEISIGTPPQNFLVLFDTGSSNLWVPSVYCQSQACTSHSR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 FNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYA ::: .::::.....: :. ::.::.::..::::. : .:. :: :::::.:::. . :: CCDS55 FNPSESSTYSTNGQTFSLQYGSGSLTGFFGYDTLTVQSIQVPNQEFGLSENEPGTNFVYA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 PFDGILGLAYPSISSSGATPVFDNIWNQGLVSQDLFSVYLSADDQSGSVVIFGGIDSSYY ::::.:::::..: . :: ..... ..: ... .:::::: CCDS55 QFDGIMGLAYPALSVDEATTAMQGMVQEGALTSPVFSVYLSNLVLESSGLGPLLTPSRAA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 TGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQSDI CCDS55 PPSSTLQLPEKPLEQTWNILTPFTKTLPVSNLSRKVTSWAGVGIPVTCLPEAGSGGERRA 240 250 260 270 280 290 388 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 19:36:34 2016 done: Thu Nov 3 19:36:34 2016 Total Scan time: 2.740 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]