FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2032, 622 aa
1>>>pF1KE2032 622 - 622 aa - 622 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5669+/-0.000924; mu= 18.1032+/- 0.056
mean_var=80.4669+/-16.494, 0's: 0 Z-trim(107.0): 177 B-trim: 390 in 1/50
Lambda= 0.142977
statistics sampled from 9113 (9309) to 9113 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.653), E-opt: 0.2 (0.286), width: 16
Scan time: 3.550
The best scores are: opt bits E(32554)
CCDS31476.1 F2 gene_id:2147|Hs108|chr11 ( 622) 4354 908.2 0
CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040) 524 118.5 8.7e-26
CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 ( 317) 499 112.8 7e-25
CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 ( 290) 478 108.5 1.3e-23
CCDS31735.1 C1S gene_id:716|Hs108|chr12 ( 688) 456 104.2 6.1e-22
CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 ( 314) 435 99.6 6.6e-21
CCDS74857.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 824) 434 99.7 1.6e-20
CCDS33908.1 MASP1 gene_id:5648|Hs108|chr3 ( 728) 431 99.0 2.3e-20
CCDS123.1 MASP2 gene_id:10747|Hs108|chr1 ( 686) 427 98.2 3.9e-20
CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 416 95.7 1.1e-19
CCDS73602.1 F7 gene_id:2155|Hs108|chr13 ( 382) 395 91.4 2.3e-18
CCDS33907.1 MASP1 gene_id:5648|Hs108|chr3 ( 699) 397 92.0 2.9e-18
CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 394 91.2 2.9e-18
CCDS58452.1 PRSS36 gene_id:146547|Hs108|chr16 ( 752) 396 91.8 3.5e-18
CCDS58453.1 PRSS36 gene_id:146547|Hs108|chr16 ( 850) 396 91.9 3.8e-18
CCDS32436.1 PRSS36 gene_id:146547|Hs108|chr16 ( 855) 396 91.9 3.9e-18
CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 385 89.5 1.3e-17
CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 380 88.2 1.5e-17
CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 378 88.1 5.1e-17
CCDS54297.1 KLK11 gene_id:11012|Hs108|chr19 ( 275) 348 81.6 1.5e-15
CCDS33757.2 MST1 gene_id:4485|Hs108|chr3 ( 725) 348 81.9 3.2e-15
CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 340 80.0 4.5e-15
CCDS83291.1 PLAT gene_id:5327|Hs108|chr8 ( 473) 341 80.3 6.3e-15
CCDS6127.1 PLAT gene_id:5327|Hs108|chr8 ( 516) 341 80.4 6.7e-15
CCDS6126.1 PLAT gene_id:5327|Hs108|chr8 ( 562) 341 80.4 7.2e-15
CCDS60760.1 PAMR1 gene_id:25891|Hs108|chr11 ( 609) 336 79.4 1.6e-14
CCDS60759.1 PAMR1 gene_id:25891|Hs108|chr11 ( 680) 336 79.4 1.7e-14
CCDS31460.1 PAMR1 gene_id:25891|Hs108|chr11 ( 720) 336 79.4 1.8e-14
CCDS7898.1 PAMR1 gene_id:25891|Hs108|chr11 ( 737) 336 79.4 1.8e-14
CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 334 79.1 2.6e-14
CCDS47629.1 HGF gene_id:3082|Hs108|chr7 ( 210) 325 76.8 3.2e-14
CCDS46816.1 PRSS42 gene_id:339906|Hs108|chr3 ( 293) 326 77.1 3.7e-14
CCDS47627.1 HGF gene_id:3082|Hs108|chr7 ( 290) 324 76.7 4.8e-14
CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 321 76.1 7.2e-14
CCDS5597.1 HGF gene_id:3082|Hs108|chr7 ( 728) 324 77.0 1e-13
CCDS2745.1 PRSS50 gene_id:29122|Hs108|chr3 ( 385) 319 75.7 1.2e-13
CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 314 74.9 4.5e-13
CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 314 74.9 4.6e-13
CCDS47628.1 HGF gene_id:3082|Hs108|chr7 ( 285) 308 73.4 4.7e-13
CCDS81658.1 C1R gene_id:715|Hs108|chr12 ( 705) 307 73.4 1.1e-12
CCDS47626.1 HGF gene_id:3082|Hs108|chr7 ( 723) 307 73.4 1.1e-12
CCDS3369.1 HGFAC gene_id:3083|Hs108|chr4 ( 655) 296 71.2 5.1e-12
CCDS75098.1 HGFAC gene_id:3083|Hs108|chr4 ( 662) 296 71.2 5.1e-12
CCDS81783.1 F10 gene_id:2159|Hs108|chr13 ( 332) 292 70.1 5.2e-12
CCDS9530.1 F10 gene_id:2159|Hs108|chr13 ( 488) 292 70.2 7.1e-12
CCDS82010.1 HP gene_id:3240|Hs108|chr16 ( 347) 286 68.9 1.3e-11
CCDS45525.1 HP gene_id:3240|Hs108|chr16 ( 347) 286 68.9 1.3e-11
CCDS45524.1 HP gene_id:3240|Hs108|chr16 ( 406) 286 68.9 1.4e-11
CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 285 68.9 2.4e-11
CCDS5976.1 PRSS55 gene_id:203074|Hs108|chr8 ( 352) 281 67.9 2.6e-11
>>CCDS31476.1 F2 gene_id:2147|Hs108|chr11 (622 aa)
initn: 4354 init1: 4354 opt: 4354 Z-score: 4853.4 bits: 908.2 E(32554): 0
Smith-Waterman score: 4354; 100.0% identity (100.0% similar) in 622 aa overlap (1-622:1-622)
10 20 30 40 50 60
pF1KE2 MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRRANTFLEEVRKGNLEREC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRRANTFLEEVRKGNLEREC
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 VEETCSYEEAFEALESSTATDVFWAKYTACETARTPRDKLAACLEGNCAEGLGTNYRGHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VEETCSYEEAFEALESSTATDVFWAKYTACETARTPRDKLAACLEGNCAEGLGTNYRGHV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 NITRSGIECQLWRSRYPHKPEINSTTHPGADLQENFCRNPDSSTTGPWCYTTDPTVRRQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NITRSGIECQLWRSRYPHKPEINSTTHPGADLQENFCRNPDSSTTGPWCYTTDPTVRRQE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 CSIPVCGQDQVTVAMTPRSEGSSVNLSPPLEQCVPDRGQQYQGRLAVTTHGLPCLAWASA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 CSIPVCGQDQVTVAMTPRSEGSSVNLSPPLEQCVPDRGQQYQGRLAVTTHGLPCLAWASA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 QAKALSKHQDFNSAVQLVENFCRNPDGDEEGVWCYVAGKPGDFGYCDLNYCEEAVEEETG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QAKALSKHQDFNSAVQLVENFCRNPDGDEEGVWCYVAGKPGDFGYCDLNYCEEAVEEETG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 DGLDEDSDRAIEGRTATSEYQTFFNPRTFGSGEADCGLRPLFEKKSLEDKTERELLESYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DGLDEDSDRAIEGRTATSEYQTFFNPRTFGSGEADCGLRPLFEKKSLEDKTERELLESYI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 DGRIVEGSDAEIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DGRIVEGSDAEIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTEN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 DLLVRIGKHSRTRYERNIEKISMLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DLLVRIGKHSRTRYERNIEKISMLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 VCLPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQPSVLQVVNLPIVERPVCKDST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VCLPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQPSVLQVVNLPIVERPVCKDST
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 RIRITDNMFCAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RIRITDNMFCAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKY
550 560 570 580 590 600
610 620
pF1KE2 GFYTHVFRLKKWIQKVIDQFGE
::::::::::::::::::::::
CCDS31 GFYTHVFRLKKWIQKVIDQFGE
610 620
>>CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040 aa)
initn: 997 init1: 225 opt: 524 Z-score: 576.4 bits: 118.5 E(32554): 8.7e-26
Smith-Waterman score: 865; 32.0% identity (54.2% similar) in 566 aa overlap (60-617:1574-2037)
30 40 50 60 70 80
pF1KE2 APQQARSLLQRVRRANTFLEEVRKGNLERECVEETCSYEEAFEALESSTATDV--FWAKY
: :: :. .::. :.. : . :.
CCDS43 AGLTENYCRNPDSGKQPWCYTTDPCVRWEYCNLTQCSETES-GVLETPTVVPVPSMEAHS
1550 1560 1570 1580 1590 1600
90 100 110 120 130 140
pF1KE2 TACETARTPRDKLAACLEGNCAEGLGTNYRGHVNITRSGIECQLWRSRYPHKPEINSTTH
: : .:: . : .:: : .::: . : .: :: : : ::. . . ..
CCDS43 EAAPTEQTPVVR--QCYHGN-----GQSYRGTFSTTVTGRTCQSWSSMTPHRHQRTPENY
1610 1620 1630 1640 1650
150 160 170 180 190 200
pF1KE2 PGADLQENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQDQVTVAMTPRSEGSSVNLS
:. : :.:::::..: ::::.: ::..: . :.. :.. . :: ..: . . .:.
CCDS43 PNDGLTMNYCRNPDADT-GPWCFTMDPSIRWEYCNLTRCSDTEGTV-VAPPTVIQVPSLG
1660 1670 1680 1690 1700 1710
210 220 230 240 250 260
pF1KE2 PPLEQ-CVPDRGQQYQGRLAVTTHGLPCLAWASAQAKALSKHQDF----NSAVQLVENFC
:: :: :. :. :.:. :.:. : :: :: :. .:. : :. . : .:.:
CCDS43 PPSEQDCMFGNGKGYRGKKATTVTGTPCQEWA---AQEPHRHSTFIPGTNKWAGLEKNYC
1720 1730 1740 1750 1760 1770
270 280 290 300 310 320
pF1KE2 RNPDGDEEGVWCYVAGKPGDFGYCDLNYCEEAVEEETGDGLDEDSDRAIEGRTATSEYQT
:::::: .: :::. . : :::. : :.: .
CCDS43 RNPDGDINGPWCYTMNPRKLFDYCDIPLC------------------------ASSSF--
1780 1790 1800
330 340 350 360 370 380
pF1KE2 FFNPRTFGSGEADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLF
::: .: : :. : :: : :. :::: :
CCDS43 ------------DCG-KPQVEPKKCP-------------GSIVGGCVAHPHSWPWQVSL-
1810 1820 1830
390 400 410 420 430 440
pF1KE2 RKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKIS
: . .::..::: .::::::::: :. .. : .: :... : ....:
CCDS43 RTRFGKHFCGGTLISPEWVLTAAHCL-----KKSSRPSSYKVILGAHQEVNLESHVQEIE
1840 1850 1860 1870 1880 1890
450 460 470 480 490 500
pF1KE2 MLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVT
. .....: . ::::.::..:....: . :.:::. . .. : . .:
CCDS43 V-SRLFLEPT-------QADIALLKLSRPAVITDKVMPACLPSPDY---MVTARTECYIT
1900 1910 1920 1930 1940
510 520 530 540 550 560
pF1KE2 GWGNLKETWTANVGKGQPSVLQVVNLPIVERPVCKDSTRIRITDNMFCAGYKPDEGKRG-
:::. . :. : : .:. ..: ..: ::. : :: .. ::
CCDS43 GWGETQGTF----GTG---LLKEAQLLVIENEVCNHYKYI-------CA----EHLARGT
1950 1960 1970 1980
570 580 590 600 610 620
pF1KE2 DACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVIDQFG
:.:.::::::.: .... .:..::: :: : .: : :..: :. ::. ..
CCDS43 DSCQGDSGGPLVCFE--KDKYILQGVTSWGLGCARPNKPGVYARVSRFVTWIEGMMRNN
1990 2000 2010 2020 2030 2040
pF1KE2 E
>>CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 (317 aa)
initn: 393 init1: 145 opt: 499 Z-score: 560.1 bits: 112.8 E(32554): 7e-25
Smith-Waterman score: 499; 32.6% identity (62.8% similar) in 261 aa overlap (363-617:49-289)
340 350 360 370 380 390
pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCG
:.: : :. . :: : . ... .. :.
CCDS10 TSLLLLASTAILNAARIPVPPACGKPQQLNRVVGGEDSTDSEWPWIVSIQKNGTHH--CA
20 30 40 50 60 70
400 410 420 430 440 450
pF1KE2 ASLISDRWVLTAAHCLLYPPWDKNFTENDLL-VRIGKHSRTRYERNIEKISMLEKIYIHP
.::...:::.:::::. :... :. : .: . .:... . ::
CCDS10 GSLLTSRWVITAAHCF-----KDNLNKPYLFSVLLGAWQLGNPGSRSQKVGV-AWVEPHP
80 90 100 110 120 130
460 470 480 490 500 510
pF1KE2 RYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGWGNLKETW
:.:.:. ::::..:.. . ::. . :.:::: :. : . . ..:::....
CCDS10 VYSWKEGACADIALVRLERSIQFSERVLPICLPD---ASIHLPPNTHCWISGWGSIQD--
140 150 160 170 180
520 530 540 550 560
pF1KE2 TANVGKGQPSVLQVVNLPIVERPVC-----KDSTRIRITDNMFCAGYKPDEGKRGDACEG
.: .:..:: ...::.. :: . . . ::..:.:::: ::.: ::: :
CCDS10 --GVPLPHPQTLQKLKVPIIDSEVCSHLYWRGAGQGPITEDMLCAGYL--EGER-DACLG
190 200 210 220 230 240
570 580 590 600 610 620
pF1KE2 DSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVIDQFGE
:::::.. . .. : ::.:::::: . .. : : . ..:..:..
CCDS10 DSGGPLMCQ--VDGAWLLAGIISWGEGCAERNRPGVYISLSAHRSWVEKIVQGVQLRGRA
250 260 270 280 290
CCDS10 QGGGALRAPSQGSGAAARS
300 310
>>CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 (290 aa)
initn: 422 init1: 116 opt: 478 Z-score: 537.3 bits: 108.5 E(32554): 1.3e-23
Smith-Waterman score: 534; 35.9% identity (62.0% similar) in 276 aa overlap (363-620:34-279)
340 350 360 370 380 390
pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCG
:.: :.:.. : :::: . :.. . .::
CCDS10 PAAVPLLLLLCFGSQRAKAATACGRPRMLNRMVGGQDTQEGEWPWQVSIQRNGSH--FCG
10 20 30 40 50 60
400 410 420 430 440
pF1KE2 ASLISDRWVLTAAHCLLYPPWDKNFTENDL---------LVRIGKHSRTRYERNIEKISM
.:::...::::::::. .: .:..: ::. : :. :..:.
CCDS10 GSLIAEQWVLTAAHCF------RNTSETSLYQVLLGARQLVQPGPHAMYARVRQVES---
70 80 90 100 110
450 460 470 480 490 500
pF1KE2 LEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTG
.: :. . . :.::..:. :: :..:: :::::: . ....:.. :::
CCDS10 ------NPLYQGTAS-SADVALVELEAPVPFTNYILPVCLPD---PSVIFETGMNCWVTG
120 130 140 150 160
510 520 530 540 550
pF1KE2 WGNLKETWTANVGKGQPSVLQVVNLPIVERPVC-----KDSTR----IRITDNMFCAGYK
::. .: .: .:: . .::.. : : ::. : ..:.:::.
CCDS10 WGSPSEEDLLP----EPRILQKLAVPIIDTPKCNLLYSKDTEFGYQPKTIKNDMLCAGF-
170 180 190 200 210
560 570 580 590 600 610
pF1KE2 PDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQ
.:::. :::.::::::.: .. : : :..:::::: :... : : .: ..::.
CCDS10 -EEGKK-DACKGDSGGPLVCL--VGQSWLQAGVISWGEGCARQNRPGVYIRVTAHHNWIH
220 230 240 250 260 270
620
pF1KE2 KVIDQFGE
..: ..
CCDS10 RIIPKLQFQPARLGGQK
280 290
>>CCDS31735.1 C1S gene_id:716|Hs108|chr12 (688 aa)
initn: 377 init1: 114 opt: 456 Z-score: 507.4 bits: 104.2 E(32554): 6.1e-22
Smith-Waterman score: 470; 28.6% identity (51.3% similar) in 472 aa overlap (184-619:249-681)
160 170 180 190 200 210
pF1KE2 ENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQD-QVTVAMTPRSEGSSVNLSPPLEQ
: ::. . . .:.. .. .. :
CCDS31 RREDFDVEAADSAGNCLDSLVFVAGDRQFGPYCGHGFPGPLNIETKSNALDIIFQTDLTG
220 230 240 250 260 270
220 230 240 250 260
pF1KE2 CVPDRGQQYQGR-LAVTTHGLPCLAWASAQAKALSKHQDFNSAVQLVENFCRNPDGDE--
.:.: . . : .: :.:: . : ..::.. : :: :
CCDS31 QKKGWKLRYHGDPMPCPKEDTPNSVWEPAKAKYV-----FRDVVQIT---CL--DGFEVV
280 290 300 310 320
270 280 290 300 310
pF1KE2 EG--------VWCYVAGKPGDFGY-CDLNYCEEAVEEETGDGLDEDSDRAIEGRTAT-SE
:: : :: .. :. : .. : .: :: . .. : . .
CCDS31 EGRVGATSFYSTCQSNGKWSNSKLKCQPVDC--GIPESIENGKVEDPESTLFGSVIRYTC
330 340 350 360 370 380
320 330 340 350 360 370
pF1KE2 YQTFFNPRTFGSGEADCG---------LRPLFEKKSLEDKTERELLESYIDGRIVEGSDA
. .. .. :.:: :. : : . : . :: .: ::. ::::
CCDS31 EEPYYYMENGGGGEYHCAGNGSWVNEVLGPELPKCVPVCGVPREPFEE--KQRIIGGSDA
390 400 410 420 430 440
380 390 400 410 420 430
pF1KE2 EIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHS
.: :::: : .: :..::.. ::::::: . .. : . : . .
CCDS31 DIKNFPWQV--FFDNPW---AGGALINEYWVLTAAHVV------EGNREPTMYVGSTSVQ
450 460 470 480 490
440 450 460 470 480
pF1KE2 RTRYERNIEKISMLEKIYIHPRYNW--------RENLDRDIALMKLKKPVAFSDYIHPVC
.: .. :. :...::: .: : :.: ::::..:: :: .. . :.:
CCDS31 TSRLAKS--KMLTPEHVFIHP--GWKLLEVPEGRTNFDNDIALVRLKDPVKMGPTVSPIC
500 510 520 530 540
490 500 510 520 530
pF1KE2 LPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQ--PSV-LQVVNLPIVERPVCKDS
:: . .:.. : : ..::: .. : :. : . :. . ::.:. :.
CCDS31 LPGTSSDYNLMD-GDLGLISGWGRTEKRDRAVRLKAARLPVAPLRKCKEVKVEKPTA-DA
550 560 570 580 590 600
540 550 560 570 580 590
pF1KE2 TRIRITDNMFCAGYKPDEGKRG-DACEGDSGGPFVMKSPFNN-RWYQMGIVSWGEGCDRD
.: ::.::: :..: :.:.::::: :....: .. ..: :.:::: :
CCDS31 EAYVFTPNMICAG-----GEKGMDSCKGDSGGAFAVQDPNDKTKFYAAGLVSWGPQC---
610 620 630 640 650
600 610 620
pF1KE2 GKYGFYTHVFRLKKWIQKVIDQFGE
: ::.::.: ::.:....
CCDS31 GTYGLYTRVKNYVDWIMKTMQENSTPRED
660 670 680
>>CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 (314 aa)
initn: 518 init1: 162 opt: 435 Z-score: 488.8 bits: 99.6 E(32554): 6.6e-21
Smith-Waterman score: 516; 37.2% identity (60.9% similar) in 274 aa overlap (360-621:38-289)
330 340 350 360 370 380
pF1KE2 GSGEADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQEL
: .::: : :::.: ::: : . .
CCDS10 LLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSL--RLWDSH
10 20 30 40 50 60
390 400 410 420 430 440
pF1KE2 LCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKIS---MLEK
.::.::.: ::.:::::: . .. . .:..:. . ... .. .
CCDS10 VCGVSLLSHRWALTAAHC--FETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSN
70 80 90 100 110 120
450 460 470 480 490 500
pF1KE2 IYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGR----VT
::. ::: : ::::.::. ::... .:.:.:: :: .. ...: ::
CCDS10 IYLSPRY--LGNSPYDIALVKLSAPVTYTKHIQPICLQ-----ASTFE--FENRTDCWVT
130 140 150 160 170
510 520 530 540 550
pF1KE2 GWGNLKETWTANVGKGQPSVLQVVNLPIVERPVC-----KDSTRIRITDNMFCAGYKPDE
::: .:: . . .: .:: :.. :.. .: : : : : .: ::: . .
CCDS10 GWGYIKE----DEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAG-NAQG
180 190 200 210 220
560 570 580 590 600 610
pF1KE2 GKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVI
:: ::: ::::::.. .. :. :::.:.:::: :: : .. : ::.. . .::::..
CCDS10 GK--DACFGDSGGPLACNK--NGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLM
230 240 250 260 270 280
620
pF1KE2 DQFGE
: :
CCDS10 AQSGMSQPDPSWPLLFFPLLWALPLLGPV
290 300 310
>>CCDS74857.1 TMPRSS6 gene_id:164656|Hs108|chr22 (824 aa)
initn: 461 init1: 146 opt: 434 Z-score: 481.7 bits: 99.7 E(32554): 1.6e-20
Smith-Waterman score: 567; 29.0% identity (56.8% similar) in 458 aa overlap (183-617:413-823)
160 170 180 190 200
pF1KE2 QENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQDQVTVAMTPRSEGSSVNLSPP---
::: . .:. .: :...:. :
CCDS74 KYDLPCTQGQWTIQNRRLCGLRILQPYAERIPVVATAGITINFT-----SQISLTGPGVR
390 400 410 420 430
210 220 230 240 250 260
pF1KE2 LEQCVPDRGQQYQGRLAVTTHGLPCLAWASAQAKALSKHQDFNSAVQLVENFCRNPDGDE
.. . .... :.. ...:: :. : .: . : . : . :.. :.
CCDS74 VHYGLYNQSDPCPGEFLCSVNGL-CVP-ACDGVKDCPNGLDERNCVCRATFQCKE-DSTC
440 450 460 470 480 490
270 280 290 300 310 320
pF1KE2 EGVWCYVAGKPGDFGYCDLNYCEEAVEEETGDGLDEDSDRAIEGRTATSEYQTFFNPRTF
.. :.: .. : . :.:.: : :: :. ... ::.
CCDS74 ISLPKVCDGQPDCLNGSDEEQCQEGVPCGTFTFQCED-------RSCVKKP----NPQC-
500 510 520 530 540
330 340 350 360 370 380
pF1KE2 GSGEADCGLRPLFEKKSLEDKTERELLESYIDG---RIVEGSDAEIGMSPWQVMLFRKSP
.:. :: .: ...: . ..: ::: :. . : :::. : ..
CCDS74 -DGRPDC-----------RDGSDEEHCDCGLQGPSSRIVGGAVSSEGEWPWQASLQVRGR
550 560 570 580 590
390 400 410 420 430 440
pF1KE2 QELLCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKISMLEK
. .::..::.::::.:::::. .. . .: .. ..:: : .. :.: .
CCDS74 H--ICGGALIADRWVITAAHCFQEDSMASTVLWTVFLGKVWQNSRWPGEVSF-KVS---R
600 610 620 630 640
450 460 470 480 490 500
pF1KE2 IYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGWGN
. .:: :. ... : :.::..: .::. : ..::::: : . ... : . .::::
CCDS74 LLLHP-YHEEDSHDYDVALLQLDHPVVRSAAVRPVCLPAR---SHFFEPGLHCWITGWGA
650 660 670 680 690 700
510 520 530 540
pF1KE2 LKET------------WTANVGKGQ---P--SVLQVVNLPIVERPVCKDSTRIRITDNMF
:.: : : :. : ..:: :.. .. . .:.. : ..: :.
CCDS74 LREGALRADAVALFYGWR-NQGSETCCCPISNALQKVDVQLIPQDLCSEVYRYQVTPRML
710 720 730 740 750
550 560 570 580 590 600
pF1KE2 CAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRL
::::. .::. :::.::::::.: :. ...::. :.:::: :: : . .: ::.. .
CCDS74 CAGYR--KGKK-DACQGDSGGPLVCKA-LSGRWFLAGLVSWGLGCGRPNYFGVYTRITGV
760 770 780 790 800 810
610 620
pF1KE2 KKWIQKVIDQFGE
.:::.:.
CCDS74 ISWIQQVVT
820
>>CCDS33908.1 MASP1 gene_id:5648|Hs108|chr3 (728 aa)
initn: 412 init1: 127 opt: 431 Z-score: 479.2 bits: 99.0 E(32554): 2.3e-20
Smith-Waterman score: 486; 35.1% identity (59.8% similar) in 271 aa overlap (363-613:449-711)
340 350 360 370 380
pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLF----RKSPQE
::. : .:: :. :::... . :..
CCDS33 VWMNKVLGRSLPTCLPECGQPSRSLPSLVKRIIGGRNAEPGLFPWQALIVVEDTSRVPND
420 430 440 450 460 470
390 400 410 420 430 440
pF1KE2 LLCGA-SLISDRWVLTAAHCLLYPPWDKNF---TENDLLVRIGKHSRTRYERNIEKISML
:. .:.: :.::::: : : . ... . : .: :. .: ... :
CCDS33 KWFGSGALLSASWILTAAHVLRSQRRDTTVIPVSKEHVTVYLGLHD-VR-DKSGAVNSSA
480 490 500 510 520 530
450 460 470 480 490 500
pF1KE2 EKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGW
.. .:: .: .: ..::::..:..:: .. .. ::::: : . . : :.::
CCDS33 ARVVLHPDFNI-QNYNHDIALVQLQEPVPLGPHVMPVCLPRLEPEGP--APHMLGLVAGW
540 550 560 570 580 590
510 520 530 540 550
pF1KE2 GNLKETWTAN--VGKGQPS---VLQVVNLPIVERPVCKDSTRIR-----ITDNMFCAGYK
: . . :.. ...: . ::: :.::.: . :: : . : .:.:::::::
CCDS33 GISNPNVTVDEIISSGTRTLSDVLQYVKLPVVPHAECKTSYESRSGNYSVTENMFCAGYY
600 610 620 630 640 650
560 570 580 590 600 610
pF1KE2 PDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWG--EGCDRDGKYGFYTHVFRLKKW
:: . :.: ::::: ::. . ...:: .:.:::: : : :: ::.: :
CCDS33 --EGGK-DTCLGDSGGAFVIFDDLSQRWVVQGLVSWGGPEECGSKQVYGVYTKVSNYVDW
660 670 680 690 700 710
620
pF1KE2 IQKVIDQFGE
.
CCDS33 VWEQMGLPQSVVEPQVER
720
>>CCDS123.1 MASP2 gene_id:10747|Hs108|chr1 (686 aa)
initn: 451 init1: 125 opt: 427 Z-score: 475.1 bits: 98.2 E(32554): 3.9e-20
Smith-Waterman score: 478; 25.7% identity (53.6% similar) in 541 aa overlap (118-620:186-686)
90 100 110 120 130 140
pF1KE2 TACETARTPRDKLAACLEGNCAEGLGTNYRGHVNITRSGIECQLWRSRYPHK-PEINSTT
:.: ::: .: .::. :...: :
CCDS12 CHNHLGGFYCSCRAGYVLHRNKRTCSALCSGQVFTQRSG---ELSSPEYPRPYPKLSSCT
160 170 180 190 200 210
150 160 170 180 190
pF1KE2 HPGA---------DLQENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQDQVTVAMTP
. . :. :.: . : :. . : :... : ::. :.
CCDS12 YSISLEEGFSVILDFVESFDVETHPETLCPYDFLKIQTDREEHG--PFCGK---TLPHRI
220 230 240 250 260
200 210 220 230 240 250
pF1KE2 RSEGSSVNLSPPLEQCVPDRGQQYQG-RLAVTTHGLPC---LAWASAQAKALSKHQDFNS
......:... : :.. .. : .. :. . :: .: ..... .. . ...
CCDS12 ETKSNTVTIT-----FVTDESGDHTGWKIHYTSTAQPCPYPMAPPNGHVSPVQAKYILKD
270 280 290 300 310 320
260 270 280 290 300
pF1KE2 AVQLVENFCRNPDGDEEG-----VWCYVAGKPGDFGY----CDLNYCEEAVEEETGDGLD
. .. ::.. .: . : : :.. :.. : . .: ..
CCDS12 SFSI---FCETGYELLQGHLPLKSFTAVCQKDGSWDRPMPACSIVDCGPPDDLPSGR-VE
330 340 350 360 370
310 320 330 340 350
pF1KE2 EDSDRAIEGRTATSEY---QTFFNPRTFGSGEADCGLRPLFEKKSLEDKTERE-----LL
. .. :. .: .::.. .. ..:. : .. ... : . :
CCDS12 YITGPGVTTYKAVIQYSCEETFYTMKV-NDGKYVCEADGFWTSSKGEKSLPVCEPVCGLS
380 390 400 410 420 430
360 370 380 390 400 410
pF1KE2 ESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKN
::: :. :. : ::::... . :: :. : ::::::: . ....
CCDS12 ARTTGGRIYGGQKAKPGDFPWQVLILGGTTAA---GA-LLYDNWVLTAAHAV----YEQK
440 450 460 470 480
420 430 440 450 460 470
pF1KE2 FTENDLLVRIGKHSRTRYERNIEKISMLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSD
. : .:.: .: . . . : ..:: :. ..: ::::.::.. :....
CCDS12 HDASALDIRMGTLKRLSPHYTQ---AWSEAVFIHEGYTHDAGFDNDIALIKLNNKVVINS
490 500 510 520 530 540
480 490 500 510 520 530
pF1KE2 YIHPVCLPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQPSVLQVVNLPIVERPVC
: :.::: :. : :.... : ..::: .. . : :. :..:::.. :
CCDS12 NITPICLP-RKEAESFMRTDDIGTASGWGLTQRGFLARN-------LMYVDIPIVDHQKC
550 560 570 580 590
540 550 560 570 580 590
pF1KE2 KDS------TRIRITDNMFCAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSW
. : .: ::.::: . :: :.:.::::: .:. . ..::. :::::
CCDS12 TAAYEKPPYPRGSVTANMLCAGLESG-GK--DSCRGDSGGALVFLDSETERWFVGGIVSW
600 610 620 630 640 650
600 610 620
pF1KE2 GE-GCDRDGKYGFYTHVFRLKKWIQKVIDQFGE
: .: . :.:: ::.:. ::...:..:
CCDS12 GSMNCGEAGQYGVYTKVINYIPWIENIISDF
660 670 680
>>CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 (343 aa)
initn: 509 init1: 117 opt: 416 Z-score: 467.1 bits: 95.7 E(32554): 1.1e-19
Smith-Waterman score: 542; 36.1% identity (62.8% similar) in 266 aa overlap (363-620:44-288)
340 350 360 370 380 390
pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCG
::. ::.: :. :::: . .. . .::
CCDS45 AVAILLYLGLLRSGTGAEGAEAPCGVAPQARITGGSSAVAGQWPWQVSITYEGVH--VCG
20 30 40 50 60 70
400 410 420 430 440 450
pF1KE2 ASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKISMLEKIYIHPR
.::.:..:::.:::: .: .. .. :..: :. : .. :.: :. : ::
CCDS45 GSLVSEQWVLSAAHC--FP---SEHHKEAYEVKLGAHQLDSYSEDA-KVSTLKDIIPHPS
80 90 100 110 120
460 470 480 490 500 510
pF1KE2 YNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGWGNLKETWT
: .:. . ::::..:..:..:: ::.:.::: .: . . : . :::::.. .
CCDS45 Y-LQEGSQGDIALLQLSRPITFSRYIRPICLP---AANASFPNGLHCTVTGWGHVAPS--
130 140 150 160 170
520 530 540 550 560
pF1KE2 ANVGKGQPSVLQVVNLPIVERPVCKDSTRIR--------ITDNMFCAGYKPDEGKRGDAC
:. :. :: ...:.. : .:. : . ..: :::: :: . :::
CCDS45 --VSLLTPKPLQQLEVPLISRETCNCLYNIDAKPEEPHFVQEDMVCAGYV--EGGK-DAC
180 190 200 210 220 230
570 580 590 600 610 620
pF1KE2 EGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVIDQFGE
.:::::: .. : .. :: ::::::..: .. : :: . .:::. . ..
CCDS45 QGDSGGP--LSCPVEGLWYLTGIVSWGDACGARNRPGVYTLASSYASWIQSKVTELQPRV
240 250 260 270 280 290
CCDS45 VPQTQESQPDSNLCGSHLAFSSAPAQGLLRPILFLPLGLALGLLSPWLSEH
300 310 320 330 340
622 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:42:19 2016 done: Sun Nov 6 09:42:20 2016
Total Scan time: 3.550 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]