FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2032, 622 aa 1>>>pF1KE2032 622 - 622 aa - 622 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5669+/-0.000924; mu= 18.1032+/- 0.056 mean_var=80.4669+/-16.494, 0's: 0 Z-trim(107.0): 177 B-trim: 390 in 1/50 Lambda= 0.142977 statistics sampled from 9113 (9309) to 9113 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.653), E-opt: 0.2 (0.286), width: 16 Scan time: 3.550 The best scores are: opt bits E(32554) CCDS31476.1 F2 gene_id:2147|Hs108|chr11 ( 622) 4354 908.2 0 CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040) 524 118.5 8.7e-26 CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 ( 317) 499 112.8 7e-25 CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 ( 290) 478 108.5 1.3e-23 CCDS31735.1 C1S gene_id:716|Hs108|chr12 ( 688) 456 104.2 6.1e-22 CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 ( 314) 435 99.6 6.6e-21 CCDS74857.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 824) 434 99.7 1.6e-20 CCDS33908.1 MASP1 gene_id:5648|Hs108|chr3 ( 728) 431 99.0 2.3e-20 CCDS123.1 MASP2 gene_id:10747|Hs108|chr1 ( 686) 427 98.2 3.9e-20 CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 416 95.7 1.1e-19 CCDS73602.1 F7 gene_id:2155|Hs108|chr13 ( 382) 395 91.4 2.3e-18 CCDS33907.1 MASP1 gene_id:5648|Hs108|chr3 ( 699) 397 92.0 2.9e-18 CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 394 91.2 2.9e-18 CCDS58452.1 PRSS36 gene_id:146547|Hs108|chr16 ( 752) 396 91.8 3.5e-18 CCDS58453.1 PRSS36 gene_id:146547|Hs108|chr16 ( 850) 396 91.9 3.8e-18 CCDS32436.1 PRSS36 gene_id:146547|Hs108|chr16 ( 855) 396 91.9 3.9e-18 CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 385 89.5 1.3e-17 CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 380 88.2 1.5e-17 CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 378 88.1 5.1e-17 CCDS54297.1 KLK11 gene_id:11012|Hs108|chr19 ( 275) 348 81.6 1.5e-15 CCDS33757.2 MST1 gene_id:4485|Hs108|chr3 ( 725) 348 81.9 3.2e-15 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 340 80.0 4.5e-15 CCDS83291.1 PLAT gene_id:5327|Hs108|chr8 ( 473) 341 80.3 6.3e-15 CCDS6127.1 PLAT gene_id:5327|Hs108|chr8 ( 516) 341 80.4 6.7e-15 CCDS6126.1 PLAT gene_id:5327|Hs108|chr8 ( 562) 341 80.4 7.2e-15 CCDS60760.1 PAMR1 gene_id:25891|Hs108|chr11 ( 609) 336 79.4 1.6e-14 CCDS60759.1 PAMR1 gene_id:25891|Hs108|chr11 ( 680) 336 79.4 1.7e-14 CCDS31460.1 PAMR1 gene_id:25891|Hs108|chr11 ( 720) 336 79.4 1.8e-14 CCDS7898.1 PAMR1 gene_id:25891|Hs108|chr11 ( 737) 336 79.4 1.8e-14 CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 334 79.1 2.6e-14 CCDS47629.1 HGF gene_id:3082|Hs108|chr7 ( 210) 325 76.8 3.2e-14 CCDS46816.1 PRSS42 gene_id:339906|Hs108|chr3 ( 293) 326 77.1 3.7e-14 CCDS47627.1 HGF gene_id:3082|Hs108|chr7 ( 290) 324 76.7 4.8e-14 CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 321 76.1 7.2e-14 CCDS5597.1 HGF gene_id:3082|Hs108|chr7 ( 728) 324 77.0 1e-13 CCDS2745.1 PRSS50 gene_id:29122|Hs108|chr3 ( 385) 319 75.7 1.2e-13 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 314 74.9 4.5e-13 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 314 74.9 4.6e-13 CCDS47628.1 HGF gene_id:3082|Hs108|chr7 ( 285) 308 73.4 4.7e-13 CCDS81658.1 C1R gene_id:715|Hs108|chr12 ( 705) 307 73.4 1.1e-12 CCDS47626.1 HGF gene_id:3082|Hs108|chr7 ( 723) 307 73.4 1.1e-12 CCDS3369.1 HGFAC gene_id:3083|Hs108|chr4 ( 655) 296 71.2 5.1e-12 CCDS75098.1 HGFAC gene_id:3083|Hs108|chr4 ( 662) 296 71.2 5.1e-12 CCDS81783.1 F10 gene_id:2159|Hs108|chr13 ( 332) 292 70.1 5.2e-12 CCDS9530.1 F10 gene_id:2159|Hs108|chr13 ( 488) 292 70.2 7.1e-12 CCDS82010.1 HP gene_id:3240|Hs108|chr16 ( 347) 286 68.9 1.3e-11 CCDS45525.1 HP gene_id:3240|Hs108|chr16 ( 347) 286 68.9 1.3e-11 CCDS45524.1 HP gene_id:3240|Hs108|chr16 ( 406) 286 68.9 1.4e-11 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 285 68.9 2.4e-11 CCDS5976.1 PRSS55 gene_id:203074|Hs108|chr8 ( 352) 281 67.9 2.6e-11 >>CCDS31476.1 F2 gene_id:2147|Hs108|chr11 (622 aa) initn: 4354 init1: 4354 opt: 4354 Z-score: 4853.4 bits: 908.2 E(32554): 0 Smith-Waterman score: 4354; 100.0% identity (100.0% similar) in 622 aa overlap (1-622:1-622) 10 20 30 40 50 60 pF1KE2 MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRRANTFLEEVRKGNLEREC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRRANTFLEEVRKGNLEREC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VEETCSYEEAFEALESSTATDVFWAKYTACETARTPRDKLAACLEGNCAEGLGTNYRGHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VEETCSYEEAFEALESSTATDVFWAKYTACETARTPRDKLAACLEGNCAEGLGTNYRGHV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 NITRSGIECQLWRSRYPHKPEINSTTHPGADLQENFCRNPDSSTTGPWCYTTDPTVRRQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NITRSGIECQLWRSRYPHKPEINSTTHPGADLQENFCRNPDSSTTGPWCYTTDPTVRRQE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 CSIPVCGQDQVTVAMTPRSEGSSVNLSPPLEQCVPDRGQQYQGRLAVTTHGLPCLAWASA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CSIPVCGQDQVTVAMTPRSEGSSVNLSPPLEQCVPDRGQQYQGRLAVTTHGLPCLAWASA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 QAKALSKHQDFNSAVQLVENFCRNPDGDEEGVWCYVAGKPGDFGYCDLNYCEEAVEEETG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QAKALSKHQDFNSAVQLVENFCRNPDGDEEGVWCYVAGKPGDFGYCDLNYCEEAVEEETG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 DGLDEDSDRAIEGRTATSEYQTFFNPRTFGSGEADCGLRPLFEKKSLEDKTERELLESYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DGLDEDSDRAIEGRTATSEYQTFFNPRTFGSGEADCGLRPLFEKKSLEDKTERELLESYI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 DGRIVEGSDAEIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DGRIVEGSDAEIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTEN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 DLLVRIGKHSRTRYERNIEKISMLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DLLVRIGKHSRTRYERNIEKISMLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 VCLPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQPSVLQVVNLPIVERPVCKDST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VCLPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQPSVLQVVNLPIVERPVCKDST 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 RIRITDNMFCAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RIRITDNMFCAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKY 550 560 570 580 590 600 610 620 pF1KE2 GFYTHVFRLKKWIQKVIDQFGE :::::::::::::::::::::: CCDS31 GFYTHVFRLKKWIQKVIDQFGE 610 620 >>CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040 aa) initn: 997 init1: 225 opt: 524 Z-score: 576.4 bits: 118.5 E(32554): 8.7e-26 Smith-Waterman score: 865; 32.0% identity (54.2% similar) in 566 aa overlap (60-617:1574-2037) 30 40 50 60 70 80 pF1KE2 APQQARSLLQRVRRANTFLEEVRKGNLERECVEETCSYEEAFEALESSTATDV--FWAKY : :: :. .::. :.. : . :. CCDS43 AGLTENYCRNPDSGKQPWCYTTDPCVRWEYCNLTQCSETES-GVLETPTVVPVPSMEAHS 1550 1560 1570 1580 1590 1600 90 100 110 120 130 140 pF1KE2 TACETARTPRDKLAACLEGNCAEGLGTNYRGHVNITRSGIECQLWRSRYPHKPEINSTTH : : .:: . : .:: : .::: . : .: :: : : ::. . . .. CCDS43 EAAPTEQTPVVR--QCYHGN-----GQSYRGTFSTTVTGRTCQSWSSMTPHRHQRTPENY 1610 1620 1630 1640 1650 150 160 170 180 190 200 pF1KE2 PGADLQENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQDQVTVAMTPRSEGSSVNLS :. : :.:::::..: ::::.: ::..: . :.. :.. . :: ..: . . .:. CCDS43 PNDGLTMNYCRNPDADT-GPWCFTMDPSIRWEYCNLTRCSDTEGTV-VAPPTVIQVPSLG 1660 1670 1680 1690 1700 1710 210 220 230 240 250 260 pF1KE2 PPLEQ-CVPDRGQQYQGRLAVTTHGLPCLAWASAQAKALSKHQDF----NSAVQLVENFC :: :: :. :. :.:. :.:. : :: :: :. .:. : :. . : .:.: CCDS43 PPSEQDCMFGNGKGYRGKKATTVTGTPCQEWA---AQEPHRHSTFIPGTNKWAGLEKNYC 1720 1730 1740 1750 1760 1770 270 280 290 300 310 320 pF1KE2 RNPDGDEEGVWCYVAGKPGDFGYCDLNYCEEAVEEETGDGLDEDSDRAIEGRTATSEYQT :::::: .: :::. . : :::. : :.: . CCDS43 RNPDGDINGPWCYTMNPRKLFDYCDIPLC------------------------ASSSF-- 1780 1790 1800 330 340 350 360 370 380 pF1KE2 FFNPRTFGSGEADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLF ::: .: : :. : :: : :. :::: : CCDS43 ------------DCG-KPQVEPKKCP-------------GSIVGGCVAHPHSWPWQVSL- 1810 1820 1830 390 400 410 420 430 440 pF1KE2 RKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKIS : . .::..::: .::::::::: :. .. : .: :... : ....: CCDS43 RTRFGKHFCGGTLISPEWVLTAAHCL-----KKSSRPSSYKVILGAHQEVNLESHVQEIE 1840 1850 1860 1870 1880 1890 450 460 470 480 490 500 pF1KE2 MLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVT . .....: . ::::.::..:....: . :.:::. . .. : . .: CCDS43 V-SRLFLEPT-------QADIALLKLSRPAVITDKVMPACLPSPDY---MVTARTECYIT 1900 1910 1920 1930 1940 510 520 530 540 550 560 pF1KE2 GWGNLKETWTANVGKGQPSVLQVVNLPIVERPVCKDSTRIRITDNMFCAGYKPDEGKRG- :::. . :. : : .:. ..: ..: ::. : :: .. :: CCDS43 GWGETQGTF----GTG---LLKEAQLLVIENEVCNHYKYI-------CA----EHLARGT 1950 1960 1970 1980 570 580 590 600 610 620 pF1KE2 DACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVIDQFG :.:.::::::.: .... .:..::: :: : .: : :..: :. ::. .. CCDS43 DSCQGDSGGPLVCFE--KDKYILQGVTSWGLGCARPNKPGVYARVSRFVTWIEGMMRNN 1990 2000 2010 2020 2030 2040 pF1KE2 E >>CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 (317 aa) initn: 393 init1: 145 opt: 499 Z-score: 560.1 bits: 112.8 E(32554): 7e-25 Smith-Waterman score: 499; 32.6% identity (62.8% similar) in 261 aa overlap (363-617:49-289) 340 350 360 370 380 390 pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCG :.: : :. . :: : . ... .. :. CCDS10 TSLLLLASTAILNAARIPVPPACGKPQQLNRVVGGEDSTDSEWPWIVSIQKNGTHH--CA 20 30 40 50 60 70 400 410 420 430 440 450 pF1KE2 ASLISDRWVLTAAHCLLYPPWDKNFTENDLL-VRIGKHSRTRYERNIEKISMLEKIYIHP .::...:::.:::::. :... :. : .: . .:... . :: CCDS10 GSLLTSRWVITAAHCF-----KDNLNKPYLFSVLLGAWQLGNPGSRSQKVGV-AWVEPHP 80 90 100 110 120 130 460 470 480 490 500 510 pF1KE2 RYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGWGNLKETW :.:.:. ::::..:.. . ::. . :.:::: :. : . . ..:::.... CCDS10 VYSWKEGACADIALVRLERSIQFSERVLPICLPD---ASIHLPPNTHCWISGWGSIQD-- 140 150 160 170 180 520 530 540 550 560 pF1KE2 TANVGKGQPSVLQVVNLPIVERPVC-----KDSTRIRITDNMFCAGYKPDEGKRGDACEG .: .:..:: ...::.. :: . . . ::..:.:::: ::.: ::: : CCDS10 --GVPLPHPQTLQKLKVPIIDSEVCSHLYWRGAGQGPITEDMLCAGYL--EGER-DACLG 190 200 210 220 230 240 570 580 590 600 610 620 pF1KE2 DSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVIDQFGE :::::.. . .. : ::.:::::: . .. : : . ..:..:.. CCDS10 DSGGPLMCQ--VDGAWLLAGIISWGEGCAERNRPGVYISLSAHRSWVEKIVQGVQLRGRA 250 260 270 280 290 CCDS10 QGGGALRAPSQGSGAAARS 300 310 >>CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 (290 aa) initn: 422 init1: 116 opt: 478 Z-score: 537.3 bits: 108.5 E(32554): 1.3e-23 Smith-Waterman score: 534; 35.9% identity (62.0% similar) in 276 aa overlap (363-620:34-279) 340 350 360 370 380 390 pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCG :.: :.:.. : :::: . :.. . .:: CCDS10 PAAVPLLLLLCFGSQRAKAATACGRPRMLNRMVGGQDTQEGEWPWQVSIQRNGSH--FCG 10 20 30 40 50 60 400 410 420 430 440 pF1KE2 ASLISDRWVLTAAHCLLYPPWDKNFTENDL---------LVRIGKHSRTRYERNIEKISM .:::...::::::::. .: .:..: ::. : :. :..:. CCDS10 GSLIAEQWVLTAAHCF------RNTSETSLYQVLLGARQLVQPGPHAMYARVRQVES--- 70 80 90 100 110 450 460 470 480 490 500 pF1KE2 LEKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTG .: :. . . :.::..:. :: :..:: :::::: . ....:.. ::: CCDS10 ------NPLYQGTAS-SADVALVELEAPVPFTNYILPVCLPD---PSVIFETGMNCWVTG 120 130 140 150 160 510 520 530 540 550 pF1KE2 WGNLKETWTANVGKGQPSVLQVVNLPIVERPVC-----KDSTR----IRITDNMFCAGYK ::. .: .: .:: . .::.. : : ::. : ..:.:::. CCDS10 WGSPSEEDLLP----EPRILQKLAVPIIDTPKCNLLYSKDTEFGYQPKTIKNDMLCAGF- 170 180 190 200 210 560 570 580 590 600 610 pF1KE2 PDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQ .:::. :::.::::::.: .. : : :..:::::: :... : : .: ..::. CCDS10 -EEGKK-DACKGDSGGPLVCL--VGQSWLQAGVISWGEGCARQNRPGVYIRVTAHHNWIH 220 230 240 250 260 270 620 pF1KE2 KVIDQFGE ..: .. CCDS10 RIIPKLQFQPARLGGQK 280 290 >>CCDS31735.1 C1S gene_id:716|Hs108|chr12 (688 aa) initn: 377 init1: 114 opt: 456 Z-score: 507.4 bits: 104.2 E(32554): 6.1e-22 Smith-Waterman score: 470; 28.6% identity (51.3% similar) in 472 aa overlap (184-619:249-681) 160 170 180 190 200 210 pF1KE2 ENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQD-QVTVAMTPRSEGSSVNLSPPLEQ : ::. . . .:.. .. .. : CCDS31 RREDFDVEAADSAGNCLDSLVFVAGDRQFGPYCGHGFPGPLNIETKSNALDIIFQTDLTG 220 230 240 250 260 270 220 230 240 250 260 pF1KE2 CVPDRGQQYQGR-LAVTTHGLPCLAWASAQAKALSKHQDFNSAVQLVENFCRNPDGDE-- .:.: . . : .: :.:: . : ..::.. : :: : CCDS31 QKKGWKLRYHGDPMPCPKEDTPNSVWEPAKAKYV-----FRDVVQIT---CL--DGFEVV 280 290 300 310 320 270 280 290 300 310 pF1KE2 EG--------VWCYVAGKPGDFGY-CDLNYCEEAVEEETGDGLDEDSDRAIEGRTAT-SE :: : :: .. :. : .. : .: :: . .. : . . CCDS31 EGRVGATSFYSTCQSNGKWSNSKLKCQPVDC--GIPESIENGKVEDPESTLFGSVIRYTC 330 340 350 360 370 380 320 330 340 350 360 370 pF1KE2 YQTFFNPRTFGSGEADCG---------LRPLFEKKSLEDKTERELLESYIDGRIVEGSDA . .. .. :.:: :. : : . : . :: .: ::. :::: CCDS31 EEPYYYMENGGGGEYHCAGNGSWVNEVLGPELPKCVPVCGVPREPFEE--KQRIIGGSDA 390 400 410 420 430 440 380 390 400 410 420 430 pF1KE2 EIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHS .: :::: : .: :..::.. ::::::: . .. : . : . . CCDS31 DIKNFPWQV--FFDNPW---AGGALINEYWVLTAAHVV------EGNREPTMYVGSTSVQ 450 460 470 480 490 440 450 460 470 480 pF1KE2 RTRYERNIEKISMLEKIYIHPRYNW--------RENLDRDIALMKLKKPVAFSDYIHPVC .: .. :. :...::: .: : :.: ::::..:: :: .. . :.: CCDS31 TSRLAKS--KMLTPEHVFIHP--GWKLLEVPEGRTNFDNDIALVRLKDPVKMGPTVSPIC 500 510 520 530 540 490 500 510 520 530 pF1KE2 LPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQ--PSV-LQVVNLPIVERPVCKDS :: . .:.. : : ..::: .. : :. : . :. . ::.:. :. CCDS31 LPGTSSDYNLMD-GDLGLISGWGRTEKRDRAVRLKAARLPVAPLRKCKEVKVEKPTA-DA 550 560 570 580 590 600 540 550 560 570 580 590 pF1KE2 TRIRITDNMFCAGYKPDEGKRG-DACEGDSGGPFVMKSPFNN-RWYQMGIVSWGEGCDRD .: ::.::: :..: :.:.::::: :....: .. ..: :.:::: : CCDS31 EAYVFTPNMICAG-----GEKGMDSCKGDSGGAFAVQDPNDKTKFYAAGLVSWGPQC--- 610 620 630 640 650 600 610 620 pF1KE2 GKYGFYTHVFRLKKWIQKVIDQFGE : ::.::.: ::.:.... CCDS31 GTYGLYTRVKNYVDWIMKTMQENSTPRED 660 670 680 >>CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 (314 aa) initn: 518 init1: 162 opt: 435 Z-score: 488.8 bits: 99.6 E(32554): 6.6e-21 Smith-Waterman score: 516; 37.2% identity (60.9% similar) in 274 aa overlap (360-621:38-289) 330 340 350 360 370 380 pF1KE2 GSGEADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQEL : .::: : :::.: ::: : . . CCDS10 LLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSL--RLWDSH 10 20 30 40 50 60 390 400 410 420 430 440 pF1KE2 LCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKIS---MLEK .::.::.: ::.:::::: . .. . .:..:. . ... .. . CCDS10 VCGVSLLSHRWALTAAHC--FETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSN 70 80 90 100 110 120 450 460 470 480 490 500 pF1KE2 IYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGR----VT ::. ::: : ::::.::. ::... .:.:.:: :: .. ...: :: CCDS10 IYLSPRY--LGNSPYDIALVKLSAPVTYTKHIQPICLQ-----ASTFE--FENRTDCWVT 130 140 150 160 170 510 520 530 540 550 pF1KE2 GWGNLKETWTANVGKGQPSVLQVVNLPIVERPVC-----KDSTRIRITDNMFCAGYKPDE ::: .:: . . .: .:: :.. :.. .: : : : : .: ::: . . CCDS10 GWGYIKE----DEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAG-NAQG 180 190 200 210 220 560 570 580 590 600 610 pF1KE2 GKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVI :: ::: ::::::.. .. :. :::.:.:::: :: : .. : ::.. . .::::.. CCDS10 GK--DACFGDSGGPLACNK--NGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLM 230 240 250 260 270 280 620 pF1KE2 DQFGE : : CCDS10 AQSGMSQPDPSWPLLFFPLLWALPLLGPV 290 300 310 >>CCDS74857.1 TMPRSS6 gene_id:164656|Hs108|chr22 (824 aa) initn: 461 init1: 146 opt: 434 Z-score: 481.7 bits: 99.7 E(32554): 1.6e-20 Smith-Waterman score: 567; 29.0% identity (56.8% similar) in 458 aa overlap (183-617:413-823) 160 170 180 190 200 pF1KE2 QENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQDQVTVAMTPRSEGSSVNLSPP--- ::: . .:. .: :...:. : CCDS74 KYDLPCTQGQWTIQNRRLCGLRILQPYAERIPVVATAGITINFT-----SQISLTGPGVR 390 400 410 420 430 210 220 230 240 250 260 pF1KE2 LEQCVPDRGQQYQGRLAVTTHGLPCLAWASAQAKALSKHQDFNSAVQLVENFCRNPDGDE .. . .... :.. ...:: :. : .: . : . : . :.. :. CCDS74 VHYGLYNQSDPCPGEFLCSVNGL-CVP-ACDGVKDCPNGLDERNCVCRATFQCKE-DSTC 440 450 460 470 480 490 270 280 290 300 310 320 pF1KE2 EGVWCYVAGKPGDFGYCDLNYCEEAVEEETGDGLDEDSDRAIEGRTATSEYQTFFNPRTF .. :.: .. : . :.:.: : :: :. ... ::. CCDS74 ISLPKVCDGQPDCLNGSDEEQCQEGVPCGTFTFQCED-------RSCVKKP----NPQC- 500 510 520 530 540 330 340 350 360 370 380 pF1KE2 GSGEADCGLRPLFEKKSLEDKTERELLESYIDG---RIVEGSDAEIGMSPWQVMLFRKSP .:. :: .: ...: . ..: ::: :. . : :::. : .. CCDS74 -DGRPDC-----------RDGSDEEHCDCGLQGPSSRIVGGAVSSEGEWPWQASLQVRGR 550 560 570 580 590 390 400 410 420 430 440 pF1KE2 QELLCGASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKISMLEK . .::..::.::::.:::::. .. . .: .. ..:: : .. :.: . CCDS74 H--ICGGALIADRWVITAAHCFQEDSMASTVLWTVFLGKVWQNSRWPGEVSF-KVS---R 600 610 620 630 640 450 460 470 480 490 500 pF1KE2 IYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGWGN . .:: :. ... : :.::..: .::. : ..::::: : . ... : . .:::: CCDS74 LLLHP-YHEEDSHDYDVALLQLDHPVVRSAAVRPVCLPAR---SHFFEPGLHCWITGWGA 650 660 670 680 690 700 510 520 530 540 pF1KE2 LKET------------WTANVGKGQ---P--SVLQVVNLPIVERPVCKDSTRIRITDNMF :.: : : :. : ..:: :.. .. . .:.. : ..: :. CCDS74 LREGALRADAVALFYGWR-NQGSETCCCPISNALQKVDVQLIPQDLCSEVYRYQVTPRML 710 720 730 740 750 550 560 570 580 590 600 pF1KE2 CAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRL ::::. .::. :::.::::::.: :. ...::. :.:::: :: : . .: ::.. . CCDS74 CAGYR--KGKK-DACQGDSGGPLVCKA-LSGRWFLAGLVSWGLGCGRPNYFGVYTRITGV 760 770 780 790 800 810 610 620 pF1KE2 KKWIQKVIDQFGE .:::.:. CCDS74 ISWIQQVVT 820 >>CCDS33908.1 MASP1 gene_id:5648|Hs108|chr3 (728 aa) initn: 412 init1: 127 opt: 431 Z-score: 479.2 bits: 99.0 E(32554): 2.3e-20 Smith-Waterman score: 486; 35.1% identity (59.8% similar) in 271 aa overlap (363-613:449-711) 340 350 360 370 380 pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLF----RKSPQE ::. : .:: :. :::... . :.. CCDS33 VWMNKVLGRSLPTCLPECGQPSRSLPSLVKRIIGGRNAEPGLFPWQALIVVEDTSRVPND 420 430 440 450 460 470 390 400 410 420 430 440 pF1KE2 LLCGA-SLISDRWVLTAAHCLLYPPWDKNF---TENDLLVRIGKHSRTRYERNIEKISML :. .:.: :.::::: : : . ... . : .: :. .: ... : CCDS33 KWFGSGALLSASWILTAAHVLRSQRRDTTVIPVSKEHVTVYLGLHD-VR-DKSGAVNSSA 480 490 500 510 520 530 450 460 470 480 490 500 pF1KE2 EKIYIHPRYNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGW .. .:: .: .: ..::::..:..:: .. .. ::::: : . . : :.:: CCDS33 ARVVLHPDFNI-QNYNHDIALVQLQEPVPLGPHVMPVCLPRLEPEGP--APHMLGLVAGW 540 550 560 570 580 590 510 520 530 540 550 pF1KE2 GNLKETWTAN--VGKGQPS---VLQVVNLPIVERPVCKDSTRIR-----ITDNMFCAGYK : . . :.. ...: . ::: :.::.: . :: : . : .:.::::::: CCDS33 GISNPNVTVDEIISSGTRTLSDVLQYVKLPVVPHAECKTSYESRSGNYSVTENMFCAGYY 600 610 620 630 640 650 560 570 580 590 600 610 pF1KE2 PDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSWG--EGCDRDGKYGFYTHVFRLKKW :: . :.: ::::: ::. . ...:: .:.:::: : : :: ::.: : CCDS33 --EGGK-DTCLGDSGGAFVIFDDLSQRWVVQGLVSWGGPEECGSKQVYGVYTKVSNYVDW 660 670 680 690 700 710 620 pF1KE2 IQKVIDQFGE . CCDS33 VWEQMGLPQSVVEPQVER 720 >>CCDS123.1 MASP2 gene_id:10747|Hs108|chr1 (686 aa) initn: 451 init1: 125 opt: 427 Z-score: 475.1 bits: 98.2 E(32554): 3.9e-20 Smith-Waterman score: 478; 25.7% identity (53.6% similar) in 541 aa overlap (118-620:186-686) 90 100 110 120 130 140 pF1KE2 TACETARTPRDKLAACLEGNCAEGLGTNYRGHVNITRSGIECQLWRSRYPHK-PEINSTT :.: ::: .: .::. :...: : CCDS12 CHNHLGGFYCSCRAGYVLHRNKRTCSALCSGQVFTQRSG---ELSSPEYPRPYPKLSSCT 160 170 180 190 200 210 150 160 170 180 190 pF1KE2 HPGA---------DLQENFCRNPDSSTTGPWCYTTDPTVRRQECSIPVCGQDQVTVAMTP . . :. :.: . : :. . : :... : ::. :. CCDS12 YSISLEEGFSVILDFVESFDVETHPETLCPYDFLKIQTDREEHG--PFCGK---TLPHRI 220 230 240 250 260 200 210 220 230 240 250 pF1KE2 RSEGSSVNLSPPLEQCVPDRGQQYQG-RLAVTTHGLPC---LAWASAQAKALSKHQDFNS ......:... : :.. .. : .. :. . :: .: ..... .. . ... CCDS12 ETKSNTVTIT-----FVTDESGDHTGWKIHYTSTAQPCPYPMAPPNGHVSPVQAKYILKD 270 280 290 300 310 320 260 270 280 290 300 pF1KE2 AVQLVENFCRNPDGDEEG-----VWCYVAGKPGDFGY----CDLNYCEEAVEEETGDGLD . .. ::.. .: . : : :.. :.. : . .: .. CCDS12 SFSI---FCETGYELLQGHLPLKSFTAVCQKDGSWDRPMPACSIVDCGPPDDLPSGR-VE 330 340 350 360 370 310 320 330 340 350 pF1KE2 EDSDRAIEGRTATSEY---QTFFNPRTFGSGEADCGLRPLFEKKSLEDKTERE-----LL . .. :. .: .::.. .. ..:. : .. ... : . : CCDS12 YITGPGVTTYKAVIQYSCEETFYTMKV-NDGKYVCEADGFWTSSKGEKSLPVCEPVCGLS 380 390 400 410 420 430 360 370 380 390 400 410 pF1KE2 ESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCGASLISDRWVLTAAHCLLYPPWDKN ::: :. :. : ::::... . :: :. : ::::::: . .... CCDS12 ARTTGGRIYGGQKAKPGDFPWQVLILGGTTAA---GA-LLYDNWVLTAAHAV----YEQK 440 450 460 470 480 420 430 440 450 460 470 pF1KE2 FTENDLLVRIGKHSRTRYERNIEKISMLEKIYIHPRYNWRENLDRDIALMKLKKPVAFSD . : .:.: .: . . . : ..:: :. ..: ::::.::.. :.... CCDS12 HDASALDIRMGTLKRLSPHYTQ---AWSEAVFIHEGYTHDAGFDNDIALIKLNNKVVINS 490 500 510 520 530 540 480 490 500 510 520 530 pF1KE2 YIHPVCLPDRETAASLLQAGYKGRVTGWGNLKETWTANVGKGQPSVLQVVNLPIVERPVC : :.::: :. : :.... : ..::: .. . : :. :..:::.. : CCDS12 NITPICLP-RKEAESFMRTDDIGTASGWGLTQRGFLARN-------LMYVDIPIVDHQKC 550 560 570 580 590 540 550 560 570 580 590 pF1KE2 KDS------TRIRITDNMFCAGYKPDEGKRGDACEGDSGGPFVMKSPFNNRWYQMGIVSW . : .: ::.::: . :: :.:.::::: .:. . ..::. ::::: CCDS12 TAAYEKPPYPRGSVTANMLCAGLESG-GK--DSCRGDSGGALVFLDSETERWFVGGIVSW 600 610 620 630 640 650 600 610 620 pF1KE2 GE-GCDRDGKYGFYTHVFRLKKWIQKVIDQFGE : .: . :.:: ::.:. ::...:..: CCDS12 GSMNCGEAGQYGVYTKVINYIPWIENIISDF 660 670 680 >>CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 (343 aa) initn: 509 init1: 117 opt: 416 Z-score: 467.1 bits: 95.7 E(32554): 1.1e-19 Smith-Waterman score: 542; 36.1% identity (62.8% similar) in 266 aa overlap (363-620:44-288) 340 350 360 370 380 390 pF1KE2 EADCGLRPLFEKKSLEDKTERELLESYIDGRIVEGSDAEIGMSPWQVMLFRKSPQELLCG ::. ::.: :. :::: . .. . .:: CCDS45 AVAILLYLGLLRSGTGAEGAEAPCGVAPQARITGGSSAVAGQWPWQVSITYEGVH--VCG 20 30 40 50 60 70 400 410 420 430 440 450 pF1KE2 ASLISDRWVLTAAHCLLYPPWDKNFTENDLLVRIGKHSRTRYERNIEKISMLEKIYIHPR .::.:..:::.:::: .: .. .. :..: :. : .. :.: :. : :: CCDS45 GSLVSEQWVLSAAHC--FP---SEHHKEAYEVKLGAHQLDSYSEDA-KVSTLKDIIPHPS 80 90 100 110 120 460 470 480 490 500 510 pF1KE2 YNWRENLDRDIALMKLKKPVAFSDYIHPVCLPDRETAASLLQAGYKGRVTGWGNLKETWT : .:. . ::::..:..:..:: ::.:.::: .: . . : . :::::.. . CCDS45 Y-LQEGSQGDIALLQLSRPITFSRYIRPICLP---AANASFPNGLHCTVTGWGHVAPS-- 130 140 150 160 170 520 530 540 550 560 pF1KE2 ANVGKGQPSVLQVVNLPIVERPVCKDSTRIR--------ITDNMFCAGYKPDEGKRGDAC :. :. :: ...:.. : .:. : . ..: :::: :: . ::: CCDS45 --VSLLTPKPLQQLEVPLISRETCNCLYNIDAKPEEPHFVQEDMVCAGYV--EGGK-DAC 180 190 200 210 220 230 570 580 590 600 610 620 pF1KE2 EGDSGGPFVMKSPFNNRWYQMGIVSWGEGCDRDGKYGFYTHVFRLKKWIQKVIDQFGE .:::::: .. : .. :: ::::::..: .. : :: . .:::. . .. CCDS45 QGDSGGP--LSCPVEGLWYLTGIVSWGDACGARNRPGVYTLASSYASWIQSKVTELQPRV 240 250 260 270 280 290 CCDS45 VPQTQESQPDSNLCGSHLAFSSAPAQGLLRPILFLPLGLALGLLSPWLSEH 300 310 320 330 340 622 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 09:42:19 2016 done: Sun Nov 6 09:42:20 2016 Total Scan time: 3.550 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]