FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7214, 293 aa 1>>>pF1KB7214 293 - 293 aa - 293 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4815+/-0.000722; mu= 11.7228+/- 0.044 mean_var=112.0789+/-22.354, 0's: 0 Z-trim(114.1): 171 B-trim: 537 in 1/49 Lambda= 0.121147 statistics sampled from 14471 (14644) to 14471 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.786), E-opt: 0.2 (0.45), width: 16 Scan time: 2.790 The best scores are: opt bits E(32554) CCDS46816.1 PRSS42 gene_id:339906|Hs108|chr3 ( 293) 2063 370.5 8.5e-103 CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 607 116.0 3.9e-26 CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 601 115.0 7.7e-26 CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 ( 290) 600 114.8 7.9e-26 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 596 114.3 2.4e-25 CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 577 110.7 1.2e-24 CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 564 108.7 1e-23 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 566 109.1 1.1e-23 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 566 109.1 1.1e-23 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 552 106.4 2.9e-23 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 553 106.8 4.3e-23 CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 546 105.3 5.3e-23 CCDS5976.1 PRSS55 gene_id:203074|Hs108|chr8 ( 352) 543 104.9 9.2e-23 CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 543 104.9 1e-22 CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 543 104.9 1.1e-22 CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 543 104.9 1.1e-22 CCDS44881.1 TMPRSS12 gene_id:283471|Hs108|chr12 ( 348) 541 104.5 1.2e-22 CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 537 103.8 1.8e-22 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 536 103.7 2.8e-22 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 536 103.8 2.9e-22 CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 ( 317) 525 101.7 7.5e-22 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 522 101.1 9.3e-22 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 521 101.1 1.8e-21 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 521 101.2 1.9e-21 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 521 101.2 1.9e-21 CCDS32489.1 CTRB2 gene_id:440387|Hs108|chr16 ( 263) 507 98.5 5.7e-21 CCDS32490.1 CTRB1 gene_id:1504|Hs108|chr16 ( 263) 507 98.5 5.7e-21 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 509 99.0 6.9e-21 CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 506 98.3 7e-21 CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 506 98.4 8.9e-21 CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 506 98.4 9.5e-21 CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 506 98.5 9.6e-21 CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 506 98.5 9.6e-21 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 501 97.6 1.8e-20 CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 505 98.5 2.1e-20 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 500 97.6 2.9e-20 CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 496 96.7 3.1e-20 CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 490 95.5 4.6e-20 CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 492 96.0 5.1e-20 CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 491 95.9 7.6e-20 CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 463 90.8 1.2e-18 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 468 92.1 1.9e-18 CCDS10432.1 TPSD1 gene_id:23430|Hs108|chr16 ( 242) 456 89.5 2.6e-18 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 462 91.0 3.6e-18 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 462 91.0 3.9e-18 CCDS2145.1 PROC gene_id:5624|Hs108|chr2 ( 461) 449 88.5 1e-17 CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 444 87.5 1.2e-17 CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 ( 314) 445 87.7 1.2e-17 CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 439 86.7 3.1e-17 CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 439 86.7 3.1e-17 >>CCDS46816.1 PRSS42 gene_id:339906|Hs108|chr3 (293 aa) initn: 2063 init1: 2063 opt: 2063 Z-score: 1959.0 bits: 370.5 E(32554): 8.5e-103 Smith-Waterman score: 2063; 100.0% identity (100.0% similar) in 293 aa overlap (1-293:1-293) 10 20 30 40 50 60 pF1KB7 MSSGGGSRGLLAWLLLLQPWPGQNWAGMAAPRLPSPLLSEEGGENPEASPAPGPEAGPPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MSSGGGSRGLLAWLLLLQPWPGQNWAGMAAPRLPSPLLSEEGGENPEASPAPGPEAGPPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 NLFTSFPGDSLLCGRTPLRIVGGVDAEEGRWPWQVSVRTKGRHICGGTLVTATWVLTAGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 NLFTSFPGDSLLCGRTPLRIVGGVDAEEGRWPWQVSVRTKGRHICGGTLVTATWVLTAGH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 CISSRFHYSVKMGDRSVYNENTSVVVSVQRAFVHPKFSTVTTIRNDLALLQLQHPVNFTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 CISSRFHYSVKMGDRSVYNENTSVVVSVQRAFVHPKFSTVTTIRNDLALLQLQHPVNFTS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 NIQPICIPQENFQVEGRTRCWVTGWGKTPEREKLASEILQDVDQYIMCYEECNKIIQKAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 NIQPICIPQENFQVEGRTRCWVTGWGKTPEREKLASEILQDVDQYIMCYEECNKIIQKAL 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 SSTKDVIIKGMVCGYKEQGKDSCQGDSGGRLACEYNDTWVQVGIVSWGIGCGR ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SSTKDVIIKGMVCGYKEQGKDSCQGDSGGRLACEYNDTWVQVGIVSWGIGCGR 250 260 270 280 290 >>CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 (343 aa) initn: 545 init1: 223 opt: 607 Z-score: 582.8 bits: 116.0 E(32554): 3.9e-26 Smith-Waterman score: 607; 40.8% identity (66.7% similar) in 228 aa overlap (73-292:37-263) 50 60 70 80 90 100 pF1KB7 GENPEASPAPGPEAGPPLNLFTSFPGDSLLCGRTPL-RIVGGVDAEEGRWPWQVSVRTKG :: .: ::.:: .: :.::::::. .: CCDS45 LGPGQLGAVAILLYLGLLRSGTGAEGAEAPCGVAPQARITGGSSAVAGQWPWQVSITYEG 10 20 30 40 50 60 110 120 130 140 150 pF1KB7 RHICGGTLVTATWVLTAGHCISSRFH---YSVKMGDRSVYNENTSVVVSVQRAFV-HPKF :.:::.::. :::.:.::. :. : : ::.: ... . . .. ::. . .. ::.. CCDS45 VHVCGGSLVSEQWVLSAAHCFPSEHHKEAYEVKLGAHQLDSYSEDAKVSTLKDIIPHPSY 70 80 90 100 110 120 160 170 180 190 200 210 pF1KB7 STVTTIRNDLALLQLQHPVNFTSNIQPICIPQENFQVEGRTRCWVTGWGKT-PEREKLAS . ..:.:::::..:..:. :.:::.: : . . .: :::::.. : :. CCDS45 LQEGS-QGDIALLQLSRPITFSRYIRPICLPAANASFPNGLHCTVTGWGHVAPSVSLLTP 130 140 150 160 170 180 220 230 240 250 260 270 pF1KB7 EILQDVDQYIMCYEECNKIIQ-KALSSTKDVIIKGMVC-GYKEQGKDSCQGDSGGRLACE . ::... .. : :: . . : . . ::: :: : :::.::::::: :.: CCDS45 KPLQQLEVPLISRETCNCLYNIDAKPEEPHFVQEDMVCAGYVEGGKDACQGDSGGPLSCP 190 200 210 220 230 240 280 290 pF1KB7 YNDTWVQVGIVSWGIGCGR . : .:::::: .:: CCDS45 VEGLWYLTGIVSWGDACGARNRPGVYTLASSYASWIQSKVTELQPRVVPQTQESQPDSNL 250 260 270 280 290 300 >>CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 (328 aa) initn: 459 init1: 292 opt: 601 Z-score: 577.4 bits: 115.0 E(32554): 7.7e-26 Smith-Waterman score: 601; 39.7% identity (65.1% similar) in 252 aa overlap (53-293:2-246) 30 40 50 60 70 pF1KB7 QNWAGMAAPRLPSPLLSEEGGENPEASPAPGPEAGPPLNLFTSFPGDSLLCGRTPL---R :: :: ..:. . : :. ::. :. : CCDS47 MGP-AGCAFTLLLLL-GISV-CGQ-PVYSSR 10 20 80 90 100 110 120 130 pF1KB7 IVGGVDAEEGRWPWQVSVRTKGRHICGGTLVTATWVLTAGHCIS---SRFHYSVKMGDRS .::: :: ::::::::.. ::::.::. .:::.:::. . : :.: .:. . CCDS47 VVGGQDAAAGRWPWQVSLHFDHNFICGGSLVSERLILTAAHCIQPTWTTFSYTVWLGSIT 30 40 50 60 70 80 140 150 160 170 180 190 pF1KB7 VYNENTSVVVSVQRAFVHPKFSTVTTIRNDLALLQLQHPVNFTSNIQPICIPQENFQVEG : . : :.. .:::.. .:. :.:::.:. :.::: : :::.:. . :. CCDS47 VGDSRKRVKYYVSKIVIHPKYQDTTA---DVALLKLSSQVTFTSAILPICLPSVTKQLAI 90 100 110 120 130 140 200 210 220 230 240 250 pF1KB7 RTRCWVTGWGKTPER-EKLASEILQDVDQYIMCYEECNKIIQKA---LSSTKDVIIKGMV ::::::::. : .. ::... :. . :... . : . . :: . . CCDS47 PPFCWVTGWGKVKESSDRDYHSALQEAEVPIIDRQACEQLYNPIGIFLPALEPVIKEDKI 150 160 170 180 190 200 260 270 280 290 pF1KB7 C-GYKEQGKDSCQGDSGGRLACEYNDTWVQVGIVSWGIGCGR : : .. ::::.::::: :.:. . .:.:.:.::::. ::. CCDS47 CAGDTQNMKDSCKGDSGGPLSCHIDGVWIQTGVVSWGLECGKSLPGVYTNVIYYQKWINA 210 220 230 240 250 260 CCDS47 TISRANNLDFSDFLFPIVLLSLALLRPSCAFGPNTIHRVGTVAEAVACIQGWEENAWRFS 270 280 290 300 310 320 >>CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 (290 aa) initn: 544 init1: 225 opt: 600 Z-score: 577.2 bits: 114.8 E(32554): 7.9e-26 Smith-Waterman score: 600; 37.9% identity (66.0% similar) in 253 aa overlap (56-293:5-255) 30 40 50 60 70 pF1KB7 AGMAAPRLPSPLLSEEGGENPEASPAPGPEAGPPLNLFTSFPGD----SLLCGRTPL--R :. :: :. : .. . ::: . : CCDS10 MRRPAAVPLLLLLCFGSQRAKAATACGRPRMLNR 10 20 30 80 90 100 110 120 130 pF1KB7 IVGGVDAEEGRWPWQVSVRTKGRHICGGTLVTATWVLTAGHCI---SSRFHYSVKMGDRS .::: :..::.::::::.. .: :.:::.:.. :::::.::. : :.: .: :. CCDS10 MVGGQDTQEGEWPWQVSIQRNGSHFCGGSLIAEQWVLTAAHCFRNTSETSLYQVLLGARQ 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB7 VYNENTSVVVS-VQRAFVHPKFSTVTTIRNDLALLQLQHPVNFTSNIQPICIPQENFQVE . . . .. . :... .: .. ... :.::..:. :: ::. : :.:.:. . : CCDS10 LVQPGPHAMYARVRQVESNPLYQGTAS-SADVALVELEAPVPFTNYILPVCLPDPSVIFE 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB7 GRTRCWVTGWGKTPEREKLASE--ILQDVDQYIMCYEECNKIIQK--ALSSTKDVIIKGM ::::::: .: .: : : ::: . :. .:: . .: .. .: . : CCDS10 TGMNCWVTGWG-SPSEEDLLPEPRILQKLAVPIIDTPKCNLLYSKDTEFGYQPKTIKNDM 160 170 180 190 200 210 260 270 280 290 pF1KB7 VC-GYKEQGKDSCQGDSGGRLACEYNDTWVQVGIVSWGIGCGR .: :..: ::.:.::::: :.: ...:.:.:..::: ::.: CCDS10 LCAGFEEGKKDACKGDSGGPLVCLVGQSWLQAGVISWGEGCARQNRPGVYIRVTAHHNWI 220 230 240 250 260 270 CCDS10 HRIIPKLQFQPARLGGQK 280 290 >>CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 (638 aa) initn: 477 init1: 204 opt: 596 Z-score: 568.6 bits: 114.3 E(32554): 2.4e-25 Smith-Waterman score: 596; 38.9% identity (64.9% similar) in 265 aa overlap (38-293:351-604) 10 20 30 40 50 60 pF1KB7 RGLLAWLLLLQPWPGQNWAGMAAPRLPSPLLSEEGGENPEASPAPGPEAGPPLNLFTSFP :: .:. . : . : .: : : .. CCDS34 TCTKMIRCQFFTYSLLPEDCKEEKCKCFLRLSMDGSPTRIAYGTQGS-SGYSLRLCNT-- 330 340 350 360 370 70 80 90 100 110 120 pF1KB7 GDSLLCG-RTPLRIVGGVDAEEGRWPWQVSVRTK---GRHICGGTLVTATWVLTAGHCIS ::. .: .: :::::... :.::::::...: ::.:::.:. :::::.::.. CCDS34 GDNSVCTTKTSTRIVGGTNSSWGEWPWQVSLQVKLTAQRHLCGGSLIGHQWVLTAAHCFD 380 390 400 410 420 430 130 140 150 160 170 pF1KB7 SRFHYSVKMGDRSVYN----ENTSVVVSVQRAFVHPKFSTVTTIRNDLALLQLQHPVNFT . .: .. : . . .... ..: ... :. .:.::..:: :.:.: CCDS34 GLPLQDVWRIYSGILNLSDITKDTPFSQIKEIIIHQNYK-VSEGNHDIALIKLQAPLNYT 440 450 460 470 480 490 180 190 200 210 220 230 pF1KB7 SNIQPICIPQENFQVEGRTRCWVTGWGKTPEREKLASEILQDVDQYIMCYEECNKIIQKA .:::.:... : ::::::: . :. .. ..::: :. .. ::: :: CCDS34 EFQKPICLPSKGDTSTIYTNCWVTGWGFSKEKGEI-QNILQKVNIPLVTNEEC----QKR 500 510 520 530 540 550 240 250 260 270 280 290 pF1KB7 LSSTKDVIIKGMVC-GYKEQGKDSCQGDSGGRLACEYNDTWVQVGIVSWGIGCGR .. : : . ::: :::: :::.:.::::: :.:..: : :::.::: ::.: CCDS34 YQDYK--ITQRMVCAGYKEGGKDACKGDSGGPLVCKHNGMWRLVGITSWGEGCARREQPG 560 570 580 590 600 CCDS34 VYTKVAEYMDWILEKTQSSDGKAQMQSPA 610 620 630 >>CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 (280 aa) initn: 536 init1: 227 opt: 577 Z-score: 555.7 bits: 110.7 E(32554): 1.2e-24 Smith-Waterman score: 577; 38.4% identity (64.2% similar) in 232 aa overlap (70-291:25-255) 40 50 60 70 80 90 pF1KB7 EEGGENPEASPAPGPEAGPPLNLFTSFPGDSLLCG--RTPLRIVGGVDAEEGRWPWQVSV : :: : ::::: :...:.::::.:. CCDS42 MRGVSCLQVLLLLVLGAAGTQGRKSAACGQPRMSSRIVGGRDGRDGEWPWQASI 10 20 30 40 50 100 110 120 130 140 150 pF1KB7 RTKGRHICGGTLVTATWVLTAGHCISSRF---HYSVKMGDRSVYNENT-SVVVSVQRAFV . .: :.:::.:.. :::::.::. : .: :..: . . . .. : :.:... CCDS42 QHRGAHVCGGSLIAPQWVLTAAHCFPRRALPAEYRVRLGALRLGSTSPRTLSVPVRRVLL 60 70 80 90 100 110 160 170 180 190 200 210 pF1KB7 HPKFSTVTTIRNDLALLQLQHPVNFTSNIQPICIPQENFQVEGRTRCWVTGWGKTPEREK : .: :.:::::::..:: ... .::.:.: . . : : :::::. CCDS42 PPDYSE-DGARGDLALLQLRRPVPLSARVQPVCLPVPGARPPPGTPCRVTGWGSLRPGVP 120 130 140 150 160 170 220 230 240 250 260 pF1KB7 LAS-EILQDVDQYIMCYEECNKI--IQKALSSTKDVIIKGMVC-GYKEQGKDSCQGDSGG : . :: : .. . :. . . . ... ... : .: :: . ::.::::::: CCDS42 LPEWRPLQGVRVPLLDSRTCDGLYHVGADVPQAERIVLPGSLCAGYPQGHKDACQGDSGG 180 190 200 210 220 230 270 280 290 pF1KB7 RLACEYNDTWVQVGIVSWGIGCGR :.: . .:: ::.:::: :: CCDS42 PLTCLQSGSWVLVGVVSWGKGCALPNRPGVYTSVATYSPWIQARVSF 240 250 260 270 280 >>CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 (565 aa) initn: 550 init1: 214 opt: 564 Z-score: 539.1 bits: 108.7 E(32554): 1e-23 Smith-Waterman score: 564; 37.1% identity (67.4% similar) in 221 aa overlap (79-293:51-267) 50 60 70 80 90 100 pF1KB7 SPAPGPEAGPPLNLFTSFPGDSLLCGRTPLRIVGGVDAEEGRWPWQVSVRTKGRHICGGT ::.:: ..:.: .:::::.. . .:::::. CCDS73 KSATLSLPKAPSCGQSLVKVQPWNYFNIFSRILGGSQVEKGSYPWQVSLKQRQKHICGGS 30 40 50 60 70 80 110 120 130 140 150 160 pF1KB7 LVTATWVLTAGHCISSRFHYS---VKMGDRSVYNENTSV-VVSVQRAFVHPKFSTVTTIR .:. ::.::.:::..: : : :. .. . . . ..... ...::.::: . CCDS73 IVSPQWVITAAHCIANRNIVSTLNVTAGEYDLSQTDPGEQTLTIETVIIHPHFSTKKPMD 90 100 110 120 130 140 170 180 190 200 210 220 pF1KB7 NDLALLQLQHPVNFTSNIQPICIPQENFQVEGRTRCWVTGWGKTPEREKLASEILQDVDQ :.:::.. .: . :::.:. : :. : ..:::. : : :..::.:. CCDS73 YDIALLKMAGAFQFGHFVGPICLPELREQFEAGFICTTAGWGRLTEGGVL-SQVLQEVNL 150 160 170 180 190 230 240 250 260 270 280 pF1KB7 YIMCYEECNKIIQKALSSTKDVIIKGMVC-GYKEQGKDSCQGDSGGRLACEYND-TWVQV :. .::: . :. . . : ..: :. . :.:.::::::: : :. . .:. . CCDS73 PILTWEEC---VAALLTLKRPISGKTFLCTGFPDGGRDACQGDSGGSLMCRNKKGAWTLA 200 210 220 230 240 250 290 pF1KB7 GIVSWGIGCGR :..:::.:::: CCDS73 GVTSWGLGCGRGWRNNVRKSDQGSPGIFTDISKVLPWIHEHIQTGNRRKSSRAWCSEQDV 260 270 280 290 300 310 >>CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 (802 aa) initn: 538 init1: 220 opt: 566 Z-score: 538.8 bits: 109.1 E(32554): 1.1e-23 Smith-Waterman score: 566; 38.2% identity (65.2% similar) in 233 aa overlap (73-293:559-780) 50 60 70 80 90 100 pF1KB7 GENPEASPAPGPEAGPPLNLFTSFPGDSLLCG-RTPL-RIVGGVDAEEGRWPWQVSVRTK :: . : :::::. . ::.::::.:.... CCDS74 CEDRSCVKKPNPQCDGRPDCRDGSDEEHCDCGLQGPSSRIVGGAVSSEGEWPWQASLQVR 530 540 550 560 570 580 110 120 130 140 150 pF1KB7 GRHICGGTLVTATWVLTAGHC-----ISSRFHYSVKMGDRSVYNENT---SVVVSVQRAF :::::::.:.. ::.::.:: ..: ..: .: .:.... : .:.: . CCDS74 GRHICGGALIADRWVITAAHCFQEDSMASTVLWTVFLG--KVWQNSRWPGEVSFKVSRLL 590 600 610 620 630 640 160 170 180 190 200 210 pF1KB7 VHPKFSTVTTIRNDLALLQLQHPVNFTSNIQPICIPQENFQVEGRTRCWVTGWGKTPERE .:: . . :.:::::.::: .. ..:.:.: .. : .::.:::: : CCDS74 LHP-YHEEDSHDYDVALLQLDHPVVRSAAVRPVCLPARSHFFEPGLHCWITGWGALREGG 650 660 670 680 690 700 220 230 240 250 260 270 pF1KB7 KLASEILQDVDQYIMCYEECNKIIQKALSSTKDVIIKGMVC-GYKEQGKDSCQGDSGGRL . :. :: :: .. . :... . .. :.: ::.. ::.::::::: : CCDS74 PI-SNALQKVDVQLIPQDLCSEVYRYQVTPR-------MLCAGYRKGKKDACQGDSGGPL 710 720 730 740 750 280 290 pF1KB7 ACE-YNDTWVQVGIVSWGIGCGR .:. . : .:.::::.:::: CCDS74 VCKALSGRWFLAGLVSWGLGCGRPNYFGVYTRITGVISWIQQVVT 760 770 780 790 800 >>CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 (811 aa) initn: 538 init1: 220 opt: 566 Z-score: 538.8 bits: 109.1 E(32554): 1.1e-23 Smith-Waterman score: 566; 38.2% identity (65.2% similar) in 233 aa overlap (73-293:568-789) 50 60 70 80 90 100 pF1KB7 GENPEASPAPGPEAGPPLNLFTSFPGDSLLCG-RTPL-RIVGGVDAEEGRWPWQVSVRTK :: . : :::::. . ::.::::.:.... CCDS13 CEDRSCVKKPNPQCDGRPDCRDGSDEEHCDCGLQGPSSRIVGGAVSSEGEWPWQASLQVR 540 550 560 570 580 590 110 120 130 140 150 pF1KB7 GRHICGGTLVTATWVLTAGHC-----ISSRFHYSVKMGDRSVYNENT---SVVVSVQRAF :::::::.:.. ::.::.:: ..: ..: .: .:.... : .:.: . CCDS13 GRHICGGALIADRWVITAAHCFQEDSMASTVLWTVFLG--KVWQNSRWPGEVSFKVSRLL 600 610 620 630 640 650 160 170 180 190 200 210 pF1KB7 VHPKFSTVTTIRNDLALLQLQHPVNFTSNIQPICIPQENFQVEGRTRCWVTGWGKTPERE .:: . . :.:::::.::: .. ..:.:.: .. : .::.:::: : CCDS13 LHP-YHEEDSHDYDVALLQLDHPVVRSAAVRPVCLPARSHFFEPGLHCWITGWGALREGG 660 670 680 690 700 710 220 230 240 250 260 270 pF1KB7 KLASEILQDVDQYIMCYEECNKIIQKALSSTKDVIIKGMVC-GYKEQGKDSCQGDSGGRL . :. :: :: .. . :... . .. :.: ::.. ::.::::::: : CCDS13 PI-SNALQKVDVQLIPQDLCSEVYRYQVTPR-------MLCAGYRKGKKDACQGDSGGPL 720 730 740 750 760 280 290 pF1KB7 ACE-YNDTWVQVGIVSWGIGCGR .:. . : .:.::::.:::: CCDS13 VCKALSGRWFLAGLVSWGLGCGRPNYFGVYTRITGVISWIQQVVT 770 780 790 800 810 >>CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 (321 aa) initn: 538 init1: 210 opt: 552 Z-score: 531.2 bits: 106.4 E(32554): 2.9e-23 Smith-Waterman score: 552; 38.1% identity (60.7% similar) in 247 aa overlap (56-293:13-248) 30 40 50 60 70 80 pF1KB7 AGMAAPRLPSPLLSEEGGENPEASPAPGPEAGPPLNLFTSFPGDSLLCGRTPL-----RI : : ..: : :: ::: . :: CCDS10 MALGACGLLLLLAVPGVSLRTLQPG----CGRPQVSDAGGRI 10 20 30 90 100 110 120 130 pF1KB7 VGGVDAEEGRWPWQVSVRTKGRHICGGTLVTATWVLTAGHCISSRFH---YSVKMGDRSV ::: : : ::::.:.: . :.:::.:.. :::::.::.:. .. :.:..:. . CCDS10 VGGHAAPAGAWPWQASLRLRRVHVCGGSLLSPQWVLTAAHCFSGSLNSSDYQVHLGELEI 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB7 YNENTSVVVSVQRAFVHPKFSTVTTIRNDLALLQLQHPVNFTSNIQPICIPQENFQVEGR . .:.. ..: . : .:.::..:. ::...: : :.:.:. . . CCDS10 --TLSPHFSTVRQIILHSSPSGQPGTSGDIALVELSVPVTLSSRILPVCLPEASDDFCPG 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB7 TRCWVTGWGKTPEREKLASEI-LQDVDQYIMCYEECNKIIQKALSSTKDVIIKGMVCGYK :::::::: : : : : :..: .. : : . .: .. :.:. . CCDS10 IRCWVTGWGYTREGEPLPPPYSLREVKVSVVDTETCRRDYPGPGGS---ILQPDMLCA-R 160 170 180 190 200 210 260 270 280 290 pF1KB7 EQGKDSCQGDSGGRLACEYNDTWVQVGIVSWGIGCGR : :.:: :::: :.:. : .:::.: :::: :::: CCDS10 GPG-DACQDDSGGPLVCQVNGAWVQAGTVSWGEGCGRPNRPGVYTRVPAYVNWIRRHITA 220 230 240 250 260 270 CCDS10 SGGSESGYPRLPLLAGFFLPGLFLLLVSCVLLAKCLLHPSADGTPFPAPD 280 290 300 310 320 293 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 21:00:06 2016 done: Sat Nov 5 21:00:06 2016 Total Scan time: 2.790 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]