FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0196, 416 aa 1>>>pF1KE0196 416 - 416 aa - 416 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9454+/-0.00101; mu= 12.9796+/- 0.060 mean_var=61.9022+/-12.493, 0's: 0 Z-trim(103.2): 176 B-trim: 383 in 1/48 Lambda= 0.163013 statistics sampled from 7114 (7295) to 7114 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.578), E-opt: 0.2 (0.224), width: 16 Scan time: 2.570 The best scores are: opt bits E(32554) CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 2792 665.5 2.6e-191 CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 418) 1122 272.8 4.4e-73 CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 421) 1113 270.7 1.9e-72 CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 1095 266.4 3.6e-71 CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 1077 262.2 6.7e-70 CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 898 220.1 3.3e-57 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 737 182.2 8.5e-46 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 727 179.9 4.3e-45 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 684 169.8 5.2e-42 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 684 169.8 5.6e-42 CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 666 165.5 9.1e-41 CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 660 164.1 2.2e-40 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 663 164.9 2.3e-40 CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 660 164.1 2.4e-40 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 645 160.6 2e-39 CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 641 159.6 3.5e-39 CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 641 159.7 4.7e-39 CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 641 159.7 5.1e-39 CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 641 159.7 5.1e-39 CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 641 159.7 5.1e-39 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 644 160.4 7.4e-39 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 642 159.9 7.9e-39 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 642 159.9 7.9e-39 CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 641 159.7 1.2e-38 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 637 158.7 1.4e-38 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 619 154.5 3.9e-37 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 619 154.5 4.3e-37 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 595 148.9 1.3e-35 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 592 148.1 1.8e-35 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 592 148.1 1.9e-35 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 592 148.1 1.9e-35 CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 589 147.4 3.4e-35 CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 580 145.3 6.7e-35 CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 559 140.4 6e-33 CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 556 139.7 1e-32 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 536 134.9 8.5e-32 CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 534 134.5 1.5e-31 CCDS32490.1 CTRB1 gene_id:1504|Hs108|chr16 ( 263) 525 132.4 5.1e-31 CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 525 132.4 5.2e-31 CCDS82945.1 CFI gene_id:3426|Hs108|chr4 ( 576) 521 131.4 2.1e-30 CCDS34049.1 CFI gene_id:3426|Hs108|chr4 ( 583) 521 131.4 2.1e-30 CCDS82946.1 CFI gene_id:3426|Hs108|chr4 ( 591) 521 131.4 2.2e-30 CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 513 129.5 3.7e-30 CCDS5976.1 PRSS55 gene_id:203074|Hs108|chr8 ( 352) 514 129.8 4.1e-30 CCDS32489.1 CTRB2 gene_id:440387|Hs108|chr16 ( 263) 508 128.4 8.2e-30 CCDS73390.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 344) 497 125.8 6.4e-29 CCDS73393.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 388) 497 125.8 7.2e-29 CCDS44881.1 TMPRSS12 gene_id:283471|Hs108|chr12 ( 348) 489 123.9 2.4e-28 CCDS83235.1 PRSS2 gene_id:5645|Hs108|chr7 ( 261) 486 123.2 2.9e-28 CCDS83495.1 F9 gene_id:2158|Hs108|chrX ( 423) 483 122.5 7.6e-28 >>CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 (416 aa) initn: 2792 init1: 2792 opt: 2792 Z-score: 3548.2 bits: 665.5 E(32554): 2.6e-191 Smith-Waterman score: 2792; 99.3% identity (99.8% similar) in 416 aa overlap (1-416:1-416) 10 20 30 40 50 60 pF1KE0 MYRHGISSQRSWPLWTTIFIFLGVAAILGVTIGLLVHFLAVEKTYYYQGDFHISGVTYND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MYRHGISSQRSWPLWTTIFIFLGVAAILGVTIGLLVHFLAVEKTYYYQGDFHISGVTYND 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 NCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQLQLKFKFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 NCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQLQLKFKFP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 PAEGVSMRTKIKAKLHQMLKNNMASWNAVPASIKLMEISKAASEMLTNNCCGRQVANSII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PAEGVSMRTKIKAKLHQMLKNNMASWNAVPASIKLMEISKAASEMLTNNCCGRQVANSII 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 TGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAKKNNSKDWTVNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAKKNNSKDWTVNF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 GVVVNKPYMTRKVQNIIFHENYSSPGLHDDIALVQLAEEVSFTEYIRKICLPEAKMKLSE :.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GIVVNKPYMTRKVQNIIFHENYSSPGLHDDIALVQLAEEVSFTEYIRKICLPEAKMKLSE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 NDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNASYAYSGFVTDSMLCAGFMSGEAD :::::::::::::::::::::::: ::::::::::::::::::::::.:::::::::::: CCDS35 NDNVVVTGWGTLYMNGSFPVILQEDFLKIIDNKICNASYAYSGFVTDTMLCAGFMSGEAD 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 ACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNWITSKTGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNWITSKTGL 370 380 390 400 410 >>CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 (418 aa) initn: 925 init1: 842 opt: 1122 Z-score: 1425.6 bits: 272.8 E(32554): 4.4e-73 Smith-Waterman score: 1122; 40.7% identity (73.3% similar) in 423 aa overlap (1-416:2-418) 10 20 30 40 50 pF1KE0 MYR---HGISSQRSWPLWTTIFIFLGVAAILGVTIGLLVHFLAVE-KTYYYQGDFHISG ::: : :. : ...: :... ...::::::::::. . : ::.:.:.: CCDS47 MMYRTVGFGTRSRNLKPWMIAVLIVLSLT-VVAVTIGLLVHFLVFDQKKEYYHGSFKILD 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 VTYNDNCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQLQL :.: .. . .: . :. . . : .:. :.:.:..:..: :. .: .:.. . CCDS47 PQINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDVIM 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 KFKFPPAEGVSMRTKIKAKLHQMLKNNMASWNAVP---ASIKLMEISKAASEMLTNNCCG :.:: .: ..: : :....:.... . :.: .:... .:....:. .. :: CCDS47 VFQFPSTEQRAVREK---KIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQASCG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 RQVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAKKNN ..:. . :.:..: . ..:::::::.:. . : :::.:::. ::..::::: : .: CCDS47 KRVVPLNV--NRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 SKDWTVNFGVVVNKPYMTRKVQNIIFHENYSSPGLHDDIALVQLAEEVSFTEYIRKICLP ..:::.::. .: : : :.:. .:.::.: : . . :::.::.. .:.:.. ::.:::: CCDS47 PHQWTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRQICLP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 EAKMKLSENDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNASYAYSGFVTDSMLCA ::. ... : .: .::.:.::..: :.:: .:::.. .:. .:.. . .:.:: CCDS47 EASASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCA 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 GFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNWITS :.: : :::..::::::. : .. :.:.:::::::.::.:.::::::.:: :::::.: CCDS47 GYMEGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIAS 360 370 380 390 400 410 pF1KE0 KTGL :::. CCDS47 KTGI >>CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 (421 aa) initn: 917 init1: 842 opt: 1113 Z-score: 1414.1 bits: 270.7 E(32554): 1.9e-72 Smith-Waterman score: 1113; 40.4% identity (73.0% similar) in 426 aa overlap (1-416:2-421) 10 20 30 40 50 pF1KE0 MYR---HGISSQRSWPLWTTIFIFLGVAAILGVTIGLLVHFLAVE-KTYYYQGDFHISG ::: : :. : ...: :... ...::::::::::. . : ::.:.:.: CCDS35 MMYRTVGFGTRSRNLKPWMIAVLIVLSLT-VVAVTIGLLVHFLVFDQKKEYYHGSFKILD 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 VTYNDNCENAASQASTNLSKDIE---TKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQ :.: .. . .: . : ... . : .:. :.:.:..:..: :. .: .:. CCDS35 PQINNNFGQSNTYQLKDLRETTENLVSQVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVD 60 70 80 90 100 110 120 130 140 150 160 pF1KE0 LQLKFKFPPAEGVSMRTKIKAKLHQMLKNNMASWNAVP---ASIKLMEISKAASEMLTNN . . :.:: .: ..: : :....:.... . :.: .:... .:....:. .. CCDS35 VIMVFQFPSTEQRAVREK---KIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQA 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE0 CCGRQVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAK ::..:. . :.:..: . ..:::::::.:. . : :::.:::. ::..::::: : CCDS35 SCGKRVVPLNV--NRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE0 KNNSKDWTVNFGVVVNKPYMTRKVQNIIFHENYSSPGLHDDIALVQLAEEVSFTEYIRKI .: ..:::.::. .: : : :.:. .:.::.: : . . :::.::.. .:.:.. ::.: CCDS35 YKNPHQWTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRQI 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE0 CLPEAKMKLSENDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNASYAYSGFVTDSM :::::. ... : .: .::.:.::..: :.:: .:::.. .:. .:.. . .: CCDS35 CLPEASASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGM 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE0 LCAGFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNW .:::.: : :::..::::::. : .. :.:.:::::::.::.:.::::::.:: :::: CCDS35 FCAGYMEGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNW 360 370 380 390 400 410 410 pF1KE0 ITSKTGL :.::::. CCDS35 IASKTGI 420 >>CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 (423 aa) initn: 1000 init1: 874 opt: 1095 Z-score: 1391.2 bits: 266.4 E(32554): 3.6e-71 Smith-Waterman score: 1095; 40.0% identity (67.8% similar) in 423 aa overlap (1-416:2-423) 10 20 30 40 50 pF1KE0 MYRHGISSQRS---WPLWTTIFIFLGVAAILGVTIGLLVHFLAV--EKTYYYQGDFHIS ::: . :. : :. .... .:.: ::: ::.. .::: : . . .. CCDS33 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 GVTYNDNCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQLQ . ::. :..:. .:. . ::: .: . .:.:::.:::. . .: ... CCDS33 TDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHML 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 LKFKFPPAEGVSMRTKI-KAKLHQMLKNNMASWNAVPASIKLMEISKAASEMLTNNCCGR : .: .: :: . ::. :.. .. .. : :.:. .:.:. .. :.::: CCDS33 LICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGT 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 QVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAKKNNS . .... . .::.: :: ::::::.:: : : :::.::.. ::.::::::. .: CCDS33 RRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNP 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE0 KDWTVNFGVVVNKPYMTRKVQNIIFHENYSSPGLHD-DIALVQLAEEVSFTEYIRKICLP ::..:::... : : .. :: ::.:. :. :: ::.:..:. : .:. ....::: CCDS33 ARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPS-HDYDISLAELSSPVPYTNAVHRVCLP 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 EAKMKLSENDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNASYAYSGFVTDSMLCA .:..... .: . :::.:.: .: :..: . .:: :: ::. .: :::: CCDS33 DASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCA 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 GFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNWITS : . :..::::.::::::. :.:.::.:.::::::: :.: ::::::::::. :.:::: CCDS33 GSLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITS 360 370 380 390 400 410 pF1KE0 KTGL :::. CCDS33 KTGI 420 >>CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 (418 aa) initn: 1013 init1: 819 opt: 1077 Z-score: 1368.4 bits: 262.2 E(32554): 6.7e-70 Smith-Waterman score: 1077; 39.0% identity (74.0% similar) in 420 aa overlap (1-416:1-418) 10 20 30 40 50 pF1KE0 MYRHG--ISSQRSWPLWTTIFIFLGVAAILGVTIGLLVHFLAVE-KTYYYQGDFHISGVT ::: . :..: ... :: .. ..::.:::.:::.::: . :.:.:...:.. .: CCDS35 MYRPARVTSTSRFLNPYVVCFIVVAGVVILAVTIALLVYFLAFDQKSYFYRSSFQLLNVE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 YNDNCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQLQLKF ::.. .. :.: .:: ::. . ..:..:.. .......: :: ...: ... .:: CCDS35 YNSQLNSPATQEYRTLSGRIESLITKTFKESNLRNQFIRAHVAKLRQDGSGVRADVVMKF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 KFP-PAEGVSMRTKIKAKLHQMLKNNMASWNAVPASIKLMEISKAASEMLTNNCCGRQVA .: .:.::...:.. :.::: :: .. . :.. ..::.. : :.: : CCDS35 QFTRNNNGASMKSRIESVLRQML-NNSGNLEINPSTEITSLTDQAAANWLINEC-GAGPD 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 NSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAKKNNSKDW .. ..:..: . ::.::::.:.. .. :.::.:::.. :.:.::::: ...: .:: CCDS35 LITLSEQRILGGTEAEEGSWPWQVSLRLNNAHHCGGSLINNMWILTAAHCFRSNSNPRDW 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 TVNFGVVVNKPYMTRKVQNIIFHENYSSPGLHDDIALVQLAEEVSFTEYIRKICLPEAKM .. :. .. : . .:.::..:.::.: ..:::::.: . :.::. :...::: : . CCDS35 IATSGISTTFPKLRMRVRNILIHNNYKSATHENDIALVRLENSVTFTKDIHSVCLPAATQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 KLSENDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNASYAYSGFVTDSMLCAGFMS .. .... :::::. . : :... ..::.: .::: ..:.: . ..::::: . CCDS35 NIPPGSTAYVTGWGAQEYAGHTVPELRQGQVRIISNDVCNAPHSYNGAILSGMLCAGVPQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 GEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNWITSKTGL : .::::.::::::. ::: .: .:::::::: :: .:::::::::.: .:: ..::. CCDS35 GGVDACQGDSGGPLVQEDSRRLWFIVGIVSWGDQCGLPDKPGVYTRVTAYLDWIRQQTGI 360 370 380 390 400 410 >>CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 (438 aa) initn: 1013 init1: 544 opt: 898 Z-score: 1140.6 bits: 220.1 E(32554): 3.3e-57 Smith-Waterman score: 1124; 39.7% identity (74.8% similar) in 421 aa overlap (9-416:19-438) 10 20 30 40 pF1KE0 MYRHGISSQRSWPLWTTI---FIFLGVAAILGVTIGLLVHFLAVE-KTYY ::. .: .. .. :...::.:..::...::.. . :..: CCDS35 MMYAPVEFSEAEFSRAEYQRKQQFWDSVRLALFTLAIVAIIGIAIGIVTHFVVEDDKSFY 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 YQGDFHISGVTYNDNCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNA : ..:..... :..: .:. . :..:: : :..::. ...::.:::: :. CCDS35 YLASFKVTNIKYKENYGIRSSREFIERSHQIERMMSRIFRHSSVGGRFIKSHVIKLSPDE 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE0 NGSNVQLQLKFKFPPAEGV-SMRTKIKAKLHQMLKNNMASWNAVPASIKLMEISKAASEM .: .. . : :..: .... ... ::. :.: ::... : . :..: :.. . CCDS35 QGVDILIVLIFRYPSTDSAEQIKKKIEKALYQSLKTKQLSLTINKPSFRLTPIDSKKMRN 130 140 150 160 170 180 170 180 190 200 210 pF1KE0 LTNNCCGRQVANSII------TGNKIVNGK-SSLEGAWPWQASMQWKGR-HYCGASLISS : :. :: ....: . . ..::.:. ...:: ::::::.: : : :::::::. CCDS35 LLNSRCGIRMTSSNMPLPASSSTQRIVQGRETAMEGEWPWQASLQLIGSGHQCGASLISN 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 RWLLSAAHCFAKKNNSKDWTVNFGVVVNKPYMTRKVQNIIFHENYSSPGLHDDIALVQLA :::.::::: :... .: ..::.... : . :.:..::.:::: ..:::::::. CCDS35 TWLLTAAHCFWKNKDPTQWIATFGATITPPAVKRNVRKIILHENYHRETNENDIALVQLS 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 EEVSFTEYIRKICLPEAKMKLSENDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNA : :.. ....:::....:: . .: :::.:.. .: . :..: .. :.. .:: CCDS35 TGVEFSNIVQRVCLPDSSIKLPPKTSVFVTGFGSIVDDGPIQNTLRQARVETISTDVCNR 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 SYAYSGFVTDSMLCAGFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKP . .:.:..: .::::::: :. :::..::::::.: :...::..:::::::..:. .:: CCDS35 KDVYDGLITPGMLCAGFMEGKIDACKGDSGGPLVY-DNHDIWYIVGIVSWGQSCALPKKP 370 380 390 400 410 400 410 pF1KE0 GVYTRVTSYRNWITSKTGL :::::::.::.::.::::. CCDS35 GVYTRVTKYRDWIASKTGM 420 430 >>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa) initn: 559 init1: 312 opt: 737 Z-score: 935.7 bits: 182.2 E(32554): 8.5e-46 Smith-Waterman score: 737; 32.2% identity (66.6% similar) in 410 aa overlap (13-410:45-443) 10 20 30 40 pF1KE0 MYRHGISSQRSWPLWTTIFIFLGVAA-ILGVTIGLLVHFLAV :: .: .:. : ::...::: .:: CCDS58 FRSLFGLDDLKISPVAPDADAVAAQILSLLPLKFFPIIVIGIIALILALAIGLGIHFDCS 20 30 40 50 60 70 50 60 70 80 90 pF1KE0 EKTYYYQGDFH-ISGVTYND---NCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKS : : ...:. : .. : .:... .. . .. .:..: .: .: . .. CCDS58 GK-YRCRSSFKCIELIARCDGVSDCKDGEDEYRC-VRVGGQNAVLQVFTAAS-WKTMCSD 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE0 EVIKLLPNANGSNVQLQLKFKFPPAEGVSMRTKIKAK---LHQMLKNNMASWNAVPASIK . :. ... . . . :.. ... . . ..: .. .. :. :. CCDS58 DWKGHYANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDHLLPDDKVT--ALHHSVY 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 LMEISKAASEMLTNNC--CGRQVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGA . : . :.....: .: ::.. . : ..::.:. :: . ::::::.:..: : ::. CCDS58 VRE-GCASGHVVTLQCTACGHRRGYS----SRIVGGNMSLLSQWPWQASLQFQGYHLCGG 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 SLISSRWLLSAAHCFAKKNNSKDWTVNFGVV--VNKPYMTRKVQNIIFHENYSSPGLHDD :.:. :...:::: :.::.. :.: ...: .. :..:..: .:. : .: CCDS58 SVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAPSHLVEKIVYHSKYKPKRLGND 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 IALVQLAEEVSFTEYIRKICLPEAKMKLSENDNVVVTGWGTLYMNGSFPVILQEAFLKII :::..:: ..:.:.:. .:::... .. .. ..:::. .:. .:..: . .: CCDS58 IALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGGDASPVLNHAAVPLI 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 DNKICNASYAYSGFVTDSMLCAGFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDG .::::: .:.:... ::::::...: .:.::.::::::. . : .:.::: .:.: : CCDS58 SNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQE-RRLWKLVGATSFGIG 370 380 390 400 410 420 400 410 pF1KE0 CGKKNKPGVYTRVTSYRNWITSKTGL :.. :::::::::::. .:: CCDS58 CAEVNKPGVYTRVTSFLDWIHEQMERDLKT 430 440 450 >>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa) initn: 455 init1: 221 opt: 727 Z-score: 923.0 bits: 179.9 E(32554): 4.3e-45 Smith-Waterman score: 727; 32.4% identity (66.2% similar) in 411 aa overlap (13-410:45-444) 10 20 30 40 pF1KE0 MYRHGISSQRSWPLWTTIFIFLGVAA-ILGVTIGLLVHFLAV :: .: .:. : ::...::: .:: CCDS13 FRSLFGLDDLKISPVAPDADAVAAQILSLLPLKFFPIIVIGIIALILALAIGLGIHFDCS 20 30 40 50 60 70 50 60 70 80 90 pF1KE0 EKTYYYQGDFH-ISGVTYND---NCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKS : : ...:. : .. : .:... .. . .. .:..: .: .: . .. CCDS13 GK-YRCRSSFKCIELIARCDGVSDCKDGEDEYRC-VRVGGQNAVLQVFTAAS-WKTMCSD 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE0 EVIKLLPNANGSNVQLQLKFKFPPAEGVSMRTKIKAK---LHQMLKNNMASWNAVPASIK . :. ... . . . :.. ... . . ..: .. .. :. :. CCDS13 DWKGHYANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDHLLPDDKVT--ALHHSVY 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 LMEISKAASEMLTNNC--CGRQVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGA . : . :.....: .: ::.. . : ..::.:. :: . ::::::.:..: : ::. CCDS13 VRE-GCASGHVVTLQCTACGHRRGYS----SRIVGGNMSLLSQWPWQASLQFQGYHLCGG 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 SLISSRWLLSAAHCFAKKNNSKDWTVNFGVV--VNKPYMTRKVQNIIFHENYSSPGLHDD :.:. :...:::: :.::.. :.: ...: .. :..:..: .:. : .: CCDS13 SVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAPSHLVEKIVYHSKYKPKRLGND 250 260 270 280 290 300 280 290 300 310 320 pF1KE0 IALVQLAEEVSFTEYIRKICLPEAKMKLSENDNVVVTGWG-TLYMNGSFPVILQEAFLKI :::..:: ..:.:.:. .:::... .. .. ..::: : :. .:..: . . CCDS13 IALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGAGDASPVLNHAAVPL 310 320 330 340 350 360 330 340 350 360 370 380 pF1KE0 IDNKICNASYAYSGFVTDSMLCAGFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGD :.::::: .:.:... ::::::...: .:.::.::::::. . : .:.::: .:.: CCDS13 ISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQE-RRLWKLVGATSFGI 370 380 390 400 410 420 390 400 410 pF1KE0 GCGKKNKPGVYTRVTSYRNWITSKTGL ::.. :::::::::::. .:: CCDS13 GCAEVNKPGVYTRVTSFLDWIHEQMERDLKT 430 440 450 >>CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 (492 aa) initn: 680 init1: 340 opt: 684 Z-score: 867.7 bits: 169.8 E(32554): 5.2e-42 Smith-Waterman score: 684; 36.4% identity (70.0% similar) in 280 aa overlap (139-410:210-484) 110 120 130 140 150 160 pF1KE0 SNVQLQLKFKFPPAEGVSMRTKIKAKLHQMLKNNMASWNAVPASIKLMEISKAASEMLTN .: : .. : : ::.. . .:. ... CCDS33 YGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGN-VDIYKKLYHSDACSSKAVVS 180 190 200 210 220 230 170 180 190 200 210 220 pF1KE0 -NC--CGRQVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAH : :: .. .: ..::.:.:.: ::::::.:.. .. : ::.:.:. .:...::: CCDS33 LRCIACGVNLNSS--RQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAH 240 250 260 270 280 290 230 240 250 260 270 280 pF1KE0 CFAKK-NNSKDWTVNFGVVVNKPYMTR----KVQNIIFHENYSSPGLHDDIALVQLAEEV : : :: ::. :. .. . .: .:...: : ::.: ..::::..: . . CCDS33 CVEKPLNNPWHWTA-FAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPL 300 310 320 330 340 350 290 300 310 320 330 340 pF1KE0 SFTEYIRKICLPEAKMKLSENDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNASYA .:.. .. .:::. : :. .. ..:::. .:. .:. : . .:... ::. :. CCDS33 TFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKGKTSEVLNAAKVLLIETQRCNSRYV 360 370 380 390 400 410 350 360 370 380 390 400 pF1KE0 YSGFVTDSMLCAGFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVY :....: .:.::::..:..:.::.::::::. .. ::: :.: .:::.::.: .:::: CCDS33 YDNLITPAMICAGFLQGNVDSCQGDSGGPLV-TSKNNIWWLIGDTSWGSGCAKAYRPGVY 420 430 440 450 460 470 410 pF1KE0 TRVTSYRNWITSKTGL : . .:: CCDS33 GNVMVFTDWIYRQMRADG 480 490 >>CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 (529 aa) initn: 680 init1: 340 opt: 684 Z-score: 867.1 bits: 169.8 E(32554): 5.6e-42 Smith-Waterman score: 684; 36.4% identity (70.0% similar) in 280 aa overlap (139-410:247-521) 110 120 130 140 150 160 pF1KE0 SNVQLQLKFKFPPAEGVSMRTKIKAKLHQMLKNNMASWNAVPASIKLMEISKAASEMLTN .: : .. : : ::.. . .:. ... CCDS54 YGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGN-VDIYKKLYHSDACSSKAVVS 220 230 240 250 260 270 170 180 190 200 210 220 pF1KE0 -NC--CGRQVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAH : :: .. .: ..::.:.:.: ::::::.:.. .. : ::.:.:. .:...::: CCDS54 LRCIACGVNLNSS--RQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAH 280 290 300 310 320 330 230 240 250 260 270 280 pF1KE0 CFAKK-NNSKDWTVNFGVVVNKPYMTR----KVQNIIFHENYSSPGLHDDIALVQLAEEV : : :: ::. :. .. . .: .:...: : ::.: ..::::..: . . CCDS54 CVEKPLNNPWHWTA-FAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPL 340 350 360 370 380 390 290 300 310 320 330 340 pF1KE0 SFTEYIRKICLPEAKMKLSENDNVVVTGWGTLYMNGSFPVILQEAFLKIIDNKICNASYA .:.. .. .:::. : :. .. ..:::. .:. .:. : . .:... ::. :. CCDS54 TFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKGKTSEVLNAAKVLLIETQRCNSRYV 400 410 420 430 440 450 350 360 370 380 390 400 pF1KE0 YSGFVTDSMLCAGFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVY :....: .:.::::..:..:.::.::::::. .. ::: :.: .:::.::.: .:::: CCDS54 YDNLITPAMICAGFLQGNVDSCQGDSGGPLV-TSKNNIWWLIGDTSWGSGCAKAYRPGVY 460 470 480 490 500 510 410 pF1KE0 TRVTSYRNWITSKTGL : . .:: CCDS54 GNVMVFTDWIYRQMRADG 520 416 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 21:38:50 2016 done: Thu Nov 3 21:38:50 2016 Total Scan time: 2.570 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]