FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5807, 472 aa 1>>>pF1KB5807 472 - 472 aa - 472 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.6912+/-0.00144; mu= -0.9897+/- 0.086 mean_var=326.0443+/-65.813, 0's: 0 Z-trim(109.7): 120 B-trim: 82 in 1/51 Lambda= 0.071029 statistics sampled from 10949 (11059) to 10949 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.662), E-opt: 0.2 (0.34), width: 16 Scan time: 3.550 The best scores are: opt bits E(32554) CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 3010 322.6 5.7e-88 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 2553 275.8 7.1e-74 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1949 213.8 2.8e-55 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1867 205.4 1e-52 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1788 197.4 2.7e-50 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1761 194.5 1.8e-49 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1639 182.2 1.3e-45 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 1584 176.4 4.9e-44 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1551 173.1 5.9e-43 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 1451 163.0 8.4e-40 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 1438 161.5 1.9e-39 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 1413 158.9 1e-38 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 1384 156.0 8e-38 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 1341 151.5 1.7e-36 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1337 151.1 2.3e-36 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1308 148.2 1.8e-35 CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1291 146.4 5.6e-35 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 1289 146.2 6.9e-35 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1238 140.9 2.4e-33 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1230 140.1 4.1e-33 CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1227 139.9 5.5e-33 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1222 139.3 7.3e-33 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1201 137.2 3.4e-32 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 1158 132.8 7.1e-31 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1105 127.3 3.1e-29 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1054 122.1 1.2e-27 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1053 122.1 1.4e-27 CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 1034 120.1 4.9e-27 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 1026 119.2 8.3e-27 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 748 90.6 2.4e-18 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 692 85.0 1.7e-16 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 686 84.4 2.6e-16 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 685 84.3 2.8e-16 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 672 83.0 7.5e-16 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 669 82.8 1e-15 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 656 81.7 3.7e-15 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 646 80.3 4.7e-15 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 641 79.9 7.4e-15 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 639 79.6 8.1e-15 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 626 78.3 2e-14 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 626 78.3 2.1e-14 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 616 77.4 4.9e-14 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 614 77.1 5.2e-14 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 613 77.0 5.6e-14 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 611 76.9 6.6e-14 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 608 76.5 8e-14 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 608 76.6 8.7e-14 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 604 76.1 1e-13 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 601 75.7 1.2e-13 CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 601 75.9 1.4e-13 >>CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 (472 aa) initn: 3010 init1: 3010 opt: 3010 Z-score: 1692.9 bits: 322.6 E(32554): 5.7e-88 Smith-Waterman score: 3010; 99.8% identity (99.8% similar) in 472 aa overlap (1-472:1-472) 10 20 30 40 50 60 pF1KB5 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 GAYGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGGFGGGFAGGDGLLVGSEKVTMQ :: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GACGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGGFGGGFAGGDGLLVGSEKVTMQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 NLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNKILTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNKILTAT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 VDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADLEMQIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADLEMQIE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 SLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMAEKNRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMAEKNRK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 DAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASLENSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASLENSLE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 ETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYRRLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYRRLLE 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 GEDAHLSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GEDAHLSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN 430 440 450 460 470 >>CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 (473 aa) initn: 2065 init1: 2065 opt: 2553 Z-score: 1439.8 bits: 275.8 E(32554): 7.1e-74 Smith-Waterman score: 2553; 87.3% identity (95.2% similar) in 458 aa overlap (1-449:1-456) 10 20 30 40 50 60 pF1KB5 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::: CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSS-RFSSG 10 20 30 40 50 70 80 90 100 110 pF1KB5 GAYGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGG----FGGGFAGGDGLLVGSEK :: ::::::::::::::: ::::::::::::::::.::: ::::::::::::::::: CCDS11 GACGLGGGYGGGFSSSSS-FGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 VTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNKI ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS11 VTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 LTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADLE ..::..::. .:::::::::::::::::: :: ::..::::.::::::::::::::.::: CCDS11 IAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 MQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMAE ::::.::::::::.::::::: :::::.::::::::::::::::::::::::::::.::: CCDS11 MQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 KNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASLE :::.::: ::..::::::.:::.:::::::..::..::::..:.:::::::::::::::: CCDS11 KNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 NSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYR ::::::::::::::.::: .::::::::::::::::::.:::.::::::::::::::::: CCDS11 NSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 RLLEGEDAHLSSSQFSSGSQSSRDV-----TSSSRQIRTKVMDVHDGKVVSTHEQVLRTK ::::::::::::.: :. : :::.: .::::: : CCDS11 RLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS 420 430 440 450 460 470 pF1KB5 N >>CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 (432 aa) initn: 2248 init1: 1867 opt: 1949 Z-score: 1105.8 bits: 213.8 E(32554): 2.8e-55 Smith-Waterman score: 2089; 74.5% identity (86.2% similar) in 470 aa overlap (1-470:1-430) 10 20 30 40 50 60 pF1KB5 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG ::: ::::::::.::: .:.:::::: : :: .:::...: :..:. CCDS11 MTTSIRQFTSSSSIKGS----SGLGGGSSRTS-------CR----LSGGLGAGSCRLGSA 10 20 30 40 70 80 90 100 110 120 pF1KB5 GAYGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGGFGGGFAGGDGLLVGSEKVTMQ : :::. ::. :: ::::: ::.:..:.: ::::.:.::.::: CCDS11 G--GLGSTLGGSSYSSCYSFGSG--------------GGYGSSFGGVDGLLAGGEKATMQ 50 60 70 80 130 140 150 160 170 180 pF1KB5 NLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNKILTAT ::::::::::::::::::::..:::::::::::: :. .::: :..:::.:.::::::: CCDS11 NLNDRLASYLDKVRALEEANTELEVKIRDWYQRQAPGPARDYSQYYRTIEELQNKILTAT 90 100 110 120 130 140 190 200 210 220 230 240 pF1KB5 VDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADLEMQIE :::::.:::::::::::::::::.::: ::.:::::::::::::::::::::::::::: CCDS11 VDNANILLQIDNARLAADDFRTKFETEQALRLSVEADINGLRRVLDELTLARADLEMQIE 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB5 SLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMAEKNRK .:::::::::::::::::::::::::..:::::::::::::::::::::::::::::::: CCDS11 NLKEELAYLKKNHEEEMNALRGQVGGEINVEMDAAPGVDLSRILNEMRDQYEKMAEKNRK 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB5 DAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASLENSLE :::.:::.::::::::::::::::::::::::::::::: ::::::::::::::::..: CCDS11 DAEDWFFSKTEELNREVATNSELVQSGKSEISELRRTMQALEIELQSQLSMKASLEGNLA 270 280 290 300 310 320 370 380 390 400 410 420 pF1KB5 ETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYRRLLE ::..:::.::.::: .:::::::::::::::::::::::::::::::::::::::::::: CCDS11 ETENRYCVQLSQIQGLIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYRRLLE 330 340 350 360 370 380 430 440 450 460 470 pF1KB5 GEDAHLSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN :::::: .:... . ::. ::.:: : .:.::::.:..::: .: CCDS11 GEDAHL--TQYKK-----EPVTT--RQVRTIVEEVQDGKVISSREQVHQTTR 390 400 410 420 430 >>CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 (456 aa) initn: 1727 init1: 1335 opt: 1867 Z-score: 1060.1 bits: 205.4 E(32554): 1e-52 Smith-Waterman score: 1867; 65.9% identity (87.1% similar) in 449 aa overlap (25-466:14-454) 10 20 30 40 50 pF1KB5 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGG-----LSVSSS ::::.: .:.::::. . .. .:: .:.::. CCDS11 MTTTFLQTSSSTFGGGSTRGGSLLAGGGGFGGGSLSGGGGSRSISASSA 10 20 30 40 60 70 80 90 100 110 pF1KB5 RFSSGGAYGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGGFGGGFAGGDG-LLVGS :: :.:. :::::::. . ::.: :. .:::.:.:.::::::::.:::: :: :. CCDS11 RFVSSGS---GGGYGGGMRVCG--FGGGAGSVFGGGFGGGVGGGFGGGFGGGDGGLLSGN 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 EKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIK-DYSPYFKTIEDLR ::.::::::::::::::::::::::::::::::.::::.: :. . ::: ::::::.:: CCDS11 EKITMQNLNDRLASYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDYSQYFKTIEELR 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 NKILTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARA .::...:.::. :.:.:::::::::::: :::.:: ::..:::::::::::::::::::. CCDS11 DKIMATTIDNSRVILEIDNARLAADDFRLKYENELALRQGVEADINGLRRVLDELTLART 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 DLEMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEK :::::::.:.::::::::::::::. . .:..:.:::::::::::::.:.: :::.::: CCDS11 DLEMQIEGLNEELAYLKKNHEEEMKEFSSQLAGQVNVEMDAAPGVDLTRVLAEMREQYEA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 MAEKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKA ::::::.:.: :::.::::::.:::.:.:..:..:.::..::::::.::::::::::::: CCDS11 MAEKNRRDVEAWFFSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELEIELQSQLSMKA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB5 SLENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIA .::::: ::. :: :: ::: .::..: ::..:::::: ::::::.:::.::::::::: CCDS11 GLENSLAETECRYATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLLDIKTRLEQEIA 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB5 TYRRLLEGEDAHLSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN ::: ::::.::.... . .:... .:: ... .: . ::.:::.:.. CCDS11 TYRSLLEGQDAKMAGIAIREASSGG---GGSSSNFHINVEESVDGQVVSSHKREI 410 420 430 440 450 >>CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 (458 aa) initn: 1659 init1: 1293 opt: 1788 Z-score: 1016.3 bits: 197.4 E(32554): 2.7e-50 Smith-Waterman score: 1819; 65.4% identity (83.7% similar) in 448 aa overlap (17-450:9-443) 10 20 30 40 50 60 pF1KB5 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG : . :::.:::: .. :: : :.:. :.:: :: CCDS11 MSLRLQSSSASYGGGFGGGSCQL-----GG--------GRGVSTCSTRFVSG 10 20 30 70 80 90 100 110 pF1KB5 G-AYGLGGGYGGGFSSSSSS-FGSGFGGGYGGGLGAGLGGGFGGGFAGG--------DGL : : : ::: . ::.....: ::.:.::: ::: :.::::::::::::: :: CCDS11 GSAGGYGGGVSCGFGGGAGSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGGL 40 50 60 70 80 90 120 130 140 150 160 pF1KB5 LVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEI-KDYSPYFKTI :.:.::.:::::::::::::.:::::::::::::::::::. .: :: .:::::.::: CCDS11 LTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTI 100 110 120 130 140 150 170 180 190 200 210 220 pF1KB5 EDLRNKILTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELT :.::.::::::..: :.:.:::::::::::: :::.:: ::.::::::::::::::::: CCDS11 EELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELT 160 170 180 190 200 210 230 240 250 260 270 280 pF1KB5 LARADLEMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRD :...:::::::::.:::::.::::::::. . .:: :.:::::::.::.::.:.: :::. CCDS11 LSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMRE 220 230 240 250 260 270 290 300 310 320 330 340 pF1KB5 QYEKMAEKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQL ::: :::.::.:::::: ::. :::.::.::. ..:..:.::.:::::.:.::::::::: CCDS11 QYEAMAERNRRDAEEWFHTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQL 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB5 SMKASLENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLE ::::.:::.. ::. :: .:: ::: .:.:.: ::..:: ::: ::::::.:::.::::: CCDS11 SMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLE 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB5 QEIATYRRLLEGEDAHLSSSQFSSGSQSSRDV---TSSSRQIRTKVMDVHDGKVVSTHEQ ::::::: ::::.::.. . :.:: : :.. :.:: .. : CCDS11 QEIATYRSLLEGQDAKMIGFPSSAGSVSPRSTSVTTTSSASVTTTSNASGRRTSDVRRP 400 410 420 430 440 450 470 pF1KB5 VLRTKN >>CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 (420 aa) initn: 1635 init1: 1269 opt: 1761 Z-score: 1001.8 bits: 194.5 E(32554): 1.8e-49 Smith-Waterman score: 1792; 67.8% identity (85.2% similar) in 419 aa overlap (17-424:9-414) 10 20 30 40 50 60 pF1KB5 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG : . :::.:::: .. :: : :.:. :.:: :: CCDS11 MSLRLQSSSASYGGGFGGGSCQL-----GG--------GRGVSTCSTRFVSG 10 20 30 70 80 90 100 110 pF1KB5 G-AYGLGGGYGGGFSSSSSS-FGSGFGGGYGGGLGAGLGGGFGGGFAGG--------DGL : : : ::: . ::.....: ::.:.::: ::: :.::::::::::::: :: CCDS11 GSAGGYGGGVSCGFGGGAGSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGGL 40 50 60 70 80 90 120 130 140 150 160 pF1KB5 LVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEI-KDYSPYFKTI :.:.::.:::::::::::::.:::::::::::::::::::. .: :: .:::::.::: CCDS11 LTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTI 100 110 120 130 140 150 170 180 190 200 210 220 pF1KB5 EDLRNKILTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELT :.::.::::::..: :.:.:::::::::::: :::.:: ::.::::::::::::::::: CCDS11 EELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELT 160 170 180 190 200 210 230 240 250 260 270 280 pF1KB5 LARADLEMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRD :...:::::::::.:::::.::::::::. . .:: :.:::::::.::.::.:.: :::. CCDS11 LSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMRE 220 230 240 250 260 270 290 300 310 320 330 340 pF1KB5 QYEKMAEKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQL ::: :::.::.:::::: ::. :::.::.::. ..:..:.::.:::::.:.::::::::: CCDS11 QYEAMAERNRRDAEEWFHTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQL 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB5 SMKASLENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLE ::::.:::.. ::. :: .:: ::: .:.:.: ::..:: ::: ::::::.:::.::::: CCDS11 SMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLE 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB5 QEIATYRRLLEGEDAHLSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLR ::::::: ::::.:: CCDS11 QEIATYRSLLEGQDAKKRQPP 400 410 420 >>CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 (584 aa) initn: 1228 init1: 1228 opt: 1639 Z-score: 932.5 bits: 182.2 E(32554): 1.3e-45 Smith-Waterman score: 1646; 65.0% identity (83.3% similar) in 426 aa overlap (12-422:37-456) 10 20 30 pF1KB5 MTTCSRQFTSSSSMKGSCGIG---GGIGGGS-SRISSVLAG :: ::: : : ::..::: :: :: : CCDS11 SSKHYSSSRSGGGGGGGGCGGGGGVSSLRISSSKGSLGGGFSSGGFSGGSFSRGSS---G 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB5 GSCRAPST--YGG--GLSVSSSRFSSGGAYGLGGGYGGGFSSSSSSFGSG-FGGG-YGGG :.: . :. ::: :.. .: : .: :. ..::.::: :...: ::.: :::: .::: CCDS11 GGCFGGSSGGYGGLGGFGGGSFR-GSYGSSSFGGSYGGIFGGGS--FGGGSFGGGSFGGG 70 80 90 100 110 120 100 110 120 130 140 pF1KB5 L--GAGLGGGFGGGFAGGDGLLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRD :.:.::::::::.: ::: :.::::::::::::::::::::::::.: .:: ::.. CCDS11 GFGGGGFGGGFGGGFGGDGGLLSGNEKVTMQNLNDRLASYLDKVRALEESNYELEGKIKE 130 140 150 160 170 180 150 160 170 180 190 200 pF1KB5 WYQRQ---RPAEIKDYSPYFKTIEDLRNKILTATVDNANVLLQIDNARLAADDFRTKYET ::... . .: .::: :.:::.::.:.::. :.::::.::::::::::::::: :::. CCDS11 WYEKHGNSHQGEPRDYSKYYKTIDDLKNQILNLTTDNANILLQIDNARLAADDFRLKYEN 190 200 210 220 230 240 210 220 230 240 250 260 pF1KB5 ELNLRMSVEADINGLRRVLDELTLARADLEMQIESLKEELAYLKKNHEEEMNALRGQVGG :. ::.::::::::::::::::::..:::::::::: ::::::::::::::. ::. : CCDS11 EVALRQSVEADINGLRRVLDELTLTKADLEMQIESLTEELAYLKKNHEEEMKDLRNVSTG 250 260 270 280 290 300 270 280 290 300 310 320 pF1KB5 DVNVEMDAAPGVDLSRILNEMRDQYEKMAEKNRKDAEEWFFTKTEELNREVATNSELVQS ::::::.:::::::...::.::.:::..::.:::::: :: :..::. :. .: : ..: CCDS11 DVNVEMNAAPGVDLTQLLNNMRSQYEQLAEQNRKDAEAWFNEKSKELTTEIDNNIEQISS 310 320 330 340 350 360 330 340 350 360 370 380 pF1KB5 GKSEISELRRTMQNLEIELQSQLSMKASLENSLEETKGRYCMQLAQIQEMIGSVEEQLAQ ::::.::::..: :::::::::..: ::: :: ::.::::.::.::: .:...:::: : CCDS11 YKSEITELRRNVQALEIELQSQLALKQSLEASLAETEGRYCVQLSQIQAQISALEEQLQQ 370 380 390 400 410 420 390 400 410 420 430 440 pF1KB5 LRCEMEQQNQEYKILLDVKTRLEQEIATYRRLLEGEDAHLSSSQFSSGSQSSRDVTSSSR .: : : :: ::. :::.: :::.:: ::: ::::: CCDS11 IRAETECQNTEYQQLLDIKIRLENEIQTYRSLLEGEGSSGGGGRGGGSFGGGYGGGSSGG 430 440 450 460 470 480 450 460 470 pF1KB5 QIRTKVMDVHDGKVVSTHEQVLRTKN CCDS11 GSSGGGHGGGHGGSSGGGYGGGSSGGGSSGGGYGGGSSSGGHGGSSSGGYGGGSSGGGGG 490 500 510 520 530 540 >>CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 (400 aa) initn: 1684 init1: 1522 opt: 1584 Z-score: 904.0 bits: 176.4 E(32554): 4.9e-44 Smith-Waterman score: 1588; 61.2% identity (81.1% similar) in 438 aa overlap (1-430:1-398) 10 20 30 40 50 pF1KB5 MTTCS-RQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGG----GLSVSSS ::. : :: ...::. ::.:::: :.. : . :::: .:: :.::::. CCDS11 MTSYSYRQSSATSSF-------GGLGGGSVRFG---PGVAFRAPSIHGGSGGRGVSVSSA 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 RFSSGGAYGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGGFGGGFAGGDGLLVGSE :: ::::: :.:::: .:: ....::::.:.: CCDS11 RF---------------VSSSSS-------GAYGGG--------YGGVLTASDGLLAGNE 60 70 80 120 130 140 150 160 170 pF1KB5 KVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNK :.:::::::::::::::::::: ::..::::::::::.: :. .::: :. ::.:::.: CCDS11 KLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPSRDYSHYYTTIQDLRDK 90 100 110 120 130 140 180 190 200 210 220 230 pF1KB5 ILTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADL :: ::..:. ..::::::::::::::::.::: :::::::::::::::::::::::.:: CCDS11 ILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDL 150 160 170 180 190 200 240 250 260 270 280 290 pF1KB5 EMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMA :::::.:::::::::::::::...:::::::.:.::.:.:::.::..::..::.::: :: CCDS11 EMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMA 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB5 EKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASL :.:::::: :: ..::::::::: ..: .: ..::...::::.:.:::::::::::::.: CCDS11 EQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAAL 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB5 ENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATY :..: ::..:. :::.:: .:...: ::...: . :.:::::. :.:.:.::::::::: CCDS11 EDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATY 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB5 RRLLEGEDAH---LSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN : ::::.. : ::.:. CCDS11 RSLLEGQEDHYNNLSASKVL 390 400 >>CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 (494 aa) initn: 1403 init1: 1133 opt: 1551 Z-score: 884.6 bits: 173.1 E(32554): 5.9e-43 Smith-Waterman score: 1565; 55.5% identity (79.2% similar) in 485 aa overlap (5-466:18-488) 10 20 30 40 pF1KB5 MTTCSRQFTSSSSM---KG--SCGIGGGIGGGSSRISSVLAGGSCRA ::...:.: . .: . ..:.: :: :. :.:: CCDS11 MDLSNNTMSLSVRTPGLSRRLSSQSVIGRPRGMSASSVGSGYGG-----SAFGFGASC-- 10 20 30 40 50 50 60 70 80 90 100 pF1KB5 PSTYGGGLSVSSSRFSSGGAYGLGGGYGGGFSSS-SSSFGSGFGGGYGGGLGAGLGGGFG :::.: ..: : :.. :.::: :...... ....: ..::: :::: :.::. : CCDS11 ----GGGFS-AASMF--GSSSGFGGGSGSSMAGGLGAGYGRALGGGSFGGLGMGFGGSPG 60 70 80 90 100 110 120 130 140 150 pF1KB5 GG----FAGGDG-LLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQ-- :: ..:.:: :: :::: :::::::::::::::::::::::..:: :::.::. . CCDS11 GGSLGILSGNDGGLLSGSEKETMQNLNDRLASYLDKVRALEEANTELENKIREWYETRGT 110 120 130 140 150 160 160 170 180 190 200 210 pF1KB5 --RPAEIKDYSPYFKTIEDLRNKILTATVDNANVLLQIDNARLAADDFRTKYETELNLRM : .::: :. ::::::::..:.. ::..:::::::::::.::: :::.:: ::. CCDS11 GTADASQSDYSKYYPLIEDLRNKIISASIGNAQLLLQIDNARLAAEDFRMKYENELALRQ 170 180 190 200 210 220 220 230 240 250 260 270 pF1KB5 SVEADINGLRRVLDELTLARADLEMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEM .:::::::::::::::::.:.:::::::::.:::::.:::::.:....: :.:.::: CCDS11 GVEADINGLRRVLDELTLTRTDLEMQIESLNEELAYMKKNHEDELQSFRVGGPGEVSVEM 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB5 DAAPGVDLSRILNEMRDQYEKMAEKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEIS ::::::::.:.::.:: ::: .::.:::::: ::. :. :: .:..::.: .::.:::.. CCDS11 DAAPGVDLTRLLNDMRAQYETIAEQNRKDAEAWFIEKSGELRKEISTNTEQLQSSKSEVT 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB5 ELRRTMQNLEIELQSQLSMKASLENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEME .:::..:::::::::::.:: :::.:: :..: :: ::.:.:..:...: :: :.: . : CCDS11 DLRRAFQNLEIELQSQLAMKKSLEDSLAEAEGDYCAQLSQVQQLISNLEAQLLQVRADAE 350 360 370 380 390 400 400 410 420 430 440 pF1KB5 QQNQEYKILLDVKTRLEQEIATYRRLLEGEDAH--LSSSQFSSGSQSSRDVTSSS----- .:: ... ::.::.::: :: ::::::.:: : : : . :.:. . :.:: CCDS11 RQNVDHQRLLNVKARLELEIETYRRLLDGEAQGDGLEESLFVTDSKSQAQSTDSSKDPTK 410 420 430 440 450 460 450 460 470 pF1KB5 -RQIRTKVMDVHDGKVVSTHEQVLRTKN :.:.: :... .:.:::.. : CCDS11 TRKIKTVVQEMVNGEVVSSQVQEIEELM 470 480 490 >>CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 (623 aa) initn: 1082 init1: 1082 opt: 1451 Z-score: 828.0 bits: 163.0 E(32554): 8.4e-40 Smith-Waterman score: 1466; 54.8% identity (80.1% similar) in 442 aa overlap (6-429:29-468) 10 20 30 pF1KB5 MTTCSRQFTSSSSMKGSCGIGG------GIGGGSSRI :. : : .:. : :: : ::::::. CCDS32 MSCRQFSSSYLSRSGGGGGGGLGSGGSIRSSYSRFSSSGGGGGGGRFSSSSGYGGGSSRV 10 20 30 40 50 60 40 50 60 70 80 pF1KB5 SSVLAGGSC--RAPSTYGGGLSVSS--SRFSSGGAYGLGGGYGGGFSSSSSSFGSGFGGG . .::: . :::.:.:: . :. ::. :.::. :::.:::.. ::.::::: CCDS32 CGRGGGGSFGYSYGGGSGGGFSASSLGGGFG-GGSRGFGGASGGGYSSSGG-FGGGFGGG 70 80 90 100 110 90 100 110 120 130 140 pF1KB5 YGGGLGAGLG------GGFGGGFAGGDG-LLVGSEKVTMQNLNDRLASYLDKVRALEEAN :::.:.: : :::::: .:::: .:...:: :::.::.:::::::::.:::::: CCDS32 SGGGFGGGYGSGFGGFGGFGGGAGGGDGGILTANEKSTMQELNSRLASYLDKVQALEEAN 120 130 140 150 160 170 150 160 170 180 190 pF1KB5 ADLEVKIRDWYQRQRPAEI-KDYSPYFKTIEDLRNKILTATVDNANVLLQIDNARLAADD ::: ::.:::... :: : :.::::..::.::...:. :: : ..::.:::.:.. :: CCDS32 NDLENKIQDWYDKKGPAAIQKNYSPYYNTIDDLKDQIVDLTVGNNKTLLDIDNTRMTLDD 180 190 200 210 220 230 200 210 220 230 240 250 pF1KB5 FRTKYETELNLRMSVEADINGLRRVLDELTLARADLEMQIESLKEELAYLKKNHEEEMNA :: :.: : :::..:.:::::::.:::.::. ..::::: :.:.::: :::::.:::. CCDS32 FRIKFEMEQNLRQGVDADINGLRQVLDNLTMEKSDLEMQYETLQEELMALKKNHKEEMSQ 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB5 LRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMAEKNRKDAEEWFFTKTEELNREVAT : :: .::::::...::: ::.. ::.::..::.. ::::: :. . :. ....::.. CCDS32 LTGQNSGDVNVEINVAPGKDLTKTLNDMRQEYEQLIAKNRKDIENQYETQITQIEHEVSS 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB5 NSELVQSGKSEISELRRTMQNLEIELQSQLSMKASLENSLEETKGRYCMQLAQIQEMIGS ... :::. .:...::. .:.:::::::::: ::.::.:::.::.::: :: .:::.:.. CCDS32 SGQEVQSSAKEVTQLRHGVQELEIELQSQLSKKAALEKSLEDTKNRYCGQLQMIQEQISN 360 370 380 390 400 410 380 390 400 410 420 430 pF1KB5 VEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYRRLLEGEDAHLSSSQFSSGSQSSR .: :....: :.: :::::..::..: :::.:: ::. :::: . . :: CCDS32 LEAQITDVRQEIECQNQEYSLLLSIKMRLEKEIETYHNLLEGGQEDFESSGAGKIGLGGR 420 430 440 450 460 470 440 450 460 470 pF1KB5 DVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN CCDS32 GGSGGSYGRGSRGGSGGSYGGGGSGGGYGGGSGSRGGSGGSYGGGSGSGGGSGGGYGGGS 480 490 500 510 520 530 472 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 14:56:58 2016 done: Sat Nov 5 14:56:58 2016 Total Scan time: 3.550 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]