FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6659, 424 aa 1>>>pF1KB6659 424 - 424 aa - 424 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.3408+/-0.00153; mu= -6.6257+/- 0.089 mean_var=286.6150+/-59.461, 0's: 0 Z-trim(105.7): 127 B-trim: 68 in 2/51 Lambda= 0.075757 statistics sampled from 8441 (8555) to 8441 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.595), E-opt: 0.2 (0.263), width: 16 Scan time: 2.510 The best scores are: opt bits E(32554) CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 2646 303.3 2.9e-82 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1298 156.0 6.6e-38 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1291 155.2 1.2e-37 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1205 145.8 8e-35 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1205 145.8 8.2e-35 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1181 143.2 4.6e-34 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1181 143.2 4.9e-34 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 1168 141.7 1.2e-33 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1102 134.6 2e-31 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1093 133.6 3.8e-31 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 1077 131.8 1.3e-30 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1073 131.4 1.9e-30 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 1069 131.0 2.7e-30 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1068 130.9 3.1e-30 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 1049 128.8 1.1e-29 CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1027 126.4 5.6e-29 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 1020 125.6 9.1e-29 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1016 125.1 1.2e-28 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1014 124.9 1.4e-28 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1010 124.5 1.9e-28 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1003 123.7 3.4e-28 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 981 121.3 1.8e-27 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 978 121.0 2.3e-27 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 954 118.4 1.4e-26 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 951 118.1 1.8e-26 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 947 117.7 3.1e-26 CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 911 113.7 3.7e-25 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 908 113.4 4.7e-25 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 896 112.1 1.2e-24 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 735 94.3 1.6e-19 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 612 81.0 2.5e-15 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 611 80.9 2.7e-15 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 606 80.3 3.9e-15 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 596 79.3 8.8e-15 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 591 78.9 2.2e-14 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 574 76.9 4.7e-14 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 558 75.1 1.7e-13 CCDS33859.1 BFSP2 gene_id:8419|Hs108|chr3 ( 415) 550 74.2 2.6e-13 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 550 74.2 2.9e-13 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 551 74.4 3e-13 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 534 72.5 9.9e-13 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 534 72.5 1e-12 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 532 72.3 1.1e-12 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 498 68.6 1.8e-11 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 490 67.7 2.8e-11 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 489 67.6 3.2e-11 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 486 67.3 3.8e-11 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 484 67.1 4.5e-11 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 483 66.9 4.9e-11 >>CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 (424 aa) initn: 2646 init1: 2646 opt: 2646 Z-score: 1590.3 bits: 303.3 E(32554): 2.9e-82 Smith-Waterman score: 2646; 100.0% identity (100.0% similar) in 424 aa overlap (1-424:1-424) 10 20 30 40 50 60 pF1KB6 MDFSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTVNYGSDLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MDFSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTVNYGSDLT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 GGGDLFVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRAGRDYSAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GGGDLFVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRAGRDYSAY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 YRQIEELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADLQGLNKVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YRQIEELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADLQGLNKVF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 DDLTLHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGLNLGVIMN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DDLTLHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGLNLGVIMN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 EMRQKYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTSQSLEIEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EMRQKYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTSQSLEIEL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 QSHLSMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEYHILLDIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QSHLSMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEYHILLDIK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 TRLEQEIATYRRLLEGEDVKTTEYQLSTLEERDIKKTRKIKTVVQEVVDGKVVSSEVKEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TRLEQEIATYRRLLEGEDVKTTEYQLSTLEERDIKKTRKIKTVVQEVVDGKVVSSEVKEV 370 380 390 400 410 420 pF1KB6 EENI :::: CCDS11 EENI >>CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 (432 aa) initn: 1369 init1: 1219 opt: 1298 Z-score: 794.0 bits: 156.0 E(32554): 6.6e-38 Smith-Waterman score: 1298; 52.7% identity (82.0% similar) in 395 aa overlap (29-415:35-423) 10 20 30 40 50 pF1KB6 MDFSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTV----- ::. :.::: : ...: .. CCDS11 IRQFTSSSSIKGSSGLGGGSSRTSCRLSGGLGAGSCRLGSAGGLGSTLGGSSYSSCYSFG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 ---NYGSDLTGGGDLFVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNA .:::.. : :..:.:: .::::::::::::.:::.::..:..:::.:..::. .: CCDS11 SGGGYGSSFGGVDGLLAGGEKATMQNLNDRLASYLDKVRALEEANTELEVKIRDWYQRQA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB6 PRAGRDYSAYYRQIEELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVE : .:::: ::: ::::...: : ..:: .::::::.:::.::: :.:::...::.:: CCDS11 PGPARDYSQYYRTIEELQNKILTATVDNANILLQIDNARLAADDFRTKFETEQALRLSVE 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB6 ADLQGLNKVFDDLTLHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAA ::..:: .:.:.::: ..:::.:::.:...:: :::.:.::...:. ..:. .:::.::: CCDS11 ADINGLRRVLDELTLARADLEMQIENLKEELAYLKKNHEEEMNALRGQVGGEINVEMDAA 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB6 PGLNLGVIMNEMRQKYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELR ::..:. :.::::..:: ::.:: ..:.. : .: :...:..:.: ... . ...::: CCDS11 PGVDLSRILNEMRDQYEKMAEKNRKDAEDWFFSKTEELNREVATNSELVQSGKSEISELR 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB6 RTSQSLEIELQSHLSMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQN :: :.:::::::.:::: ::: .: ::. :: ::...:.:..:.: :: :.: .::.:: CCDS11 RTMQALEIELQSQLSMKASLEGNLAETENRYCVQLSQIQGLIGSVEEQLAQLRCEMEQQN 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB6 NEYHILLDIKTRLEQEIATYRRLLEGEDVKTTEYQLSTLEERDIKKTRKIKTVVQEVVDG .::.::::.:::::::::::::::::::.. :.:. .. ::...:.:.:: :: CCDS11 QEYKILLDVKTRLEQEIATYRRLLEGEDAHLTQYK------KEPVTTRQVRTIVEEVQDG 370 380 390 400 410 420 pF1KB6 KVVSSEVKEVEENI ::.:: CCDS11 KVISSREQVHQTTR 420 430 >>CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 (472 aa) initn: 1326 init1: 1227 opt: 1291 Z-score: 789.3 bits: 155.2 E(32554): 1.2e-37 Smith-Waterman score: 1291; 53.8% identity (83.3% similar) in 383 aa overlap (36-415:88-463) 10 20 30 40 50 60 pF1KB6 RSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTVNYGSDLTGGGDL :::. : :. ..:. ..:: : CCDS11 SSGGACGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGL-------GGGFGGGFAGGDGL 60 70 80 90 100 110 70 80 90 100 110 120 pF1KB6 FVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRAGRDYSAYYRQIE .::.::..::::::::::::.:::.::..:. :::.:..::. . : .::: :.. :: CCDS11 LVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIE 120 130 140 150 160 170 130 140 150 160 170 180 pF1KB6 ELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADLQGLNKVFDDLTL .::..: : ..:: .::::::.:::.::: ::::: ..:..::::..:: .:.:.::: CCDS11 DLRNKILTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTL 180 190 200 210 220 230 190 200 210 220 230 240 pF1KB6 HKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGLNLGVIMNEMRQK ..:::.::: :...:: :::.:.::...:. ..:. ::::.:::::..:. :.::::.. CCDS11 ARADLEMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQ 240 250 260 270 280 290 250 260 270 280 290 300 pF1KB6 YEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTSQSLEIELQSHLS :: ::.:: ..:.: : .: :...:..:.: ... . ...::::: :.:::::::.:: CCDS11 YEKMAEKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLS 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB6 MKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEYHILLDIKTRLEQ :: :::..:::::.:: :::..: ...:.: :: :.: .::.::.::.::::.:::::: CCDS11 MKASLENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQ 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB6 EIATYRRLLEGEDVKTTEYQLSTLEE--RDI-KKTRKIKTVVQEVVDGKVVSSEVKEVEE :::::::::::::.. . :.:. . ::. ...:.:.: :..: ::::::. CCDS11 EIATYRRLLEGEDAHLSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRT 420 430 440 450 460 470 pF1KB6 NI CCDS11 KN >>CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 (456 aa) initn: 1250 init1: 974 opt: 1205 Z-score: 738.7 bits: 145.8 E(32554): 8e-35 Smith-Waterman score: 1205; 50.1% identity (79.4% similar) in 393 aa overlap (30-420:71-456) 10 20 30 40 50 pF1KB6 MDFSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTVNYGSDL : . ::.::. : :. ..:. . CCDS11 SRSISASSARFVSSGSGGGYGGGMRVCGFGGGAGSVFGGGFGGGV-------GGGFGGGF 50 60 70 80 90 60 70 80 90 100 110 pF1KB6 TGG-GDLFVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRAGR-DY :: : :. ::::..::::::::::::.:::.::..:. :::.:..::. ..: . . :: CCDS11 GGGDGGLLSGNEKITMQNLNDRLASYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDY 100 110 120 130 140 150 120 130 140 150 160 170 pF1KB6 SAYYRQIEELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADLQGLN : :.. :::::..: . ..:.: .:.::::.:::.:::::::.: ..: ::::..:: CCDS11 SQYFKTIEELRDKIMATTIDNSRVILEIDNARLAADDFRLKYENELALRQGVEADINGLR 160 170 180 190 200 210 180 190 200 210 220 230 pF1KB6 KVFDDLTLHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGLNLGV .:.:.::: .::::.::: ::..:: :::.:.::. . ..:.. ::::.:::::..: CCDS11 RVLDELTLARTDLEMQIEGLNEELAYLKKNHEEEMKEFSSQLAGQVNVEMDAAPGVDLTR 220 230 240 250 260 270 240 250 260 270 280 290 pF1KB6 IMNEMRQKYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTSQSLE .. :::..::.::.:: .... : .: :...:. ::: .. .....:.:::: : :: CCDS11 VLAEMREQYEAMAEKNRRDVEAWFFSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELE 280 290 300 310 320 330 300 310 320 330 340 350 pF1KB6 IELQSHLSMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEYHILL :::::.:::: .::..: ::. ::..:: ..:.:...::::: ..: .:: ::.::..:: CCDS11 IELQSQLSMKAGLENSLAETECRYATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLL 340 350 360 370 380 390 360 370 380 390 400 410 pF1KB6 DIKTRLEQEIATYRRLLEGEDVKTTEYQLSTLEERDIKKTRKIKTVVQEVVDGKVVSSEV :::::::::::::: ::::.:.: . . .. ... :.: :::.::::. CCDS11 DIKTRLEQEIATYRSLLEGQDAKMAGIAIREASSGGGGSSSNFHINVEESVDGQVVSSHK 400 410 420 430 440 450 420 pF1KB6 KEVEENI .:. CCDS11 REI >>CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 (473 aa) initn: 1267 init1: 1195 opt: 1205 Z-score: 738.5 bits: 145.8 E(32554): 8.2e-35 Smith-Waterman score: 1205; 49.9% identity (80.6% similar) in 391 aa overlap (25-406:71-461) 10 20 30 40 50 pF1KB6 MDFSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRIS-NSRHTV :.. .. : .::. : :. . .. . CCDS11 RAPSTYGGGLSVSSRFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGA 50 60 70 80 90 100 60 70 80 90 100 110 pF1KB6 NYGSDLTGGGDLFVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRA ..:. ..:: :.::.::..::::::::::::.:::.::..:. :::.:..::. . : CCDS11 GFGGGFAGGDGLLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSE 110 120 130 140 150 160 120 130 140 150 160 170 pF1KB6 GRDYSAYYRQIEELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADL .::: :.. ::.::..: : ..::. .::::::.:::.::: ::: : ..: :::::. CCDS11 IKDYSPYFKTIEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADV 170 180 190 200 210 220 180 190 200 210 220 230 pF1KB6 QGLNKVFDDLTLHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGL .:: .:.:.::: .::::.::: :...:: :.:.:.::. .:. . :. ::::.:::::. CCDS11 NGLRRVLDELTLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGV 230 240 250 260 270 280 240 250 260 270 280 290 pF1KB6 NLGVIMNEMRQKYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTS .:. :.::::..:: ::.:: ..:. : .: :...:. :.: ..... ..:::::. CCDS11 DLSRILNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVL 290 300 310 320 330 340 300 310 320 330 340 350 pF1KB6 QSLEIELQSHLSMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEY :.:::::::.:::: :::..:::::.:: ::...:.:..:.: :: :.: .::.:..:: CCDS11 QGLEIELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEY 350 360 370 380 390 400 360 370 380 390 400 pF1KB6 HILLDIKTRLEQEIATYRRLLEGEDVKTTEYQLS--TLEERDI------KKTRKIKTVVQ .::::.:::::::::::::::::::.. . : : . :.. ...:. . ... CCDS11 QILLDVKTRLEQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILK 410 420 430 440 450 460 410 420 pF1KB6 EVVDGKVVSSEVKEVEENI : CCDS11 EQSSSSFSQGQSS 470 >>CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 (420 aa) initn: 1165 init1: 966 opt: 1181 Z-score: 725.0 bits: 143.2 E(32554): 4.6e-34 Smith-Waterman score: 1181; 54.6% identity (83.8% similar) in 346 aa overlap (36-380:73-415) 10 20 30 40 50 60 pF1KB6 RSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTVNYGSDLTGGGDL :::. : :. . . :..:. :: : CCDS11 GGYGGGVSCGFGGGAGSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGA--CDGG-L 50 60 70 80 90 70 80 90 100 110 120 pF1KB6 FVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRAG-RDYSAYYRQI ..::::..::::::::::::::::.::..:. :::.:..:. ..: . :::: ::. : CCDS11 LTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTI 100 110 120 130 140 150 130 140 150 160 170 180 pF1KB6 EELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADLQGLNKVFDDLT ::::..: : ..: : .:.::::.:::.:::::::.: ..: .::::..:: .:.:.:: CCDS11 EELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELT 160 170 180 190 200 210 190 200 210 220 230 240 pF1KB6 LHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGLNLGVIMNEMRQ : :::::.::: ::..:: .::.:.::. . ... . ::::.::.::..: .. :::. CCDS11 LSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMRE 220 230 240 250 260 270 250 260 270 280 290 300 pF1KB6 KYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTSQSLEIELQSHL .::.::..: ..:.: :. ..: :...:..:: .. .....:::::: :.:::::::.: CCDS11 QYEAMAERNRRDAEEWFHTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQL 280 290 300 310 320 330 310 320 330 340 350 360 pF1KB6 SMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEYHILLDIKTRLE ::: .::.:. ::. ::. :: ..:.:.::.:::: ..::.:: ::.::..::::::::: CCDS11 SMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLE 340 350 360 370 380 390 370 380 390 400 410 420 pF1KB6 QEIATYRRLLEGEDVKTTEYQLSTLEERDIKKTRKIKTVVQEVVDGKVVSSEVKEVEENI ::::::: ::::.:.: CCDS11 QEIATYRSLLEGQDAKKRQPP 400 410 420 >>CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 (458 aa) initn: 1165 init1: 966 opt: 1181 Z-score: 724.5 bits: 143.2 E(32554): 4.9e-34 Smith-Waterman score: 1181; 54.6% identity (83.8% similar) in 346 aa overlap (36-380:73-415) 10 20 30 40 50 60 pF1KB6 RSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTVNYGSDLTGGGDL :::. : :. . . :..:. :: : CCDS11 GGYGGGVSCGFGGGAGSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGA--CDGG-L 50 60 70 80 90 70 80 90 100 110 120 pF1KB6 FVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRAG-RDYSAYYRQI ..::::..::::::::::::::::.::..:. :::.:..:. ..: . :::: ::. : CCDS11 LTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTI 100 110 120 130 140 150 130 140 150 160 170 180 pF1KB6 EELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADLQGLNKVFDDLT ::::..: : ..: : .:.::::.:::.:::::::.: ..: .::::..:: .:.:.:: CCDS11 EELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELT 160 170 180 190 200 210 190 200 210 220 230 240 pF1KB6 LHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGLNLGVIMNEMRQ : :::::.::: ::..:: .::.:.::. . ... . ::::.::.::..: .. :::. CCDS11 LSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMRE 220 230 240 250 260 270 250 260 270 280 290 300 pF1KB6 KYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTSQSLEIELQSHL .::.::..: ..:.: :. ..: :...:..:: .. .....:::::: :.:::::::.: CCDS11 QYEAMAERNRRDAEEWFHTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQL 280 290 300 310 320 330 310 320 330 340 350 360 pF1KB6 SMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEYHILLDIKTRLE ::: .::.:. ::. ::. :: ..:.:.::.:::: ..::.:: ::.::..::::::::: CCDS11 SMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLE 340 350 360 370 380 390 370 380 390 400 410 420 pF1KB6 QEIATYRRLLEGEDVKTTEYQLSTLEERDIKKTRKIKTVVQEVVDGKVVSSEVKEVEENI ::::::: ::::.:.: CCDS11 QEIATYRSLLEGQDAKMIGFPSSAGSVSPRSTSVTTTSSASVTTTSNASGRRTSDVRRP 400 410 420 430 440 450 >>CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 (400 aa) initn: 1292 init1: 1168 opt: 1168 Z-score: 717.6 bits: 141.7 E(32554): 1.2e-33 Smith-Waterman score: 1229; 53.5% identity (84.2% similar) in 355 aa overlap (33-378:34-388) 10 20 30 40 50 60 pF1KB6 FSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGRGIRISNSRHTVNYGSDLTGG ::..::.::::. .:..: . . .: :: CCDS11 YSYRQSSATSSFGGLGGGSVRFGPGVAFRAPSIHGGSGGRGVSVSSARFVSSSSSGAYGG 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 G---------DLFVGNEKMAMQNLNDRLASYLEKVRTLEQSNSKLEVQIKQWYETNAPRA : :..::::..::::::::::::.:::.:: .:..:::.:..::. ..: CCDS11 GYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB6 GRDYSAYYRQIEELRSQIKDAQLQNARCVLQIDNAKLAAEDFRLKYETERGIRLTVEADL .:::: :: :..::..: : ..:.: :::::::.:::.::: :.:::...:..::::. CCDS11 SRDYSHYYTTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADI 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB6 QGLNKVFDDLTLHKTDLEIQIEELNKDLALLKKEHQEEVDGLHKHLGNTVNVEVDAAPGL .:: .:.:.::: .::::.::: :...:: :::.:.::.. :. ..:. :.::::.::: CCDS11 NGLRRVLDELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGT 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB6 NLGVIMNEMRQKYEVMAQKNLQEAKEQFERQTAVLQQQVTVNTEELKGTEVQLTELRRTS .:. :...::..:::::..: ..:. : .: :...:. .::.:. .. ..:.:::: CCDS11 DLAKILSDMRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB6 QSLEIELQSHLSMKESLEHTLEETKARYSSQLANLQSLLSSLEAQLMQIRSNMERQNNEY :.:::::::.:::: .:: :: ::.::...:::..:.:.:..:::: ..:.. ::::.:: CCDS11 QGLEIELQSQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEY 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB6 HILLDIKTRLEQEIATYRRLLEGEDVKTTEYQLSTLEERDIKKTRKIKTVVQEVVDGKVV . :.:::.:::::::::: ::::.. CCDS11 QRLMDIKSRLEQEIATYRSLLEGQEDHYNNLSASKVL 370 380 390 400 >>CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 (467 aa) initn: 1228 init1: 1087 opt: 1102 Z-score: 677.7 bits: 134.6 E(32554): 2e-31 Smith-Waterman score: 1112; 45.9% identity (72.6% similar) in 438 aa overlap (4-415:26-458) 10 20 30 pF1KB6 MDFSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGG :: : ::..: ..: : .: : :. .: CCDS11 MATQTCTPTFSTGSIKGLCGTAGGISRVSSIRSVGSC-RVP--SLAGAA--GYISSARSG 10 20 30 40 50 40 50 60 70 80 90 pF1KB6 AGGRGIRISNSRHTVN-YGSDLTGGGDLFV-----GNEKMAMQNLNDRLASYLEKVRTLE .: : . .: . . . : ..:.: : :.:: .:: ::::::.:::::: :: CCDS11 LSGLGSCLPGSYLSSECHTSGFVGSGGWFCEGSFNGSEKETMQFLNDRLANYLEKVRQLE 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB6 QSNSKLEVQIKQWYETNAPRAGRDYSAYYRQIEELRSQIKDAQLQNARCVLQIDNAKLAA . :..:: .:..::: . : ::..:.. ::.....: .. .::: ::::::::::: CCDS11 RENAELESRIQEWYEFQIPYICPDYQSYFKTIEDFQQKILLTKSENARLVLQIDNAKLAA 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB6 EDFRLKYETERGIRLTVEADLQGLNKVFDDLTLHKTDLEIQIEELNKDLALLKKEHQEEV .::: ::::: ..: ::::..:: ...:.::: :.::: :.: :...: :::.:.::: CCDS11 DDFRTKYETELSLRQLVEADINGLRRILDELTLCKADLEAQVESLKEELMCLKKNHEEEV 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB6 DGLHKHLGNTVNVEVDAAPGLNLGVIMNEMRQKYEVMAQKNLQEAKEQFERQTAVLQQQV . :. .::. .:::::::: ..:. :...:: .::.....: .... :. :: :.::: CCDS11 SVLRCQLGDRLNVEVDAAPPVDLNKILEDMRCQYEALVENNRRDVEAWFNTQTEELNQQV 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB6 TVNTEELKGTEVQLTELRRTSQSLEIELQSHLSMKESLEHTLEETKARYSSQLANLQSLL . ..:.:. .... ::::: ..::::::.. ::..::: :: ::.::::::::..: :. CCDS11 VSSSEQLQCCQTEIIELRRTVNALEIELQAQHSMRNSLESTLAETEARYSSQLAQMQCLI 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB6 SSLEAQLMQIRSNMERQNNEYHILLDIKTRLEQEIATYRRLLEGEDVKTTEYQLSTLEER :..:::: .:: ..::::.::..:::.:.::: ::::::.:::::: : .: . CCDS11 SNVEAQLSEIRCDLERQNQEYQVLLDVKARLEGEIATYRHLLEGEDCKLPPQPCATACKP 360 370 380 390 400 410 400 410 420 pF1KB6 DIKKTR--------------------KIKTVVQEVVDGKVVSSEVKEVEENI :. .:.:...:. ::::.:: CCDS11 VIRVPSVPPVPCVPSVPCTPAPQVGTQIRTITEEIRDGKVISSREHVQSRPL 420 430 440 450 460 >>CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 (455 aa) initn: 1177 init1: 1077 opt: 1093 Z-score: 672.6 bits: 133.6 E(32554): 3.8e-31 Smith-Waterman score: 1097; 47.9% identity (78.6% similar) in 378 aa overlap (13-380:34-407) 10 20 30 40 pF1KB6 MDFSRRSFHRSLSSSLQAPVVSTVGMQRLGTTPSVYGGAGGR ::: . : .: :. : .. :: : : CCDS11 KCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVA--RSFSACSV--GLGRS 10 20 30 40 50 50 60 70 80 90 pF1KB6 GIRISNSRHTV-----NYGSDLTGGGDLF-----VGNEKMAMQNLNDRLASYLEKVRTLE . : .. .. ..... .::: : .:::: .::.::::::.:::::: :: CCDS11 SYRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLE 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB6 QSNSKLEVQIKQWYETNAPRAGRDYSAYYRQIEELRSQIKDAQLQNARCVLQIDNAKLAA : :..:: .:..: : ..: ::..:.: ::::... .. .::: :..:::::::: CCDS11 QENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAA 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB6 EDFRLKYETERGIRLTVEADLQGLNKVFDDLTLHKTDLEIQIEELNKDLALLKKEHQEEV .::: ::::: ..: ::.:..:: ...::::: :.::: :.: :...: :::.:.::: CCDS11 DDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEV 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB6 DGLHKHLGNTVNVEVDAAPGLNLGVIMNEMRQKYEVMAQKNLQEAKEQFERQTAVLQQQV ..:. .::. .:::::::: ..:. ...::: .::.....: ..:.. .. :. :.::: CCDS11 NSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQV 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB6 TVNTEELKGTEVQLTELRRTSQSLEIELQSHLSMKESLEHTLEETKARYSSQLANLQSLL . ..:.:.. .... ::::: ..::::::.. ::...:: :: ::.::::::::..: .. CCDS11 VSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMI 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB6 SSLEAQLMQIRSNMERQNNEYHILLDIKTRLEQEIATYRRLLEGEDVKTTEYQLSTLEER ...:::: .::...::::.::..:::...::: :: ::: :::.:: : CCDS11 TNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSP 360 370 380 390 400 410 400 410 420 pF1KB6 DIKKTRKIKTVVQEVVDGKVVSSEVKEVEENI CCDS11 SKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF 420 430 440 450 424 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 07:59:04 2016 done: Sat Nov 5 07:59:04 2016 Total Scan time: 2.510 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]