FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7233, 449 aa 1>>>pF1KB7233 449 - 449 aa - 449 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3519+/-0.00104; mu= 9.9093+/- 0.062 mean_var=186.5888+/-35.662, 0's: 0 Z-trim(111.3): 110 B-trim: 82 in 2/50 Lambda= 0.093893 statistics sampled from 12163 (12280) to 12163 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.724), E-opt: 0.2 (0.377), width: 16 Scan time: 2.710 The best scores are: opt bits E(32554) CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 2997 418.4 7.3e-117 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 2729 382.1 6.3e-106 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1579 226.3 4.6e-59 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1569 224.9 1.2e-58 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1556 223.2 3.9e-58 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1554 222.9 5e-58 CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1513 217.4 2.4e-56 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1495 215.0 1.3e-55 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1484 213.5 3.7e-55 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1342 194.2 2.2e-49 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1282 186.1 6.7e-47 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1060 156.0 6.9e-38 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1036 152.8 6.8e-37 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1034 152.5 8.4e-37 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1020 150.6 3.1e-36 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1016 150.1 4.6e-36 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1005 148.5 1.2e-35 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 998 147.6 2.2e-35 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 960 142.6 1e-33 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 922 137.4 3.2e-32 CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 911 135.8 8.1e-32 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 858 128.7 1.2e-29 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 835 125.6 1.2e-28 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 834 125.4 1.2e-28 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 814 122.7 7.4e-28 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 809 122.0 1.2e-27 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 804 121.3 1.9e-27 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 798 120.7 4.3e-27 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 788 119.2 9e-27 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 621 96.4 4.1e-20 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 574 90.2 4.8e-18 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 558 88.0 2e-17 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 558 88.0 2e-17 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 558 88.0 2.1e-17 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 555 87.7 3.2e-17 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 546 86.5 7.9e-17 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 543 86.0 9.4e-17 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 535 84.9 1.9e-16 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 535 84.9 1.9e-16 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 530 84.3 3.1e-16 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 527 83.9 4.2e-16 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 525 83.6 4.8e-16 CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 521 83.2 8.6e-16 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 520 83.0 8.9e-16 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 516 82.4 1.3e-15 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 515 82.3 1.4e-15 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 514 82.2 1.5e-15 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 513 82.0 1.6e-15 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 512 81.8 1.7e-15 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 511 81.7 1.9e-15 >>CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 (449 aa) initn: 2997 init1: 2997 opt: 2997 Z-score: 2211.5 bits: 418.4 E(32554): 7.3e-117 Smith-Waterman score: 2997; 100.0% identity (100.0% similar) in 449 aa overlap (1-449:1-449) 10 20 30 40 50 60 pF1KB7 MTSFYSTSSCPLGCTMAPGARNVFVSPIDVGCQPVAEANAASMCLLANVAHANRVRVGST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MTSFYSTSSCPLGCTMAPGARNVFVSPIDVGCQPVAEANAASMCLLANVAHANRVRVGST 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 PLGRPSLCLPPTSHTACPLPGTCHIPGNIGICGAYGKNTLNGHEKETMKFLNDRLANYLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PLGRPSLCLPPTSHTACPLPGTCHIPGNIGICGAYGKNTLNGHEKETMKFLNDRLANYLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KVRQLEQENAELETTLLERSKCHESTVCPDYQSYFRTIEELQQKILCSKAENARLIVQID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KVRQLEQENAELETTLLERSKCHESTVCPDYQSYFRTIEELQQKILCSKAENARLIVQID 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 NAKLAADDFRIKLESERSLHQLVEADKCGTQKLLDDATLAKADLEAQQESLKEEQLSLKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NAKLAADDFRIKLESERSLHQLVEADKCGTQKLLDDATLAKADLEAQQESLKEEQLSLKS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 NHEQEVKILRSQLGEKFRIELDIEPTIDLNRVLGEMRAQYEAMVETNHQDVEQWFQAQSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NHEQEVKILRSQLGEKFRIELDIEPTIDLNRVLGEMRAQYEAMVETNHQDVEQWFQAQSE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 GISLQAMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDRYGTELA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GISLQAMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDRYGTELA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 QMQSLISNLEEQLSEIRADLERQNQEYQVLLDVKARLENEIATYRNLLESEDCKLPCNPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QMQSLISNLEEQLSEIRADLERQNQEYQVLLDVKARLENEIATYRNLLESEDCKLPCNPC 370 380 390 400 410 420 430 440 pF1KB7 STPASCTSCPSCGPVTGGSPSGHGASMGR ::::::::::::::::::::::::::::: CCDS32 STPASCTSCPSCGPVTGGSPSGHGASMGR 430 440 >>CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 (456 aa) initn: 2873 init1: 2693 opt: 2729 Z-score: 2015.2 bits: 382.1 E(32554): 6.3e-106 Smith-Waterman score: 2729; 91.2% identity (95.6% similar) in 453 aa overlap (1-448:1-453) 10 20 30 40 50 60 pF1KB7 MTSFYSTSSCPLGCTMAPGARNVFVSPIDVGCQPVAEANAASMCLLANVAHANRVRVGST ::: ::.:::::::::::::::: :::::.:::: :::: : :::::::::::::::::: CCDS11 MTSSYSSSSCPLGCTMAPGARNVSVSPIDIGCQPGAEANIAPMCLLANVAHANRVRVGST 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 PLGRPSLCLPPTSHTACPLPGTCHIPGNIGICGAYGKNTLNGHEKETMKFLNDRLANYLE :::::::::::: :::::::::::::::::::::::.:::::::::::.::::::::::: CCDS11 PLGRPSLCLPPTCHTACPLPGTCHIPGNIGICGAYGENTLNGHEKETMQFLNDRLANYLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KVRQLEQENAELETTLLERSKCHESTVCPDYQSYFRTIEELQQKILCSKAENARLIVQID :::::::::::::.:::::::::::::::::::::.:::::::::::::::::::::::: CCDS11 KVRQLEQENAELEATLLERSKCHESTVCPDYQSYFHTIEELQQKILCSKAENARLIVQID 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 NAKLAADDFRIKLESERSLHQLVEADKCGTQKLLDDATLAKADLEAQQESLKEEQLSLKS :::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::: CCDS11 NAKLAADDFRIKLESERSLRQLVEADKCGTQKLLDDATLAKADLEAQQESLKEEQLSLKS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 NHEQEVKILRSQLGEKFRIELDIEPTIDLNRVLGEMRAQYEAMVETNHQDVEQWFQAQSE ::::::::::::::::.::::::::::::::::::::::::::.:::.:::::::::::: CCDS11 NHEQEVKILRSQLGEKLRIELDIEPTIDLNRVLGEMRAQYEAMLETNRQDVEQWFQAQSE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 GISLQAMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDRYGTELA ::::: ::::::::::::::::::::::::::::::::::::::::::::::::.::::: CCDS11 GISLQDMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDRFGTELA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 QMQSLISNLEEQLSEIRADLERQNQEYQVLLDVKARLENEIATYRNLLESEDCKLPCNPC ::::::::.:::::::::::::::::::::::::.::::::::::::::::::::::::: CCDS11 QMQSLISNVEEQLSEIRADLERQNQEYQVLLDVKTRLENEIATYRNLLESEDCKLPCNPC 370 380 390 400 410 420 430 440 pF1KB7 STPASCTS--C---PSCGPVTGGSPSGHGASMGR :: ::.. : ::::: : .:. ... : CCDS11 STSPSCVTAPCAPRPSCGPCTTCGPTCGASTTGSRF 430 440 450 >>CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 (416 aa) initn: 1641 init1: 1526 opt: 1579 Z-score: 1173.8 bits: 226.3 E(32554): 4.6e-59 Smith-Waterman score: 1588; 62.4% identity (83.9% similar) in 386 aa overlap (64-440:19-401) 40 50 60 70 80 90 pF1KB7 PVAEANAASMCLLANVAHANRVRVGSTPLGRPSLCLPPTSHTACPLPGTCHIPGNIGICG :: :.::. :. : :::.:.::.:.. :. CCDS11 MPYNFCLPSLSCRTSCSSRP--CVPPSCHS-CTLPGACNIPANVSNCN 10 20 30 40 100 110 120 130 140 150 pF1KB7 AYGKNTLNGHEKETMKFLNDRLANYLEKVRQLEQENAELETTLLERSKCHESTVCPDYQS . ....:: :::::.:::::::.:::::::::..:::::. . :::. .: .::.::: CCDS11 WFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERSQQQEPLLCPSYQS 50 60 70 80 90 100 160 170 180 190 200 210 pF1KB7 YFRTIEELQQKILCSKAENARLIVQIDNAKLAADDFRIKLESERSLHQLVEADKCGTQKL ::.:::::::::::.:.:::::.:::::::::::::: : ..: ::.::::.: : ... CCDS11 YFKTIEELQQKILCTKSENARLVVQIDNAKLAADDFRTKYQTELSLRQLVESDINGLRRI 110 120 130 140 150 160 220 230 240 250 260 270 pF1KB7 LDDATLAKADLEAQQESLKEEQLSLKSNHEQEVKILRSQLGEKFRIELDIEPTIDLNRVL ::. :: :.::::: :::::: : :::::::::. :: :::... .:.: ::.:::::: CCDS11 LDELTLCKSDLEAQVESLKEELLCLKSNHEQEVNTLRCQLGDRLNVEVDAAPTVDLNRVL 170 180 190 200 210 220 280 290 300 310 320 330 pF1KB7 GEMRAQYEAMVETNHQDVEQWFQAQSEGISLQAMSCSEELQCCQSEILELRCTVNALEVE .: :.::::.::::...::::: .:.: .. :..: ::.:: :.::.::: ::::::.: CCDS11 NETRSQYEALVETNRREVEQWFTTQTEELNKQVVSSSEQLQSYQAEIIELRRTVNALEIE 230 240 250 260 270 280 340 350 360 370 380 390 pF1KB7 RQAQHTLKDCLQNSLCEAEDRYGTELAQMQSLISNLEEQLSEIRADLERQNQEYQVLLDV ::::.:.: :.:.: :.: ::...:.:.::::.:.: ::.:::.::::::::::::::: CCDS11 LQAQHNLRDSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDLERQNQEYQVLLDV 290 300 310 320 330 340 400 410 420 430 440 pF1KB7 KARLENEIATYRNLLESEDCKLPCNPCSTPASCTS---------CPSCGPVTGGSPSGHG .:::: :: :::.:::::::.:: :::.: .:.. : :: : . .: CCDS11 RARLECEINTYRSLLESEDCNLPSNPCATTNACSKPIGPCLSNPCTSCVPPAPCTPCAPR 350 360 370 380 390 400 pF1KB7 ASMGR CCDS11 PRCGPCNSFVR 410 >>CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 (404 aa) initn: 1581 init1: 1506 opt: 1569 Z-score: 1166.7 bits: 224.9 E(32554): 1.2e-58 Smith-Waterman score: 1569; 62.6% identity (83.9% similar) in 385 aa overlap (64-448:19-397) 40 50 60 70 80 90 pF1KB7 PVAEANAASMCLLANVAHANRVRVGSTPLGRPSLCLPPTSHTACPLPGTCHIPGNIGICG :: :.::. : .: :::.:.::.:.. :. CCDS11 MSYSCGLPSLSCRTSCSSRP--CVPPSCH-GCTLPGACNIPANVSNCN 10 20 30 40 100 110 120 130 140 150 pF1KB7 AYGKNTLNGHEKETMKFLNDRLANYLEKVRQLEQENAELETTLLERSKCHESTVCPDYQS . ....:: :::::.:::::::.:::::::::..:::::. . :::. .: :: .::: CCDS11 WFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERSQQQEPLVCASYQS 50 60 70 80 90 100 160 170 180 190 200 210 pF1KB7 YFRTIEELQQKILCSKAENARLIVQIDNAKLAADDFRIKLESERSLHQLVEADKCGTQKL ::.:::::::::::::.:::::.:::::::::.:::: : :.: ::.::::.: : ... CCDS11 YFKTIEELQQKILCSKSENARLVVQIDNAKLASDDFRTKYETELSLRQLVESDINGLRRI 110 120 130 140 150 160 220 230 240 250 260 270 pF1KB7 LDDATLAKADLEAQQESLKEEQLSLKSNHEQEVKILRSQLGEKFRIELDIEPTIDLNRVL ::. :: ..::::: :::::: : ::.::::::. :: :::... .:.: ::.:::.:: CCDS11 LDELTLCRSDLEAQVESLKEELLCLKQNHEQEVNTLRCQLGDRLNVEVDAAPTVDLNQVL 170 180 190 200 210 220 280 290 300 310 320 330 pF1KB7 GEMRAQYEAMVETNHQDVEQWFQAQSEGISLQAMSCSEELQCCQSEILELRCTVNALEVE .: :.::::.::::...::::: .:.: .. :..: ::.:: :.::.::: ::::::.: CCDS11 NETRSQYEALVETNRREVEQWFATQTEELNKQVVSSSEQLQSYQAEIIELRRTVNALEIE 230 240 250 260 270 280 340 350 360 370 380 390 pF1KB7 RQAQHTLKDCLQNSLCEAEDRYGTELAQMQSLISNLEEQLSEIRADLERQNQEYQVLLDV ::::.:.: :.:.: :.: ::...:.:.: ::.:.: ::.:::.::::::::::::::: CCDS11 LQAQHNLRDSLENTLTESEARYSSQLSQVQRLITNVESQLAEIRSDLERQNQEYQVLLDV 290 300 310 320 330 340 400 410 420 430 440 pF1KB7 KARLENEIATYRNLLESEDCKLPCNPCSTPASCTSCPSCGPVTGGSPSGHGASMGR .:::: :: :::.:::::::::: :::.: .: . : :: . .: : : : CCDS11 RARLECEINTYRSLLESEDCKLPSNPCATTNACDK--STGPCIS-NPCGLRARCGPCNTF 350 360 370 380 390 400 CCDS11 GY >>CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 (404 aa) initn: 1596 init1: 1506 opt: 1556 Z-score: 1157.2 bits: 223.2 E(32554): 3.9e-58 Smith-Waterman score: 1556; 62.1% identity (84.6% similar) in 383 aa overlap (64-440:19-398) 40 50 60 70 80 90 pF1KB7 PVAEANAASMCLLANVAHANRVRVGSTPLGRPSLCLPPTSHTACPLPGTCHIPGNIGICG :: :.::. : . :::.:.::.:.. :. CCDS11 MPYNFCLPSLSCRTSCSSRP--CVPPSCH-GYTLPGACNIPANVSNCN 10 20 30 40 100 110 120 130 140 150 pF1KB7 AYGKNTLNGHEKETMKFLNDRLANYLEKVRQLEQENAELETTLLERSKCHESTVCPDYQS . ....:: :::::.:::::::.:::::::::..:::::. . :::. .: .::.::: CCDS11 WFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERSQQQEPLLCPSYQS 50 60 70 80 90 100 160 170 180 190 200 210 pF1KB7 YFRTIEELQQKILCSKAENARLIVQIDNAKLAADDFRIKLESERSLHQLVEADKCGTQKL ::.:::::::::::::.:::::.:::::::::::::: : ..:.::.::::.: . ... CCDS11 YFKTIEELQQKILCSKSENARLVVQIDNAKLAADDFRTKYQTEQSLRQLVESDINSLRRI 110 120 130 140 150 160 220 230 240 250 260 270 pF1KB7 LDDATLAKADLEAQQESLKEEQLSLKSNHEQEVKILRSQLGEKFRIELDIEPTIDLNRVL ::. :: ..:::::.:::::: ::::.::::::. :: :::... .:.: :..:::.:: CCDS11 LDELTLCRSDLEAQMESLKEELLSLKQNHEQEVNTLRCQLGDRLNVEVDAAPAVDLNQVL 170 180 190 200 210 220 280 290 300 310 320 330 pF1KB7 GEMRAQYEAMVETNHQDVEQWFQAQSEGISLQAMSCSEELQCCQSEILELRCTVNALEVE .: : ::::.::::...::::: .:.: .. :..: ::.:: :.::.::: ::::::.: CCDS11 NETRNQYEALVETNRREVEQWFATQTEELNKQVVSSSEQLQSYQAEIIELRRTVNALEIE 230 240 250 260 270 280 340 350 360 370 380 390 pF1KB7 RQAQHTLKDCLQNSLCEAEDRYGTELAQMQSLISNLEEQLSEIRADLERQNQEYQVLLDV ::::.:. :.:.: :.: ::...:.:.::::.:.: ::.:::.::::::::::::::: CCDS11 LQAQHNLRYSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDLERQNQEYQVLLDV 290 300 310 320 330 340 400 410 420 430 440 pF1KB7 KARLENEIATYRNLLESEDCKLPCNPCSTPASCT----SCPS--CGPVTGGSPSGHGASM .:::: :: :::.:::::::::: :::.: .: :: . ::: . .: CCDS11 RARLECEINTYRSLLESEDCKLPSNPCATTNACEKPIGSCVTNPCGPRSRCGPCNTFGY 350 360 370 380 390 400 pF1KB7 GR >>CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 (436 aa) initn: 1547 init1: 1490 opt: 1554 Z-score: 1155.3 bits: 222.9 E(32554): 5e-58 Smith-Waterman score: 1554; 62.2% identity (85.1% similar) in 376 aa overlap (64-438:61-433) 40 50 60 70 80 90 pF1KB7 PVAEANAASMCLLANVAHANRVRVGSTPLGRPSLCLPPTSHTACPLPGTCHIPGNIGICG :: :.::. : . :::.:.::.:.. :. CCDS11 QLTCFSITCSSTMSYSCCLPSLGCRTSCSSRP--CVPPSCH-GYTLPGACNIPANVSNCN 40 50 60 70 80 100 110 120 130 140 150 pF1KB7 AYGKNTLNGHEKETMKFLNDRLANYLEKVRQLEQENAELETTLLERSKCHESTVCPDYQS . ....:: :::::.:::::::.:::::::::..::::: . :::. .: .::.::: CCDS11 WFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELEKLIQERSQQQEPLLCPSYQS 90 100 110 120 130 140 160 170 180 190 200 210 pF1KB7 YFRTIEELQQKILCSKAENARLIVQIDNAKLAADDFRIKLESERSLHQLVEADKCGTQKL ::.:::::::::::.:::::::.:.:::::::.:::: : ..:.::. :::.: . ... CCDS11 YFKTIEELQQKILCAKAENARLVVNIDNAKLASDDFRSKYQTEQSLRLLVESDINSIRRI 150 160 170 180 190 200 220 230 240 250 260 270 pF1KB7 LDDATLAKADLEAQQESLKEEQLSLKSNHEQEVKILRSQLGEKFRIELDIEPTIDLNRVL ::. :: :.:::.: :::.:: . ::.:::.::. ::::::... .:.: ::.:::.:: CCDS11 LDELTLCKSDLESQVESLREELICLKKNHEEEVNTLRSQLGDRLNVEVDTAPTVDLNQVL 210 220 230 240 250 260 280 290 300 310 320 330 pF1KB7 GEMRAQYEAMVETNHQDVEQWFQAQSEGISLQAMSCSEELQCCQSEILELRCTVNALEVE .: :.::::.:: :...::::: .:.: .. :..: ::.:: ::.::.::: ::::::.: CCDS11 NETRSQYEALVEINRREVEQWFATQTEELNKQVVSSSEQLQSCQAEIIELRRTVNALEIE 270 280 290 300 310 320 340 350 360 370 380 390 pF1KB7 RQAQHTLKDCLQNSLCEAEDRYGTELAQMQSLISNLEEQLSEIRADLERQNQEYQVLLDV ::::.:.: :.:.: :.: .:...:.:.::::.:.: ::.::: ::::::::::::::: CCDS11 LQAQHNLRDSLENTLTESEAHYSSQLSQVQSLITNVESQLAEIRCDLERQNQEYQVLLDV 330 340 350 360 370 380 400 410 420 430 440 pF1KB7 KARLENEIATYRNLLESEDCKLPCNPCSTP-ASCTSCPSCGPVTGGSPSGHGASMGR .:::: :: :::.::::::::::::::.: :: .:: :: : CCDS11 RARLECEINTYRSLLESEDCKLPCNPCATTNASGNSCGPCGTSQKGCCN 390 400 410 420 430 >>CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 (448 aa) initn: 1491 init1: 1450 opt: 1513 Z-score: 1125.1 bits: 217.4 E(32554): 2.4e-56 Smith-Waterman score: 1518; 62.1% identity (81.3% similar) in 391 aa overlap (65-444:48-437) 40 50 60 70 80 pF1KB7 VAEANAASMCLLANVAHANRVRVGSTPLGRPSLCLPPTSHTA-C----PLPGTCH----I ::.::: : . : : : ..:. : CCDS11 CPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPASCLSKTYLSSSCQAASGI 20 30 40 50 60 70 90 100 110 120 130 140 pF1KB7 PGNIGICGAYGKNTLNGHEKETMKFLNDRLANYLEKVRQLEQENAELETTLLERSKCHES :..: . :.....::.:::::.:::::::.:: .::::::::::::. . : :. . CCDS11 SGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAELESRIQEASHSQVL 80 90 100 110 120 130 150 160 170 180 190 200 pF1KB7 TVCPDYQSYFRTIEELQQKILCSKAENARLIVQIDNAKLAADDFRIKLESERSLHQLVEA :. :::::.:::::::::::::.::::::..:.:::::::::::: : :.: ...::::: CCDS11 TMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAKYEAELAMRQLVEA 140 150 160 170 180 190 210 220 230 240 250 260 pF1KB7 DKCGTQKLLDDATLAKADLEAQQESLKEEQLSLKSNHEQEVKILRSQLGEKFRIELDIEP : : ...::: :: ::::::: :::::: . ::.:::.:: :: :::... ::.: : CCDS11 DINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQLGDRLNIEVDAAP 200 210 220 230 240 250 270 280 290 300 310 320 pF1KB7 TIDLNRVLGEMRAQYEAMVETNHQDVEQWFQAQSEGISLQAMSCSEELQCCQSEILELRC .::.::: ::: :::::::.:..:::.::. : : .. :. . ::.:: ::.:..:: CCDS11 PVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQLQNYQSDIIDLRR 260 270 280 290 300 310 330 340 350 360 370 380 pF1KB7 TVNALEVERQAQHTLKDCLQNSLCEAEDRYGTELAQMQSLISNLEEQLSEIRADLERQNQ :::.::.: ::::.:.: :.:.: :.: ::...::::: .:.:.: ::.::::::::::: CCDS11 TVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQLAEIRADLERQNQ 320 330 340 350 360 370 390 400 410 420 430 440 pF1KB7 EYQVLLDVKARLENEIATYRNLLESEDCKLPCNPCSTPASCTSC-PS-CGPVTGGSPSGH ::::::::.::::.:: :::.:::.::::::::::::: :::.: :: : : : : CCDS11 EYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTP-SCTTCVPSPCVPRTVCVPRTV 380 390 400 410 420 430 pF1KB7 GASMGR : CCDS11 GMPCSPCPQGRY 440 >>CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 (467 aa) initn: 1504 init1: 1467 opt: 1495 Z-score: 1111.7 bits: 215.0 E(32554): 1.3e-55 Smith-Waterman score: 1502; 56.7% identity (76.4% similar) in 436 aa overlap (2-435:7-425) 10 20 30 40 50 pF1KB7 MTSFYSTSSCPLGCTMAPGARNVFVSPIDVG-CQPVAEANAASMCLLANVAHANR : .::.: : : : : : .:: :. . :.::. . . CCDS11 MATQTCTPTFSTGSIKGLCGTAGGISRV-SSIRSVGSCRVPSLAGAAG--------YISS 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 VRVGSTPLGRPSLCLPPTSHTACPLPGTCHIPGNIGICGAYGKNTLNGHEKETMKFLNDR .: : . :: ::: . : . :: : .: : . ....:: :::::.::::: CCDS11 ARSGLSGLGS---CLPGSY-----LSSECHTSGFVGSGGWFCEGSFNGSEKETMQFLNDR 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 LANYLEKVRQLEQENAELETTLLERSKCHESTVCPDYQSYFRTIEELQQKILCSKAENAR ::::::::::::.::::::. . : . . .::::::::.:::..::::: .:.:::: CCDS11 LANYLEKVRQLERENAELESRIQEWYEFQIPYICPDYQSYFKTIEDFQQKILLTKSENAR 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 LIVQIDNAKLAADDFRIKLESERSLHQLVEADKCGTQKLLDDATLAKADLEAQQESLKEE :..::::::::::::: : :.: ::.:::::: : ...::. :: ::::::: :::::: CCDS11 LVLQIDNAKLAADDFRTKYETELSLRQLVEADINGLRRILDELTLCKADLEAQVESLKEE 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 QLSLKSNHEQEVKILRSQLGEKFRIELDIEPTIDLNRVLGEMRAQYEAMVETNHQDVEQW . ::.:::.::..:: :::... .:.: : .:::..: .:: ::::.::.:..::: : CCDS11 LMCLKKNHEEEVSVLRCQLGDRLNVEVDAAPPVDLNKILEDMRCQYEALVENNRRDVEAW 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 FQAQSEGISLQAMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDR :..:.: .. :..: ::.:::::.::.::: ::::::.: ::::.... :...: :.: : CCDS11 FNTQTEELNQQVVSSSEQLQCCQTEIIELRRTVNALEIELQAQHSMRNSLESTLAETEAR 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 YGTELAQMQSLISNLEEQLSEIRADLERQNQEYQVLLDVKARLENEIATYRNLLESEDCK :...::::: ::::.: :::::: ::::::::::::::::::::.::::::.:::.:::: CCDS11 YSSQLAQMQCLISNVEAQLSEIRCDLERQNQEYQVLLDVKARLEGEIATYRHLLEGEDCK 350 360 370 380 390 400 420 430 440 pF1KB7 LPCNPCSTPAS-CTSCPSCGPVTGGSPSGHGASMGR :: .::.: . :: :: CCDS11 LPPQPCATACKPVIRVPSVPPVPCVPSVPCTPAPQVGTQIRTITEEIRDGKVISSREHVQ 410 420 430 440 450 460 >>CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 (455 aa) initn: 1512 init1: 1419 opt: 1484 Z-score: 1103.8 bits: 213.5 E(32554): 3.7e-55 Smith-Waterman score: 1484; 57.0% identity (76.1% similar) in 435 aa overlap (14-434:5-434) 10 20 30 40 50 pF1KB7 MTSFYSTSSCPLGCTMAPGARNVFVSPIDV--GCQPVAEANAASMCLLANVAHANR-VRV : : . . . :: . : :. ..: : : ... . : . CCDS11 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSA 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 GSTPLGRPSL----CLPPTSHTACPLPGTCHIPGNIGICGAYGKNTLNGHEKETMKFLND :. ::: : ::: : ::. . : : .:.. :.:.:::::. ::: CCDS11 CSVGLGRSSYRATSCLPAL----C-LPAGGFATSYSGGGGWFGEGILTGNEKETMQSLND 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 RLANYLEKVRQLEQENAELETTLLERSKCHESTVCPDYQSYFRTIEELQQKILCSKAENA :::.::::::::::::: ::. . : . . .:::::::::::::::.: :::::::: CCDS11 RLAGYLEKVRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 RLIVQIDNAKLAADDFRIKLESERSLHQLVEADKCGTQKLLDDATLAKADLEAQQESLKE ::.:.:::::::::::: : :.: ::.::::.: : ...::: :: :.::::: ::::: CCDS11 RLVVEIDNAKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKE 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 EQLSLKSNHEQEVKILRSQLGEKFRIELDIEPTIDLNRVLGEMRAQYEAMVETNHQDVEQ : : ::.:::.::. :: :::... .:.: : .:::::: ::: :::..::.:..:.:. CCDS11 ELLCLKKNHEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAED 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 WFQAQSEGISLQAMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAED :...::: .. :..: ::.:: ::.::.::: ::::::.: ::::...: :...: :.: CCDS11 WLDTQSEELNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 RYGTELAQMQSLISNLEEQLSEIRADLERQNQEYQVLLDVKARLENEIATYRNLLESEDC ::...::::: .:.:.: ::.:::::::::::::::::::.:::: :: :::.:::::: CCDS11 RYSSQLAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDS 350 360 370 380 390 400 420 430 440 pF1KB7 KLPCNPCS---TPA-SCTSC-P--SCGPVTGGSPSGHGASMGR :::::::. .:. :: : : :::: CCDS11 KLPCNPCAPDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF 410 420 430 440 450 >>CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 (431 aa) initn: 1328 init1: 1235 opt: 1342 Z-score: 1000.1 bits: 194.2 E(32554): 2.2e-49 Smith-Waterman score: 1352; 50.8% identity (73.9% similar) in 437 aa overlap (1-436:1-419) 10 20 30 40 50 pF1KB7 MTSFYSTSSC-PLGCTMAPGARNVFVSPIDVGCQPVAEANAASMCLLANVAHANRVRVGS ::: :.. : : .: : : . ....: : . :.: : . .: .: CCDS42 MTSDCSSTHCSPESCGTASGCAPASSCSVETACLP--GTCATSRCQTPSFLSRSRGLTG- 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 TPLGRPSLCLPPTSHTACPLPGTCHIPGNIGICGAYGKNTLNGHEKETMKFLNDRLANYL :: : : . :.:. : .: :. ......:::::.:::::::.:: CCDS42 --------CLLP-----CYFTGSCNSPCLVGNCAWCEDGVFTSNEKETMQFLNDRLASYL 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 EKVRQLEQENAELETTLLERSKCHESTVCPDYQSYFRTIEELQQKILCSKAENARLIVQI ::::.::. :::::. . :. . :::::: :: :::.:::::::.::::.:: ::. CCDS42 EKVRSLEETNAELESRIQEQCEQDIPMVCPDYQRYFNTIEDLQQKILCTKAENSRLAVQL 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 DNAKLAADDFRIKLESERSLHQLVEADKCGTQKLLDDATLAKADLEAQQESLKEEQLSLK :: :::.:::. : ::: ::.::.::: . . .:.. :: :.::::. :::::. : :: CCDS42 DNCKLATDDFKSKYESELSLRQLLEADISSLHGILEELTLCKSDLEAHVESLKEDLLCLK 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 SNHEQEVKILRSQLGEKFRIELDIEPTIDLNRVLGEMRAQYEAMVETNHQDVEQWFQAQS .:::.::..:: :::... .::: ::.:::::: ::: : :... .:....:.:. .:. CCDS42 KNHEEEVNLLREQLGDRLSVELDTAPTLDLNRVLDEMRCQCETVLANNRREAEEWLAVQT 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 EGISLQAMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDRYGTEL : .. : .: .:.:: :: :::::. :..:::.: :::..: . :. .. :.: .:...: CCDS42 EELNQQQLSSAEQLQGCQMEILELKRTASALEIELQAQQSLTESLECTVAETEAQYSSQL 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 AQMQSLISNLEEQLSEIRADLERQNQEYQVLLDVKARLENEIATYRNLLESEDCKLPCNP ::.: ::.:::.::.::: ::::::::::::::::::::.:: :: .::.::: .: :.: CCDS42 AQIQCLIDNLENQLAEIRCDLERQNQEYQVLLDVKARLEGEINTYWGLLDSEDSRLSCSP 350 360 370 380 390 400 420 430 440 pF1KB7 CSTPASCTSCPSCGPVTGGSPSGHGASMGR ::: .::: .: : . CCDS42 CST--TCTSSNTCEPCSAYVICTVENCCL 410 420 430 449 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 06:10:00 2016 done: Fri Nov 4 06:10:00 2016 Total Scan time: 2.710 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]