FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0564, 448 aa 1>>>pF1KE0564 448 - 448 aa - 448 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.5063+/-0.00119; mu= 9.2167+/- 0.071 mean_var=217.8258+/-41.707, 0's: 0 Z-trim(110.2): 139 B-trim: 107 in 2/52 Lambda= 0.086900 statistics sampled from 11269 (11417) to 11269 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.694), E-opt: 0.2 (0.351), width: 16 Scan time: 2.410 The best scores are: opt bits E(32554) CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 3005 389.8 3e-108 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1899 251.1 1.7e-66 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1885 249.4 5.7e-66 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1819 241.1 1.6e-63 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1754 232.9 4.6e-61 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1752 232.7 5.4e-61 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1731 230.1 3.5e-60 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1588 212.1 8.7e-55 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1564 209.2 7.7e-54 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1552 207.6 2.1e-53 CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 1513 202.7 6.1e-52 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1227 166.9 3.9e-41 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1220 166.0 7e-41 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 1208 164.4 1.8e-40 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1201 163.6 3.5e-40 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1190 162.3 9.7e-40 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1176 160.5 3.2e-39 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1165 159.1 7.9e-39 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1115 153.0 7.6e-37 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1087 149.4 7.7e-36 CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1027 141.8 1.3e-33 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 996 137.9 2e-32 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 984 136.4 5.7e-32 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 979 135.8 8.7e-32 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 980 136.0 8.8e-32 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 961 133.5 4e-31 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 909 127.2 4.7e-29 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 904 126.4 6e-29 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 892 124.9 1.6e-28 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 701 100.7 2e-21 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 608 89.3 8.5e-18 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 608 89.3 8.5e-18 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 608 89.3 8.5e-18 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 595 88.0 4.3e-17 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 587 86.7 5.5e-17 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 565 83.9 3.7e-16 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 542 81.1 2.9e-15 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 540 80.8 3.4e-15 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 539 80.7 4e-15 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 538 80.6 4e-15 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 536 80.3 4.9e-15 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 533 79.9 6.2e-15 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 531 79.7 8e-15 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 535 80.5 8.4e-15 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 531 79.8 8.4e-15 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 526 79.1 1.2e-14 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 520 78.3 1.9e-14 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 520 78.3 2e-14 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 519 78.1 2e-14 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 516 77.8 2.6e-14 >>CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 (448 aa) initn: 3005 init1: 3005 opt: 3005 Z-score: 2056.9 bits: 389.8 E(32554): 3e-108 Smith-Waterman score: 3005; 100.0% identity (100.0% similar) in 448 aa overlap (1-448:1-448) 10 20 30 40 50 60 pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 NAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 FRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 FRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 LRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVAT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 SSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 VEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTC 370 380 390 400 410 420 430 440 pF1KE0 VPSPCVPRTVCVPRTVGMPCSPCPQGRY :::::::::::::::::::::::::::: CCDS11 VPSPCVPRTVCVPRTVGMPCSPCPQGRY 430 440 >>CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 (455 aa) initn: 1943 init1: 1798 opt: 1899 Z-score: 1307.5 bits: 251.1 E(32554): 1.7e-66 Smith-Waterman score: 1915; 67.0% identity (82.3% similar) in 464 aa overlap (1-448:1-455) 10 20 30 40 50 pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNC--RPELCLGYVCQPMACLPSVCLP----T :.:.: .. ..:::: : :: :. :. : .:.: :.: . CCDS11 MASKCLKAGFSSGSLKS-PGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRS 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 TFRPASCLSKTYLSSSCQAASGISGSM-GPGSWYSEGAFNGNEKETMQFLNDRLASYLTR ..: .::: : :.:.. :. : :.:..:: ..:::::::: ::::::.:: . CCDS11 SYRATSCLPAL-----CLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 VRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDN ::::::::: :::::.: ..:: : :::::.::::::::.: ::.::::::.::.::: CCDS11 VRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 AKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKN :::::::::.:::.:...:::::.::::::::::::::::.:::::::::::::.::::: CCDS11 AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 HEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEE :::::.:::::::::::.::::::::::.:::::::::::..:: ::::.:.:.. : :: CCDS11 HEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 LNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQ :::::..::::::. :..::.::::::.::::::::::.::.::.::.:.:::::::::: CCDS11 LNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCS ::::::::::::::::::::::::::::::::::::: ::::::.:::.:: :::::::. CCDS11 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA 360 370 380 390 400 410 420 430 440 pF1KE0 ---TPS--CTTCVPSP-CVP---RTVCVPRTVGMPCSPCPQGRY .:: : :.:. : : :: : :: . : ::: ::. CCDS11 PDYSPSKSCLPCLPAASCGPSAARTNCSPRPI---CVPCPGGRF 420 430 440 450 >>CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 (467 aa) initn: 1930 init1: 1765 opt: 1885 Z-score: 1297.9 bits: 249.4 E(32554): 5.7e-66 Smith-Waterman score: 1896; 66.4% identity (82.9% similar) in 455 aa overlap (1-445:1-438) 10 20 30 40 50 pF1KE0 MTSSCCVTNNLQASLKS-C------PRPASVCSSGVNCR-PELC--LGYVCQPMACLPSV :... :. . .:.:. : : .:. : : .:: : : ::. . . : .. CCDS11 MATQTCTPTFSTGSIKGLCGTAGGISRVSSIRSVG-SCRVPSLAGAAGYISSARSGLSGL 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 CLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASY .::: .:::: :.. :: .: :.:. ::.:::.:::::::::::::.: CCDS11 --------GSCLPGSYLSSECHT----SGFVGSGGWFCEGSFNGSEKETMQFLNDRLANY 60 70 80 90 100 120 130 140 150 160 170 pF1KE0 LTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVN : .:::::.::::::::::: . :. . :::::.:.:::..::::: ::.::::.:.. CCDS11 LEKVRQLERENAELESRIQEWYEFQIPYICPDYQSYFKTIEDFQQKILLTKSENARLVLQ 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE0 IDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCL ::::::::::::.:::.::..::::::::::::::::.:::::::::::::::::::::: CCDS11 IDNAKLAADDFRTKYETELSLRQLVEADINGLRRILDELTLCKADLEAQVESLKEELMCL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE0 KKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQ ::::::::. ::::::::::.::::::::::...::.:::::::.:: :::::: ::: : CCDS11 KKNHEEEVSVLRCQLGDRLNVEVDAAPPVDLNKILEDMRCQYEALVENNRRDVEAWFNTQ 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE0 MEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQ :::::::..:::::: :..::.::::::.::::::::::.:.:::.::.:.::::::: CCDS11 TEELNQQVVSSSEQLQCCQTEIIELRRTVNALEIELQAQHSMRNSLESTLAETEARYSSQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE0 LAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCN ::::::.:.::::::.::: :::::::::::::::.::::::: ::: :::.:::::: . CCDS11 LAQMQCLISNVEAQLSEIRCDLERQNQEYQVLLDVKARLEGEIATYRHLLEGEDCKLPPQ 350 360 370 380 390 400 420 430 440 pF1KE0 PCSTPSCTTCVPSPCVPRTVCVPRTVGMPCSPCPQGRY ::.: .: . : :: . ::: ..::.: :: CCDS11 PCAT-ACKPVIRVPSVPPVPCVP---SVPCTPAPQVGTQIRTITEEIRDGKVISSREHVQ 410 420 430 440 450 460 CCDS11 SRPL >>CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 (416 aa) initn: 1889 init1: 1763 opt: 1819 Z-score: 1253.7 bits: 241.1 E(32554): 1.6e-63 Smith-Waterman score: 1819; 69.1% identity (87.4% similar) in 405 aa overlap (46-447:6-407) 20 30 40 50 60 70 pF1KE0 KSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPASCLSKTYLSSSCQAAS ::::. :. :. . : . .: CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHSCTLPGAC 10 20 30 80 90 100 110 120 130 pF1KE0 GISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAELESRIQEASHSQ .: .... .:. ::.:::.:::::::::::::::: .:::::..:::::. :.: :..: CCDS11 NIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERSQQQ 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE0 VLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAKYEAELAMRQLV . :.:::.:.:::::::::::::.::::.::.::::::::::::.::..::..:::: CCDS11 EPLLCPSYQSYFKTIEELQQKILCTKSENARLVVQIDNAKLAADDFRTKYQTELSLRQLV 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE0 EADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQLGDRLNIEVDA :.::::::::::.:::::.:::::::::::::.:::.:::.::..::::::::::.:::: CCDS11 ESDINGLRRILDELTLCKSDLEAQVESLKEELLCLKSNHEQEVNTLRCQLGDRLNVEVDA 160 170 180 190 200 210 260 270 280 290 300 310 pF1KE0 APPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQLQNYQSDIIDL :: :::.:::.: : ::::.::.:::.::.::. : ::::.::..::::::.::..::.: CCDS11 APTVDLNRVLNETRSQYEALVETNRREVEQWFTTQTEELNKQVVSSSEQLQSYQAEIIEL 220 230 240 250 260 270 320 330 340 350 360 370 pF1KE0 RRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQLAEIRADLERQ :::::.:::::::::.::::::::::::::::::::.:.: .:::::.::::::.::::: CCDS11 RRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDLERQ 280 290 300 310 320 330 380 390 400 410 420 430 pF1KE0 NQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTCVPSPCV--PRTVCVP ::::::::::::::: ::::::::::.:::.:: :::.: . . .::. : : ::: CCDS11 NQEYQVLLDVRARLECEINTYRSLLESEDCNLPSNPCATTNACSKPIGPCLSNPCTSCVP 340 350 360 370 380 390 440 pF1KE0 RTVGMPCSPC-PQGRY . ::.:: :. : CCDS11 PA---PCTPCAPRPRCGPCNSFVR 400 410 >>CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 (404 aa) initn: 1770 init1: 1727 opt: 1754 Z-score: 1209.8 bits: 232.9 E(32554): 4.6e-61 Smith-Waterman score: 1754; 68.1% identity (86.1% similar) in 404 aa overlap (37-433:1-398) 10 20 30 40 50 60 pF1KE0 VTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQ-P-MACLPSVCLPTTFRPASCLSK ..: : : ..: : : : :: . CCDS11 MSYSCGLPSLSCRTS-CSSRPCVPPSCHGC 10 20 70 80 90 100 110 120 pF1KE0 TYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAEL : : ..:. ...:. .:. ::.:::.:::::::::::::::: .:::::..:::: CCDS11 T-LPGACNIPANVSNC----NWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAEL 30 40 50 60 70 80 130 140 150 160 170 180 pF1KE0 ESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAK :. :.: :..: . .:::.:.:::::::::::.:.::::.::.:::::::.::::.: CCDS11 ENLIRERSQQQEPLVCASYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLASDDFRTK 90 100 110 120 130 140 190 200 210 220 230 240 pF1KE0 YEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQ ::.::..:::::.::::::::::.::::..:::::::::::::.:::.:::.::..:::: CCDS11 YETELSLRQLVESDINGLRRILDELTLCRSDLEAQVESLKEELLCLKQNHEQEVNTLRCQ 150 160 170 180 190 200 250 260 270 280 290 300 pF1KE0 LGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQ ::::::.:::::: :::..::.: : ::::.::.:::.::.:: : ::::.::..:::: CCDS11 LGDRLNVEVDAAPTVDLNQVLNETRSQYEALVETNRREVEQWFATQTEELNKQVVSSSEQ 210 220 230 240 250 260 310 320 330 340 350 360 pF1KE0 LQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQ ::.::..::.::::::.:::::::::.::::::::::::::::::::.:.: .:::::.: CCDS11 LQSYQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQRLITNVESQ 270 280 290 300 310 320 370 380 390 400 410 pF1KE0 LAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPS-CTT---- :::::.:::::::::::::::::::: ::::::::::.:::::: :::.: . : CCDS11 LAEIRSDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACDKSTGP 330 340 350 360 370 380 420 430 440 pF1KE0 CVPSPCVPRTVCVPRTVGMPCSPCPQGRY :. .:: :. : : CCDS11 CISNPCGLRARCGPCNTFGY 390 400 >>CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 (404 aa) initn: 1755 init1: 1697 opt: 1752 Z-score: 1208.5 bits: 232.7 E(32554): 5.4e-61 Smith-Waterman score: 1752; 68.1% identity (87.2% similar) in 398 aa overlap (47-433:1-398) 20 30 40 50 60 70 pF1KE0 SCPRPASVCSSGVNCRPELCLGYVCQPMACLP-SVCLPTTFRPASCLSKTYLSSSCQA-- .: . :::. .:: :. . ::.. CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHGYT 10 20 30 80 90 100 110 120 130 pF1KE0 ---ASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAELESRIQE : .: .... .:. ::.:::.:::::::::::::::: .:::::..:::::. :.: CCDS11 LPGACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRE 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE0 ASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAKYEAELA :..: . :.:::.:.:::::::::::.:.::::.::.::::::::::::.::..: . CCDS11 RSQQQEPLLCPSYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLAADDFRTKYQTEQS 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE0 MRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQLGDRLN .:::::.:::.::::::.::::..:::::.:::::::. ::.:::.::..:::::::::: CCDS11 LRQLVESDINSLRRILDELTLCRSDLEAQMESLKEELLSLKQNHEQEVNTLRCQLGDRLN 160 170 180 190 200 210 260 270 280 290 300 310 pF1KE0 IEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQLQNYQS .:::::: :::..::.: : ::::.::.:::.::.:: : ::::.::..::::::.::. CCDS11 VEVDAAPAVDLNQVLNETRNQYEALVETNRREVEQWFATQTEELNKQVVSSSEQLQSYQA 220 230 240 250 260 270 320 330 340 350 360 370 pF1KE0 DIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQLAEIRA .::.::::::.:::::::::.:: :::::::::::::::::.:.: .:::::.::::::. CCDS11 EIIELRRTVNALEIELQAQHNLRYSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRS 280 290 300 310 320 330 380 390 400 410 420 pF1KE0 DLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPS-CT----TCVPSPC :::::::::::::::::::: ::::::::::.:::::: :::.: . : .:: .:: CCDS11 DLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACEKPIGSCVTNPC 340 350 360 370 380 390 430 440 pF1KE0 VPRTVCVPRTVGMPCSPCPQGRY ::. : : CCDS11 GPRSRCGPCNTFGY 400 >>CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 (436 aa) initn: 1710 init1: 1710 opt: 1731 Z-score: 1193.9 bits: 230.1 E(32554): 3.5e-60 Smith-Waterman score: 1731; 65.7% identity (83.8% similar) in 414 aa overlap (20-425:23-427) 10 20 30 40 50 pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELC---LGYVCQPMACLPSV---- .:: . . ..: : ..: : ::::. CCDS11 MLYAKPPPTINGIKGLQRKERLKPAHIHLQQLTCFSITCSSTMSYSC----CLPSLGCRT 10 20 30 40 50 60 70 80 90 100 pF1KE0 -CLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLAS : : :: . : : ..:. ...:. .:. ::.:::.:::::::::::::: CCDS11 SCSSRPCVPPSCHGYT-LPGACNIPANVSNC----NWFCEGSFNGSEKETMQFLNDRLAS 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE0 YLTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVV :: .:::::..:::::. ::: :..: . :.:::.:.:::::::::::.::::::.:: CCDS11 YLEKVRQLERDNAELEKLIQERSQQQEPLLCPSYQSYFKTIEELQQKILCAKAENARLVV 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE0 NIDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMC ::::::::.::::.::..: ..: :::.:::..:::::.:::::.:::.:::::.:::.: CCDS11 NIDNAKLASDDFRSKYQTEQSLRLLVESDINSIRRILDELTLCKSDLESQVESLREELIC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE0 LKKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNM :::::::::..:: :::::::.:::.:: :::..::.: : ::::.:: :::.::.:: CCDS11 LKKNHEEEVNTLRSQLGDRLNVEVDTAPTVDLNQVLNETRSQYEALVEINRREVEQWFAT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE0 QMEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSS : ::::.::..::::::. :..::.::::::.:::::::::.::::::::::::::.::: CCDS11 QTEELNKQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEAHYSS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE0 QLAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPC ::.:.: .:::::.:::::: :::::::::::::::::::: ::::::::::.::::::: CCDS11 QLSQVQSLITNVESQLAEIRCDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPC 360 370 380 390 400 410 410 420 430 440 pF1KE0 NPCSTPSCTTCVPSPCVPRTVCVPRTVGMPCSPCPQGRY :::.: . . .:: CCDS11 NPCATTNASGNSCGPCGTSQKGCCN 420 430 >>CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 (431 aa) initn: 1632 init1: 1468 opt: 1588 Z-score: 1097.0 bits: 212.1 E(32554): 8.7e-55 Smith-Waterman score: 1588; 57.9% identity (79.3% similar) in 439 aa overlap (1-431:1-424) 10 20 30 40 50 60 pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS :::.: :. : .:: :: :. . .: : .: : .: : : .: : CCDS42 MTSDCSSTH---CSPESCGT-ASGCAPASSCSVET----ACLPGTCATSRCQTPSFLSRS 10 20 30 40 50 70 80 90 100 110 pF1KE0 -----CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVR :: :...::.. . : .: .:.:..::::::::::::::::: .:: CCDS42 RGLTGCLLPCYFTGSCNSPCLV----GNCAWCEDGVFTSNEKETMQFLNDRLASYLEKVR 60 70 80 90 100 120 130 140 150 160 170 pF1KE0 QLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAK .::. :::::::::: .... . :::: .: :::.::::::::::::.:..:..:: : CCDS42 SLEETNAELESRIQEQCEQDIPMVCPDYQRYFNTIEDLQQKILCTKAENSRLAVQLDNCK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE0 LAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHE ::.:::..:::.::..:::.::::..:. ::..:::::.::::.::::::.:.::::::: CCDS42 LATDDFKSKYESELSLRQLLEADISSLHGILEELTLCKSDLEAHVESLKEDLLCLKKNHE 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE0 EEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELN :::. :: ::::::..:.:.:: .::.:::.::::: :... :::..:::. .: :::: CCDS42 EEVNLLREQLGDRLSVELDTAPTLDLNRVLDEMRCQCETVLANNRREAEEWLAVQTEELN 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE0 QQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQ :: .:.::::. : .:..:.::...::::::::.:: .::: :..:.::.:::::::.: CCDS42 QQQLSSAEQLQGCQMEILELKRTASALEIELQAQQSLTESLECTVAETEAQYSSQLAQIQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE0 CMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTP :.: :.: :::::: :::::::::::::::.:::::::::: .::..:: .: :.:::: CCDS42 CLIDNLENQLAEIRCDLERQNQEYQVLLDVKARLEGEINTYWGLLDSEDSRLSCSPCST- 350 360 370 380 390 400 420 430 440 pF1KE0 SCT---TCVPSPCVPRTVCVPRTVGMPCSPCPQGRY .:: :: :: ..: CCDS42 TCTSSNTC--EPCSAYVICTVENCCL 410 420 430 >>CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 (491 aa) initn: 1553 init1: 1434 opt: 1564 Z-score: 1080.1 bits: 209.2 E(32554): 7.7e-54 Smith-Waterman score: 1564; 56.6% identity (77.7% similar) in 452 aa overlap (2-443:3-442) 10 20 30 40 50 pF1KE0 MTSSCCVTNNLQASLKSCPRPASVC--SSGVNCRPELCLGYVCQPMACLPSV-----CL :..: .::. .. ..: : ..: ::. .:.: ::: . . . : CCDS11 MDTKGCTTTNSPSTPCQNCSRITNVSTISSNNGCHPGGLTVNNCQPAGHVLRIPWDQGCQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 PTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLT :: : : . :: .. .: :. :::.:: .:.:::::::.::.:::.:: CCDS11 PT---PRFCRKPIYLMNNFNA----RFSLDDCSWYGEG-INSNEKETMQILNERLANYLQ 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 RVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNID .::.::.:::::::.::: :.... .. ::: :.. ::::::::::::::::.:.: .:: CCDS11 KVRMLERENAELESKIQEESNKELPVLCPDYLSYYTTIEELQQKILCTKAENSRLVSQID 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 NAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKK :.::.:::.:::::::...:::::.: :::..::. ::: ::::::::.::::::.:::. CCDS11 NTKLTADDLRAKYEAEVSLRQLVESDANGLKQILNVLTLGKADLEAQVQSLKEELLCLKN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 NHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQME ::.::..::.::::.::.::: ::: .::..::.::::::: ..:.::.:::.::: :.: CCDS11 NHKEEINSLQCQLGERLDIEVTAAPSADLNQVLQEMRCQYEPIMETNRKDVEQWFNTQIE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 ELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLA ::::::.:::.: : :..::.:::.:::::.:::::: .::: : :::.::::.. :. CCDS11 ELNQQVVTSSQQQQCCQKEIIELRRSVNTLEVELQAQHRMRDSQECILTETEARYTALLT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 QMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPC :.: .: :.:::::::: ::::::::..::::..::: ::.:::::::. : : :: : CCDS11 QIQSLIDNLEAQLAEIRCALERQNQEYEILLDVKSRLECEITTYRSLLESSDGKRPCYP- 360 370 380 390 400 410 420 430 440 pF1KE0 STPSCTTCVPSP---CVPRTVCVPRTVGMPCSPCPQGRY : : ::: : .. . ::: CCDS11 ---RATKCEPSPWTSCKSGAIESTAPACTSSSPCSLKEHCSACGPLSRILVKICTITKEI 420 430 440 450 460 CCDS11 KDGKVISSYEHVQPCFIIRPAKV 470 480 490 >>CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 (456 aa) initn: 1596 init1: 1430 opt: 1552 Z-score: 1072.4 bits: 207.6 E(32554): 2.1e-53 Smith-Waterman score: 1557; 55.6% identity (74.4% similar) in 464 aa overlap (2-446:6-453) 10 20 30 40 pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRP--ELCLGYVC------------- .:: : : .. : .:: ..:.: : .. .: CCDS11 MTSSYSSSSC---PLGCTMAPGARNVSVSPIDIGCQPGAEANIAPMCLLANVAHANRVRV 10 20 30 40 50 50 60 70 80 90 pF1KE0 --QPMACLPSVCLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKET :.. ::.::: : : . : ..:. : :..: . :.:...::.:::: CCDS11 GSTPLG-RPSLCLPPT-----CHTACPLPGTCH----IPGNIGICGAYGENTLNGHEKET 60 70 80 90 100 100 110 120 130 140 150 pF1KE0 MQFLNDRLASYLTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILC :::::::::.:: .::::::::::::. . : :. . :. :::::.:.::::::::::: CCDS11 MQFLNDRLANYLEKVRQLEQENAELEATLLERSKCHESTVCPDYQSYFHTIEELQQKILC 110 120 130 140 150 160 160 170 180 190 200 210 pF1KE0 TKAENARMVVNIDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQ .::::::..:.:::::::::::: : :.: ..::::::: : ...::: :: ::::::: CCDS11 SKAENARLIVQIDNAKLAADDFRIKLESERSLRQLVEADKCGTQKLLDDATLAKADLEAQ 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE0 VESLKEELMCLKKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEAN :::::: . ::.:::.:: :: :::..: ::.: : .::.::: ::: :::::.:.: CCDS11 QESLKEEQLSLKSNHEQEVKILRSQLGEKLRIELDIEPTIDLNRVLGEMRAQYEAMLETN 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE0 RRDVEEWFNMQMEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENT :.:::.::. : : .. : . ::.:: ::.:..:: :::.::.: ::::.:.: :.:. CCDS11 RQDVEQWFQAQSEGISLQDMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNS 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE0 LTESEARYSSQLAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSL : :.: :....::::: .:.::: ::.:::::::::::::::::::..:::.:: :::.: CCDS11 LCEAEDRFGTELAQMQSLISNVEEQLSEIRADLERQNQEYQVLLDVKTRLENEIATYRNL 350 360 370 380 390 400 400 410 420 430 440 pF1KE0 LENEDCKLPCNPCST-PSCTTCVPSPCVPRTVCVP-RTVGMPCSPCPQGRY ::.:::::::::::: :::.: .::.:: : : : : :. : CCDS11 LESEDCKLPCNPCSTSPSCVT---APCAPRPSCGPCTTCGPTCGASTTGSRF 410 420 430 440 450 448 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 23:11:20 2016 done: Wed Nov 2 23:11:20 2016 Total Scan time: 2.410 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]