FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7222, 455 aa 1>>>pF1KB7222 455 - 455 aa - 455 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0660+/-0.000942; mu= 11.7751+/- 0.057 mean_var=193.2913+/-36.976, 0's: 0 Z-trim(112.5): 114 B-trim: 19 in 2/53 Lambda= 0.092250 statistics sampled from 13101 (13222) to 13101 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.743), E-opt: 0.2 (0.406), width: 16 Scan time: 3.440 The best scores are: opt bits E(32554) CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 3025 415.1 7.6e-116 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 2004 279.2 6.2e-75 CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1899 265.2 9.8e-71 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1872 261.6 1.1e-69 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1783 249.7 4.1e-66 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1770 248.0 1.4e-65 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1765 247.3 2.1e-65 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1648 231.8 1.1e-60 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1551 218.9 9.1e-57 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1534 216.6 4.1e-56 CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 1484 210.0 4.1e-54 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1320 188.2 1.6e-47 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1290 184.1 2.4e-46 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1279 182.7 7e-46 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1270 181.5 1.6e-45 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1266 181.0 2.3e-45 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1247 178.4 1.2e-44 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 1242 177.7 1.9e-44 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1180 169.6 7.4e-42 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1148 165.3 1.3e-40 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 1095 158.3 1.8e-38 CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1093 157.9 1.8e-38 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 1063 153.9 3.1e-37 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 1044 151.4 1.8e-36 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 993 144.6 1.9e-34 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 990 144.2 2.5e-34 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 985 143.7 5e-34 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 969 141.4 1.8e-33 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 946 138.3 1.4e-32 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 709 106.6 3.4e-23 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 617 94.6 2.3e-19 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 604 92.9 7.9e-19 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 601 92.5 1.1e-18 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 598 92.1 1.3e-18 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 594 91.6 2e-18 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 591 91.1 2.4e-18 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 591 91.1 2.4e-18 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 591 91.1 2.4e-18 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 591 91.2 2.6e-18 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 593 91.7 3.3e-18 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 587 90.7 4.3e-18 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 580 89.7 7.4e-18 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 569 88.2 2e-17 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 562 87.3 3.7e-17 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 551 85.8 1e-16 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 551 85.9 1.1e-16 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 548 85.5 1.5e-16 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 541 84.6 2.8e-16 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 536 83.8 4.1e-16 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 525 82.7 1.9e-15 >>CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 (455 aa) initn: 3025 init1: 3025 opt: 3025 Z-score: 2193.3 bits: 415.1 E(32554): 7.6e-116 Smith-Waterman score: 3025; 100.0% identity (100.0% similar) in 455 aa overlap (1-455:1-455) 10 20 30 40 50 60 pF1KB7 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 ENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAAD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 DFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 SLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 SSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMIT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 NVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPS 370 380 390 400 410 420 430 440 450 pF1KB7 KSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF ::::::::::::::::::::::::::::::::::: CCDS11 KSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF 430 440 450 >>CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 (467 aa) initn: 2048 init1: 1843 opt: 2004 Z-score: 1458.7 bits: 279.2 E(32554): 6.2e-75 Smith-Waterman score: 2004; 70.1% identity (86.1% similar) in 445 aa overlap (1-445:1-437) 10 20 30 40 50 60 pF1KB7 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSS ::.. ::.::.:. :..:: .:::.. : .::..:::. .: .:. ::. . CCDS11 MATQTCTPTFSTGSIKGLCGTAGGISRVSSIRSVGSCRVPSLAGAAGYISSARSGLSGLG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQ ::::. : . .... :.:::: :: ..:.:::::: ::::::.:::::::::. CCDS11 ----SCLPGSYLSSECHTSGFVGSGGWFCEGSFNGSEKETMQFLNDRLANYLEKVRQLER 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 ENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAAD ::: :::::.:: : :.::.::::::::.:::..:.: : .:.::::::..::::::::: CCDS11 ENAELESRIQEWYEFQIPYICPDYQSYFKTIEDFQQKILLTKSENARLVLQIDNAKLAAD 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 DFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVN :::::::::.:::::::.::::::::::.:::::.:::::::::::::.::::::::::. CCDS11 DFRTKYETELSLRQLVEADINGLRRILDELTLCKADLEAQVESLKEELMCLKKNHEEEVS 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB7 SLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVV ::::::::::::::::::::::..::.::::::.::::::::.: :..::.:::::::: CCDS11 VLRCQLGDRLNVEVDAAPPVDLNKILEDMRCQYEALVENNRRDVEAWFNTQTEELNQQVV 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB7 SSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMIT ::::::: ::.:::::::::::::::::::::::..:::::::::::::::::::::.:. CCDS11 SSSEQLQCCQTEIIELRRTVNALEIELQAQHSMRNSLESTLAETEARYSSQLAQMQCLIS 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB7 NVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPS ::::::.::: :::::::::::::::.:::: :: ::: :::.:: ::: .::: .: CCDS11 NVEAQLSEIRCDLERQNQEYQVLLDVKARLEGEIATYRHLLEGEDCKLPPQPCATACKPV 360 370 380 390 400 410 430 440 450 pF1KB7 KSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF .: .: . : ::. :.: : CCDS11 IR-VPSVPPVPCVPSVP---CTPAPQVGTQIRTITEEIRDGKVISSREHVQSRPL 420 430 440 450 460 >>CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 (448 aa) initn: 1943 init1: 1798 opt: 1899 Z-score: 1383.4 bits: 265.2 E(32554): 9.8e-71 Smith-Waterman score: 1915; 66.8% identity (82.3% similar) in 464 aa overlap (1-455:1-448) 10 20 30 40 50 pF1KB7 MASKCLKAGFSSGSLKS-PGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRS :.:.: .. ..:::: : :: :. :. : .:.: :.: . CCDS11 MTSSCCVTNNLQASLKSCPRPASVCSSGVNC--RPELCLGYVCQPMACLPSVCLP----T 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 SYRATSCLPAL-----CLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEK ..: .::: : :.:.. :. : :.:..:: ..:::::::: ::::::.:: . CCDS11 TFRPASCLSKTYLSSSCQAASGISGSM-GPGSWYSEGAFNGNEKETMQFLNDRLASYLTR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 VRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN ::::::::: :::::.: ..:: : :::::.::::::::.: ::.::::::.::.::: CCDS11 VRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDN 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKN :::::::::.:::.:...:::::.::::::::::::::::.:::::::::::::.::::: CCDS11 AKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 HEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEE :::::.:::::::::::.::::::::::.:::::::::::..:: ::::.:.:.. : :: CCDS11 HEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB7 LNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQ :::::..::::::. :..::.::::::.::::::::::.::.::.::.:.:::::::::: CCDS11 LNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA ::::::::::::::::::::::::::::::::::::: ::::::.:::.:: :::::::. CCDS11 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCS 360 370 380 390 400 410 420 430 440 450 pF1KB7 PDYSPSKSCLPCLPAASCGPSAARTNCSPRPI---CVPCPGGRF .:: : :.:. : . :: : :: . : ::: ::. CCDS11 ---TPS--CTTCVPS----PCVPRTVCVPRTVGMPCSPCPQGRY 420 430 440 >>CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 (416 aa) initn: 1846 init1: 1756 opt: 1872 Z-score: 1364.4 bits: 261.6 E(32554): 1.1e-69 Smith-Waterman score: 1872; 71.9% identity (86.3% similar) in 409 aa overlap (49-450:3-411) 20 30 40 50 60 70 pF1KB7 GGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLG-RSSYRATSCLPALC----LP .. : .:. :.: . :.: : :: CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHSCTLP 10 20 30 80 90 100 110 120 130 pF1KB7 AGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQENASLESRIREWC .. . .. .:: :: ..:.:::::: ::::::.:::::::::..:: ::. ::: CCDS11 GACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERS 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB7 EQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADDFRTKYETEVSLR .:: : .::.:::::.::::::.: ::.:.:::::::.:::::::::::::::.::.::: CCDS11 QQQEPLLCPSYQSYFKTIEELQQKILCTKSENARLVVQIDNAKLAADDFRTKYQTELSLR 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB7 QLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNSLRCQLGDRLNVE :::::::::::::::.:::::::::::::::::::::::.:::.:::.:::::::::::: CCDS11 QLVESDINGLRRILDELTLCKSDLEAQVESLKEELLCLKSNHEQEVNTLRCQLGDRLNVE 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB7 VDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEI ::::: :::::::.: : :::.:::.:::..:.:. ::.::::.::::::::::: :::: CCDS11 VDAAPTVDLNRVLNETRSQYEALVETNRREVEQWFTTQTEELNKQVVSSSEQLQSYQAEI 220 230 240 250 260 270 320 330 340 350 360 370 pF1KB7 IELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQLAEIRADL ::::::::::::::::::..::.::.::.:.::::::::.:.: .:::::.::::::.:: CCDS11 IELRRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDL 280 290 300 310 320 330 380 390 400 410 420 430 pF1KB7 ERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPSKSCLPCL--PAAS :::::::::::::::::::::::::.:::::: .:: :::: . :: ::: : .: CCDS11 ERQNQEYQVLLDVRARLECEINTYRSLLESEDCNLPSNPCATTNACSKPIGPCLSNPCTS 340 350 360 370 380 390 440 450 pF1KB7 CGPSAARTNCSPRPICVPCPGGRF : : : : :.::: : :: CCDS11 CVPPAPCTPCAPRPRCGPCNSFVR 400 410 >>CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 (404 aa) initn: 1775 init1: 1740 opt: 1783 Z-score: 1300.5 bits: 249.7 E(32554): 4.1e-66 Smith-Waterman score: 1799; 70.3% identity (84.3% similar) in 414 aa overlap (34-443:2-398) 10 20 30 40 50 60 pF1KB7 KCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSSYRA : :: ::::: : :.: . CCDS11 MSYSCGLPSLS--------C-----RTSCSS 10 70 80 90 100 110 pF1KB7 TSCLPALC----LPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLE :.: : ::.. . .. .:: :: ..:.:::::: ::::::.::::::::: CCDS11 RPCVPPSCHGCTLPGACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLE 20 30 40 50 60 70 120 130 140 150 160 170 pF1KB7 QENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAA ..:: ::. ::: .:: : .: .:::::.::::::.: ::::.:::::::.:::::::. CCDS11 RDNAELENLIRERSQQQEPLVCASYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLAS 80 90 100 110 120 130 180 190 200 210 220 230 pF1KB7 DDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEV ::::::::::.::::::::::::::::::.::::.::::::::::::::::::.:::.:: CCDS11 DDFRTKYETELSLRQLVESDINGLRRILDELTLCRSDLEAQVESLKEELLCLKQNHEQEV 140 150 160 170 180 190 240 250 260 270 280 290 pF1KB7 NSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQV :.::::::::::::::::: ::::.::.: : :::.:::.:::..:.:. ::.::::.:: CCDS11 NTLRCQLGDRLNVEVDAAPTVDLNQVLNETRSQYEALVETNRREVEQWFATQTEELNKQV 200 210 220 230 240 250 300 310 320 330 340 350 pF1KB7 VSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMI ::::::::: ::::::::::::::::::::::..::.::.::.:.::::::::.:.: .: CCDS11 VSSSEQLQSYQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQRLI 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB7 TNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSP ::::.::::::.:::::::::::::::::::::::::::.:::::: ::: :::: . CCDS11 TNVESQLAEIRSDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNAC 320 330 340 350 360 370 420 430 440 450 pF1KB7 SKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF .:: ::. . :: :. :.: CCDS11 DKSTGPCI-SNPCG---LRARCGPCNTFGY 380 390 400 >>CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 (436 aa) initn: 1725 init1: 1725 opt: 1770 Z-score: 1290.8 bits: 248.0 E(32554): 1.4e-65 Smith-Waterman score: 1770; 71.9% identity (87.8% similar) in 384 aa overlap (48-426:44-427) 20 30 40 50 60 70 pF1KB7 PGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLG-RSSYRATSCLPALC----L :.: : .:: :.: . :.: : : CCDS11 KGLQRKERLKPAHIHLQQLTCFSITCSSTMSYSCCLPSLGCRTSCSSRPCVPPSCHGYTL 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB7 PAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQENASLESRIREW :.. . .. .:: :: ..:.:::::: ::::::.:::::::::..:: ::. :.: CCDS11 PGACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELEKLIQER 80 90 100 110 120 130 140 150 160 170 180 190 pF1KB7 CEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADDFRTKYETEVSL .:: : .::.:::::.::::::.: ::.:::::::::.:::::::.::::.::.:: :: CCDS11 SQQQEPLLCPSYQSYFKTIEELQQKILCAKAENARLVVNIDNAKLASDDFRSKYQTEQSL 140 150 160 170 180 190 200 210 220 230 240 250 pF1KB7 RQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNSLRCQLGDRLNV : :::::::..:::::.:::::::::.:::::.:::.:::::::::::.:: :::::::: CCDS11 RLLVESDINSIRRILDELTLCKSDLESQVESLREELICLKKNHEEEVNTLRSQLGDRLNV 200 210 220 230 240 250 260 270 280 290 300 310 pF1KB7 EVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAE :::.:: ::::.::.: : :::.::: :::..:.:. ::.::::.::::::::::::::: CCDS11 EVDTAPTVDLNQVLNETRSQYEALVEINRREVEQWFATQTEELNKQVVSSSEQLQSCQAE 260 270 280 290 300 310 320 330 340 350 360 370 pF1KB7 IIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQLAEIRAD :::::::::::::::::::..::.::.::.:.::.:::::.:.: .:::::.:::::: : CCDS11 IIELRRTVNALEIELQAQHNLRDSLENTLTESEAHYSSQLSQVQSLITNVESQLAEIRCD 320 330 340 350 360 370 380 390 400 410 420 430 pF1KB7 LERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPSKSCLPCLPAASC ::::::::::::::::::::::::::.:::::: :::::::: . ..:: :: CCDS11 LERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPCNPCATTNASGNSCGPCGTSQKG 380 390 400 410 420 430 440 450 pF1KB7 GPSAARTNCSPRPICVPCPGGRF CCDS11 CCN >>CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 (404 aa) initn: 1734 init1: 1690 opt: 1765 Z-score: 1287.6 bits: 247.3 E(32554): 2.1e-65 Smith-Waterman score: 1765; 71.0% identity (86.1% similar) in 396 aa overlap (49-434:3-398) 20 30 40 50 60 70 pF1KB7 GGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLG-RSSYRATSCLPALC----LP .. : .:. :.: . :.: : :: CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHGYTLP 10 20 30 80 90 100 110 120 130 pF1KB7 AGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQENASLESRIREWC .. . .. .:: :: ..:.:::::: ::::::.:::::::::..:: ::. ::: CCDS11 GACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERS 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB7 EQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADDFRTKYETEVSLR .:: : .::.:::::.::::::.: ::::.:::::::.:::::::::::::::.:: ::: CCDS11 QQQEPLLCPSYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLAADDFRTKYQTEQSLR 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB7 QLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNSLRCQLGDRLNVE ::::::::.::::::.::::.::::::.:::::::: ::.:::.:::.:::::::::::: CCDS11 QLVESDINSLRRILDELTLCRSDLEAQMESLKEELLSLKQNHEQEVNTLRCQLGDRLNVE 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB7 VDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEI ::::: ::::.::.: : :::.:::.:::..:.:. ::.::::.::::::::::: :::: CCDS11 VDAAPAVDLNQVLNETRNQYEALVETNRREVEQWFATQTEELNKQVVSSSEQLQSYQAEI 220 230 240 250 260 270 320 330 340 350 360 370 pF1KB7 IELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQLAEIRADL ::::::::::::::::::..: .::.::.:.::::::::.:.: .:::::.::::::.:: CCDS11 IELRRTVNALEIELQAQHNLRYSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDL 280 290 300 310 320 330 380 390 400 410 420 pF1KB7 ERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYS---PSKSCL--PCLP :::::::::::::::::::::::::.:::::: ::: :::: . : ::. :: : CCDS11 ERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACEKPIGSCVTNPCGP 340 350 360 370 380 390 430 440 450 pF1KB7 AASCGPSAARTNCSPRPICVPCPGGRF . ::: CCDS11 RSRCGPCNTFGY 400 >>CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 (431 aa) initn: 1645 init1: 1619 opt: 1648 Z-score: 1203.1 bits: 231.8 E(32554): 1.1e-60 Smith-Waterman score: 1655; 59.8% identity (81.3% similar) in 438 aa overlap (1-432:1-424) 10 20 30 40 50 pF1KB7 MASKCLKAGFSSGSLKSPGG---ASGGSTRVSAMY---SSSSCKLPSLSPVARSFSACSV :.: : .. : : . .: ::. :.... . ..: :. ::. .:....: . CCDS42 MTSDCSSTHCSPESCGTASGCAPASSCSVETACLPGTCATSRCQTPSFLSRSRGLTGCLL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 GLGRSSYRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEK : . :: . :: :. .: .:..:.::::::: ::::::.:::: CCDS42 ----PCYFTGSC-NSPCL---------VGNCAWCEDGVFTSNEKETMQFLNDRLASYLEK 70 80 90 100 120 130 140 150 160 170 pF1KB7 VRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN ::.::. :: :::::.: :::..:..::::: :: :::.::.: ::.::::.::.:..:: CCDS42 VRSLEETNAELESRIQEQCEQDIPMVCPDYQRYFNTIEDLQQKILCTKAENSRLAVQLDN 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKN :::.:::..:::.:.:::::.:.::..:. ::..::::::::::.::::::.::::::: CCDS42 CKLATDDFKSKYESELSLRQLLEADISSLHGILEELTLCKSDLEAHVESLKEDLLCLKKN 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 HEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEE :::::: :: ::::::.::.:.:: .::::::.::::: ::.. ::::.::.:: .:.:: CCDS42 HEEEVNLLREQLGDRLSVELDTAPTLDLNRVLDEMRCQCETVLANNRREAEEWLAVQTEE 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 LNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQ :::: .::.::::.:: ::.::.::..:::::::::.:. ..:: :.:::::.::::::: CCDS42 LNQQQLSSAEQLQGCQMEILELKRTASALEIELQAQQSLTESLECTVAETEAQYSSQLAQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA .::.: :.: :::::: :::::::::::::::.:::: ::::: :::.::::.: :.::. CCDS42 IQCLIDNLENQLAEIRCDLERQNQEYQVLLDVKARLEGEINTYWGLLDSEDSRLSCSPCS 350 360 370 380 390 400 420 430 440 450 pF1KB7 PDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF . :..: :: . : CCDS42 TTCTSSNTCEPCSAYVICTVENCCL 410 420 430 >>CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 (491 aa) initn: 1507 init1: 1484 opt: 1551 Z-score: 1132.7 bits: 218.9 E(32554): 9.1e-57 Smith-Waterman score: 1551; 55.3% identity (77.2% similar) in 461 aa overlap (7-454:4-456) 10 20 30 40 50 pF1KB7 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACS-VGLGRS :. ...: ..: . : ::.. :...:. : . . . :. .: CCDS11 MDTKGCTTTNSPSTPCQNCSRITNVSTISSNNGCH-----PGGLTVNNCQPAGHVLR 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 SYRATSCLPA--LCL-PA---GGFATSYS-GGGGWFGEGILTGNEKETMQSLNDRLAGYL .: :. .: : ..: . .: .:.:::: ..::::::: ::.:::.:: CCDS11 IPWDQGCQPTPRFCRKPIYLMNNFNARFSLDDCSWYGEGI-NSNEKETMQILNERLANYL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 EKVRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEI .:::.::.::: :::.:.: ....: .:::: ::. ::::::.: ::.::::.::: .: CCDS11 QKVRMLERENAELESKIQEESNKELPVLCPDYLSYYTTIEELQQKILCTKAENSRLVSQI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 DNAKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLK ::.::.:::.:.:::.::::::::::: :::..::. ::: :.::::::.:::::::::: CCDS11 DNTKLTADDLRAKYEAEVSLRQLVESDANGLKQILNVLTLGKADLEAQVQSLKEELLCLK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 KNHEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQS .::.::.:::.::::.::..:: ::: .:::.::.::::::: ..:.::.:.:.:..:: CCDS11 NNHKEEINSLQCQLGERLDIEVTAAPSADLNQVLQEMRCQYEPIMETNRKDVEQWFNTQI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB7 EELNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQL ::::::::.::.: : :: :::::::.::.::.:::::: :::. : :.::::::.. : CCDS11 EELNQQVVTSSQQQQCCQKEIIELRRSVNTLEVELQAQHRMRDSQECILTETEARYTALL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 AQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNP .:.: .: :.:::::::: ::::::::..::::..::::::.:::.:::: :.: :: : CCDS11 TQIQSLIDNLEAQLAEIRCALERQNQEYEILLDVKSRLECEITTYRSLLESSDGKRPCYP 360 370 380 390 400 410 420 430 440 450 pF1KB7 ----CAPDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPC-PGGRF : : :: :: .. .. . :: . : : : .: CCDS11 RATKCEP--SPWTSCKSGAIESTAPACTSSSPCSLKEHCSACGPLSRILVKICTITKEIK 420 430 440 450 460 CCDS11 DGKVISSYEHVQPCFIIRPAKV 470 480 490 >>CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 (456 aa) initn: 1491 init1: 1426 opt: 1534 Z-score: 1120.8 bits: 216.6 E(32554): 4.1e-56 Smith-Waterman score: 1534; 59.1% identity (76.7% similar) in 425 aa overlap (37-455:44-456) 10 20 30 40 50 60 pF1KB7 KAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSSYRATSC : : ... . : . :. ::: : : CCDS11 CTMAPGARNVSVSPIDIGCQPGAEANIAPMCLLANVAHANR-VRVGSTPLGRPSL----C 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 LPALC-----LPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQE :: : ::. . : : .::. :.:.:::::: ::::::.::::::::::: CCDS11 LPPTCHTACPLPGTCHIPGNIGICGAYGENTLNGHEKETMQFLNDRLANYLEKVRQLEQE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 NASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADD :: ::. . : . . .::::::::.::::::.: ::::::::::.:.:::::::::: CCDS11 NAELEATLLERSKCHESTVCPDYQSYFHTIEELQQKILCSKAENARLIVQIDNAKLAADD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 FRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNS :: : :.: :::::::.: : ...::: :: :.::::: :::::: : ::.:::.::. CCDS11 FRIKLESERSLRQLVEADKCGTQKLLDDATLAKADLEAQQESLKEEQLSLKSNHEQEVKI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 LRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVS :: :::..: .:.: : .:::::: ::: :::...:.::.:.:.:...::: .. : .: CCDS11 LRSQLGEKLRIELDIEPTIDLNRVLGEMRAQYEAMLETNRQDVEQWFQAQSEGISLQDMS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 SSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITN ::.:: ::.::.::: ::::::.: ::::...: :...: :.: :....::::: .:.: CCDS11 CSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDRFGTELAQMQSLISN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 VEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPSK :: ::.:::::::::::::::::::..::: :: :::.:::::: :::::::. ::: CCDS11 VEEQLSEIRADLERQNQEYQVLLDVKTRLENEIATYRNLLESEDCKLPCNPCST--SPSC 370 380 390 400 410 420 430 440 450 pF1KB7 SCLPCLPAASCGPSAARTNCSPRPIC-VPCPGGRF :: : :::: :.:.: : . :.:: CCDS11 VTAPCAPRPSCGPC---TTCGPT--CGASTTGSRF 430 440 450 455 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 20:28:14 2016 done: Fri Nov 4 20:28:14 2016 Total Scan time: 3.440 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]