FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6566, 400 aa 1>>>pF1KB6566 400 - 400 aa - 400 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6238+/-0.00121; mu= 1.7832+/- 0.072 mean_var=194.6790+/-38.925, 0's: 0 Z-trim(108.3): 91 B-trim: 64 in 1/50 Lambda= 0.091921 statistics sampled from 10010 (10100) to 10010 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.651), E-opt: 0.2 (0.31), width: 16 Scan time: 2.630 The best scores are: opt bits E(32554) CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 2525 347.6 1.2e-95 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1635 229.6 4.4e-60 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1578 222.0 8.9e-58 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1565 220.3 2.9e-57 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1554 218.8 7.9e-57 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1516 213.8 2.6e-55 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1515 213.6 2.7e-55 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1421 201.2 1.7e-51 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1414 200.3 3.7e-51 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 1322 188.1 1.6e-47 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1301 185.3 1e-46 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1242 177.5 2.2e-44 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 1227 175.6 1.1e-43 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 1218 174.3 2e-43 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 1213 173.6 3.3e-43 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 1209 173.1 4.7e-43 CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1208 173.0 5e-43 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1174 168.4 1.1e-41 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1174 168.4 1.1e-41 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1173 168.3 1.2e-41 CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1168 167.6 1.9e-41 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1157 166.2 5.4e-41 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 1157 166.2 5.7e-41 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 1108 159.7 4.8e-39 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 1061 153.4 3.5e-37 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1054 152.5 6.9e-37 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1027 149.0 9.1e-36 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1022 148.3 1.4e-35 CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 998 145.1 1.2e-34 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 700 105.4 6.7e-23 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 645 98.3 1.6e-20 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 647 98.8 2.2e-20 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 637 97.2 3.2e-20 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 628 96.0 7e-20 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 628 96.0 7e-20 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 628 96.0 7.1e-20 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 625 95.7 1.1e-19 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 616 94.5 2.4e-19 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 588 90.7 2.9e-18 CCDS33859.1 BFSP2 gene_id:8419|Hs108|chr3 ( 415) 577 89.2 7.3e-18 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 572 88.6 1.3e-17 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 572 88.6 1.4e-17 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 571 88.6 1.8e-17 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 566 87.9 2.7e-17 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 564 87.6 3e-17 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 560 87.3 7.1e-17 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 550 85.8 1.1e-16 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 546 85.2 1.5e-16 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 547 85.4 1.5e-16 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 546 85.2 1.5e-16 >>CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 (400 aa) initn: 2525 init1: 2525 opt: 2525 Z-score: 1830.5 bits: 347.6 E(32554): 1.2e-95 Smith-Waterman score: 2525; 100.0% identity (100.0% similar) in 400 aa overlap (1-400:1-400) 10 20 30 40 50 60 pF1KB6 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPSIHGGSGGRGVSVSSARFVSSSSSGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPSIHGGSGGRGVSVSSARFVSSSSSGA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 YGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 PGPSRDYSHYYTTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PGPSRDYSHYYTTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 ADINGLRRVLDELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ADINGLRRVLDELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 PGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 RTLQGLEIELQSQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RTLQGLEIELQSQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQN 310 320 330 340 350 360 370 380 390 400 pF1KB6 QEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNLSASKVL :::::::::::::::::::::::::::::::::::::::: CCDS11 QEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNLSASKVL 370 380 390 400 >>CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 (432 aa) initn: 1675 init1: 1580 opt: 1635 Z-score: 1192.2 bits: 229.6 E(32554): 4.4e-60 Smith-Waterman score: 1635; 66.4% identity (87.6% similar) in 396 aa overlap (1-390:1-394) 10 20 30 40 50 pF1KB6 MTSYSYRQSSATSSF---GGLGGGSVRFGPGVA--FRAPSIHGGS-GGRGVSVSSARFVS ::. : :: ...::. .:::::: : . .. . : : . :: :: : ..... . : CCDS11 MTT-SIRQFTSSSSIKGSSGLGGGSSRTSCRLSGGLGAGSCRLGSAGGLGSTLGGSSYSS 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 SSSSGAYGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRD : :. :::::. . . ::::::.:: :::::::::::::::::::: :: :::::::: CCDS11 CYSFGS-GGGYGSSFGGVDGLLAGGEKATMQNLNDRLASYLDKVRALEEANTELEVKIRD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 WYQKQGPGPSRDYSHYYTTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQA :::.:.:::.::::.:: ::..:..::: ::..:. :.:::::::::::::::::::::: CCDS11 WYQRQAPGPARDYSQYYRTIEELQNKILTATVDNANILLQIDNARLAADDFRTKFETEQA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 LRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVS ::.::::::::::::::::::::.:::::::.:::::::::::::::...:::::::... CCDS11 LRLSVEADINGLRRVLDELTLARADLEMQIENLKEELAYLKKNHEEEMNALRGQVGGEIN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 VEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRS ::.:.:::.::..::..::.::: :::.:::::: :: :.::::::::: ..: .: ..: CCDS11 VEMDAAPGVDLSRILNEMRDQYEKMAEKNRKDAEDWFFSKTEELNREVATNSELVQSGKS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 EVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRA :...::::.:.:::::::::::::.:: .::::: :. .::..::.::...: ::...: CCDS11 EISELRRTMQALEIELQSQLSMKASLEGNLAETENRYCVQLSQIQGLIGSVEEQLAQLRC 300 310 320 330 340 350 360 370 380 390 400 pF1KB6 DSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNLSASKVL . :.:::::. :.:.:.:::::::::: ::::.. : CCDS11 EMEQQNQEYKILLDVKTRLEQEIATYRRLLEGEDAHLTQYKKEPVTTRQVRTIVEEVQDG 360 370 380 390 400 410 CCDS11 KVISSREQVHQTTR 420 430 >>CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 (472 aa) initn: 1685 init1: 1522 opt: 1578 Z-score: 1150.8 bits: 222.0 E(32554): 8.9e-58 Smith-Waterman score: 1584; 61.3% identity (81.2% similar) in 432 aa overlap (7-398:6-430) 10 20 30 40 50 pF1KB6 MTSYSYRQSSATSSF-------GGLGGGSVRFGP---GVAFRAPSIHGGSGGRGVSVSSA :: ...::. ::.:::: :.. : . :::: .:: :.::::. CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGG----GLSVSSS 10 20 30 40 50 60 70 80 pF1KB6 RF---------------VSSSSS-------GAYGGG--------YGGVLTASDGLLAGNE :: ::::: :.:::: .:: ....::::.:.: CCDS11 RFSSGGACGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGGFGGGFAGGDGLLVGSE 60 70 80 90 100 110 90 100 110 120 130 140 pF1KB6 KLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPSRDYSHYYTTIQDLRDK :.:::::::::::::::::::: ::..::::::::::.: :. .::: :. ::.:::.: CCDS11 KVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNK 120 130 140 150 160 170 150 160 170 180 190 200 pF1KB6 ILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDL :: ::..:. ..::::::::::::::::.::: :::::::::::::::::::::::.:: CCDS11 ILTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADL 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB6 EMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMA :::::.:::::::::::::::...:::::::.:.::.:.:::.::..::..::.::: :: CCDS11 EMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMA 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB6 EQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAAL :.:::::: :: ..::::::::: ..: .: ..::...::::.:.:::::::::::::.: CCDS11 EKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASL 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB6 EDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATY :..: ::..:. :::.:: .:...: ::...: . :.:::::. :.:.:.::::::::: CCDS11 ENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATY 360 370 380 390 400 410 390 400 pF1KB6 RSLLEGQEDHYNNLSASKVL : ::::.. : ::.:. CCDS11 RRLLEGEDAH---LSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN 420 430 440 450 460 470 >>CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 (473 aa) initn: 1575 init1: 1536 opt: 1565 Z-score: 1141.4 bits: 220.3 E(32554): 2.9e-57 Smith-Waterman score: 1587; 60.6% identity (82.1% similar) in 429 aa overlap (7-397:6-434) 10 20 30 40 pF1KB6 MTSYSYRQSSATSSF-------GGLGGGSVRFGP---GVAFRAPSIHGGS---------- :: ...::. ::.:::: :.. : . :::: .::. CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSG 10 20 30 40 50 50 60 70 80 pF1KB6 ------GGRGVSVSSARFVSSSSSGAYGGG------------YGGVLTASDGLLAGNEKL :: : . ::. .:. .:.:::: .:: ....::::.:.::. CCDS11 GACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKV 60 70 80 90 100 110 90 100 110 120 130 140 pF1KB6 TMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPSRDYSHYYTTIQDLRDKIL :::::::::::::::::::: ::..::::::::::.: :. .::: :. ::.:::.::. CCDS11 TMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKII 120 130 140 150 160 170 150 160 170 180 190 200 pF1KB6 GATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEM .:::::.. .::::::::::::::::.: : :::..::::.::::::::::::::::::: CCDS11 AATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEM 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB6 QIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQ ::::::::::::.::::::. .::::.::.:.::.:.:::.::..::..::.::: :::. CCDS11 QIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEK 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB6 NRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALED ::.:::.:: :.:::::.:::...: .: ::::::.:::.::::::::::::::::.::. CCDS11 NRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLEN 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB6 TLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRS .: ::..:. ::..::.::...: ::...: . :.:.:::: :.:.:.:::::::::: CCDS11 SLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRR 360 370 380 390 400 410 390 400 pF1KB6 LLEGQEDHYNNLSASKVL ::::.. : .. .:: CCDS11 LLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS 420 430 440 450 460 470 >>CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 (456 aa) initn: 1505 init1: 1227 opt: 1554 Z-score: 1133.8 bits: 218.8 E(32554): 7.9e-57 Smith-Waterman score: 1614; 63.3% identity (85.4% similar) in 417 aa overlap (1-388:1-414) 10 20 30 40 50 pF1KB6 MTSYSYRQSSATSSFGGLG--GGSVRFGPGVAFRAPSIHGGSGGRGVSVSSARFVSSSSS ::. .. :.: .:.::: . :::. : : .: . :. ::.:.:..:.::::::::.:. CCDS11 MTT-TFLQTS-SSTFGGGSTRGGSLLAGGG-GFGGGSLSGGGGSRSISASSARFVSSGSG 10 20 30 40 50 60 70 80 90 pF1KB6 GAYGGG-------------------------YGGVLTASDG-LLAGNEKLTMQNLNDRLA :.:::: .:: . ..:: ::.::::.:::::::::: CCDS11 GGYGGGMRVCGFGGGAGSVFGGGFGGGVGGGFGGGFGGGDGGLLSGNEKITMQNLNDRLA 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB6 SYLDKVRALEAANGELEVKIRDWYQKQGP-GPSRDYSHYYTTIQDLRDKILGATIENSRI :::::::::: ::..:::::.:::::: : .: :::.:. ::..:::::...::.:::. CCDS11 SYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDYSQYFKTIEELRDKIMATTIDNSRV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB6 VLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEEL .:.:::::::::::: :.:.: :::..:::::::::::::::::::::::::::::.::: CCDS11 ILEIDNARLAADDFRLKYENELALRQGVEADINGLRRVLDELTLARTDLEMQIEGLNEEL 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB6 AYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWF ::::::::::.. . .:..:::.::.:.:::.::...:..:: :::.:::.::.:.:::: CCDS11 AYLKKNHEEEMKEFSSQLAGQVNVEMDAAPGVDLTRVLAEMREQYEAMAEKNRRDVEAWF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB6 TSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARF :.:::::.:::..::..: :..:.::::::.: :::::::::::::.::..::::: :. CCDS11 FSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELEIELQSQLSMKAGLENSLAETECRY 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB6 GAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHY ..:: .::.::.:.::::...: . : :::::. :.:::.::::::::::::::::. CCDS11 ATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLLDIKTRLEQEIATYRSLLEGQDAKM 360 370 380 390 400 410 400 pF1KB6 NNLSASKVL CCDS11 AGIAIREASSGGGGSSSNFHINVEESVDGQVVSSHKREI 420 430 440 450 >>CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 (458 aa) initn: 1487 init1: 1201 opt: 1516 Z-score: 1106.5 bits: 213.8 E(32554): 2.6e-55 Smith-Waterman score: 1533; 61.3% identity (82.1% similar) in 419 aa overlap (8-397:6-422) 10 20 30 40 50 pF1KB6 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPS---IHGGS-GGRGVSVSSARFVSSS :::..: ::.:::: ..: : . . : . ::: :: : .:: . : ... CCDS11 MSLRLQSSSASYGGGFGGGSCQLGGGRGVSTCSTRFVSGGSAGGYGGGVSCG-FGGGA 10 20 30 40 50 60 70 80 90 pF1KB6 SSGAYGGGYGGVLT-----------------------ASDG-LLAGNEKLTMQNLNDRLA .:: .:::::: : : :: ::.::::.:::::::::: CCDS11 GSG-FGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGGLLTGNEKITMQNLNDRLA 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB6 SYLDKVRALEAANGELEVKIRDWYQKQGPG-PSRDYSHYYTTIQDLRDKILGATIENSRI :::.:::::: ::..::::::::. ::.:. : :::: :: ::..:::::: :::::.:. CCDS11 SYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTIEELRDKILTATIENNRV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB6 VLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEEL .:.:::::::::::: :.:.: :::.::::::::::::::::::..::::::::.:.::: CCDS11 ILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELTLSKTDLEMQIESLNEEL 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB6 AYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWF ::.:::::::.. . .:: :::.::.:..:: ::...:..:: :::.:::.::.::: :: CCDS11 AYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMREQYEAMAERNRRDAEEWF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB6 TSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARF ... :::.::. .: ..: :..:.:.::::::::::::::::::::.::.:.:::: :. CCDS11 HTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQLSMKAGLENTVAETECRY 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB6 GAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHY . :: .::.:::.:::::...:.. : :::::. :.:::.::::::::::::::::. .. CCDS11 ALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLEQEIATYRSLLEGQDAKM 360 370 380 390 400 410 400 pF1KB6 NNLSASKVL .. .: CCDS11 IGFPSSAGSVSPRSTSVTTTSSASVTTTSNASGRRTSDVRRP 420 430 440 450 >>CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 (420 aa) initn: 1487 init1: 1201 opt: 1515 Z-score: 1106.3 bits: 213.6 E(32554): 2.7e-55 Smith-Waterman score: 1532; 62.4% identity (82.4% similar) in 410 aa overlap (8-388:6-413) 10 20 30 40 50 pF1KB6 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPS---IHGGS-GGRGVSVSSARFVSSS :::..: ::.:::: ..: : . . : . ::: :: : .:: . : ... CCDS11 MSLRLQSSSASYGGGFGGGSCQLGGGRGVSTCSTRFVSGGSAGGYGGGVSCG-FGGGA 10 20 30 40 50 60 70 80 90 pF1KB6 SSGAYGGGYGGVLT-----------------------ASDG-LLAGNEKLTMQNLNDRLA .:: .:::::: : : :: ::.::::.:::::::::: CCDS11 GSG-FGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGGLLTGNEKITMQNLNDRLA 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB6 SYLDKVRALEAANGELEVKIRDWYQKQGPG-PSRDYSHYYTTIQDLRDKILGATIENSRI :::.:::::: ::..::::::::. ::.:. : :::: :: ::..:::::: :::::.:. CCDS11 SYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTIEELRDKILTATIENNRV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB6 VLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEEL .:.:::::::::::: :.:.: :::.::::::::::::::::::..::::::::.:.::: CCDS11 ILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELTLSKTDLEMQIESLNEEL 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB6 AYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWF ::.:::::::.. . .:: :::.::.:..:: ::...:..:: :::.:::.::.::: :: CCDS11 AYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMREQYEAMAERNRRDAEEWF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB6 TSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARF ... :::.::. .: ..: :..:.:.::::::::::::::::::::.::.:.:::: :. CCDS11 HTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQLSMKAGLENTVAETECRY 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB6 GAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHY . :: .::.:::.:::::...:.. : :::::. :.:::.::::::::::::::::. CCDS11 ALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLEQEIATYRSLLEGQDAKK 360 370 380 390 400 410 400 pF1KB6 NNLSASKVL CCDS11 RQPP 420 >>CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 (494 aa) initn: 1407 init1: 1119 opt: 1421 Z-score: 1037.9 bits: 201.2 E(32554): 1.7e-51 Smith-Waterman score: 1429; 58.6% identity (81.5% similar) in 406 aa overlap (7-387:31-436) 10 20 30 pF1KB6 MTSYSYRQSSATSSFGGLGGGSVRFGP--GVAFRAP : ::.: .: ::.. :: : .: : CCDS11 MDLSNNTMSLSVRTPGLSRRLSSQSVIGRPRGMSASSVGSGYGGSAFGFGASCGGGFSAA 10 20 30 40 50 60 40 50 60 70 pF1KB6 SIHGGS----GGRGVSVSSA------RFVSSSSSGAYGGGYGG--------VLTASDG-L :. :.: :: : :.... : ....: :. : :.:: .:...:: : CCDS11 SMFGSSSGFGGGSGSSMAGGLGAGYGRALGGGSFGGLGMGFGGSPGGGSLGILSGNDGGL 70 80 90 100 110 120 80 90 100 110 120 130 pF1KB6 LAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPS----RDYSHYY :.:.:: :::::::::::::::::::: :: ::: :::.::. .: : . :::.:: CCDS11 LSGSEKETMQNLNDRLASYLDKVRALEEANTELENKIREWYETRGTGTADASQSDYSKYY 130 140 150 160 170 180 140 150 160 170 180 190 pF1KB6 TTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLD :.:::.::..:.: :....::::::::::.::: :.:.: :::..::::::::::::: CCDS11 PLIEDLRNKIISASIGNAQLLLQIDNARLAAEDFRMKYENELALRQGVEADINGLRRVLD 190 200 210 220 230 240 200 210 220 230 240 250 pF1KB6 ELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSD ::::.:::::::::.:.:::::.:::::.:....: :.::::.:.:::.::...:.: CCDS11 ELTLTRTDLEMQIESLNEELAYMKKNHEDELQSFRVGGPGEVSVEMDAAPGVDLTRLLND 250 260 270 280 290 300 260 270 280 290 300 310 pF1KB6 MRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQ ::.:::..:::::::::::: .. :: .:.. .::::: :.::::::::..:.:::::: CCDS11 MRAQYETIAEQNRKDAEAWFIEKSGELRKEISTNTEQLQSSKSEVTDLRRAFQNLEIELQ 310 320 330 340 350 360 320 330 340 350 360 370 pF1KB6 SQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKS :::.:: .:::.:::.:. . :::...: :::..:::: .::::.:::: ..:::...:. CCDS11 SQLAMKKSLEDSLAEAEGDYCAQLSQVQQLISNLEAQLLQVRADAERQNVDHQRLLNVKA 370 380 390 400 410 420 380 390 400 pF1KB6 RLEQEIATYRSLLEGQEDHYNNLSASKVL ::: :: ::: ::.:. CCDS11 RLELEIETYRRLLDGEAQGDGLEESLFVTDSKSQAQSTDSSKDPTKTRKIKTVVQEMVNG 430 440 450 460 470 480 >>CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 (584 aa) initn: 1456 init1: 1082 opt: 1414 Z-score: 1031.9 bits: 200.3 E(32554): 3.7e-51 Smith-Waterman score: 1424; 60.5% identity (82.9% similar) in 387 aa overlap (5-387:84-456) 10 20 30 pF1KB6 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAP :.: : ..::::: :: :: : .: . CCDS11 GGSFSRGSSGGGCFGGSSGGYGGLGGFGGGSFRGSYGSSSFGGSYGGI--FGGG-SFGGG 60 70 80 90 100 110 40 50 60 70 80 90 pF1KB6 SIHGGS-GGRGVSVSSARFVSSSSSGAYGGGYGGVLTASDGLLAGNEKLTMQNLNDRLAS :. ::: :: : . .:..:::.:: . .. :::.::::.::::::::::: CCDS11 SFGGGSFGGGGFG-----------GGGFGGGFGGGFGGDGGLLSGNEKVTMQNLNDRLAS 120 130 140 150 100 110 120 130 140 150 pF1KB6 YLDKVRALEAANGELEVKIRDWYQKQG---PGPSRDYSHYYTTIQDLRDKILGATIENSR ::::::::: .: ::: ::..::.:.: : ::::.:: ::.::...::. : .:. CCDS11 YLDKVRALEESNYELEGKIKEWYEKHGNSHQGEPRDYSKYYKTIDDLKNQILNLTTDNAN 160 170 180 190 200 210 160 170 180 190 200 210 pF1KB6 IVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEE :.:::::::::::::: :.:.: :::.::::::::::::::::::...:::::::.: :: CCDS11 ILLQIDNARLAADDFRLKYENEVALRQSVEADINGLRRVLDELTLTKADLEMQIESLTEE 220 230 240 250 260 270 220 230 240 250 260 270 pF1KB6 LAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAW :::::::::::.. ::. :.:.::...:::.::...:..:::::: .::::::::::: CCDS11 LAYLKKNHEEEMKDLRNVSTGDVNVEMNAAPGVDLTQLLNNMRSQYEQLAEQNRKDAEAW 280 290 300 310 320 330 280 290 300 310 320 330 pF1KB6 FTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEAR :. ...::. :. .. ::.. .::.:.:::..:.:::::::::..: .:: .:::::.: CCDS11 FNEKSKELTTEIDNNIEQISSYKSEITELRRNVQALEIELQSQLALKQSLEASLAETEGR 340 350 360 370 380 390 340 350 360 370 380 390 pF1KB6 FGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDH . .::..::: ::..: :: ..::..: :: :::.:.::: :::.:: ::::::::. CCDS11 YCVQLSQIQAQISALEEQLQQIRAETECQNTEYQQLLDIKIRLENEIQTYRSLLEGEGSS 400 410 420 430 440 450 400 pF1KB6 YNNLSASKVL CCDS11 GGGGRGGGSFGGGYGGGSSGGGSSGGGHGGGHGGSSGGGYGGGSSGGGSSGGGYGGGSSS 460 470 480 490 500 510 >>CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 (525 aa) initn: 1232 init1: 996 opt: 1322 Z-score: 966.6 bits: 188.1 E(32554): 1.6e-47 Smith-Waterman score: 1324; 56.0% identity (83.8% similar) in 382 aa overlap (16-387:75-452) 10 20 30 40 pF1KB6 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPSIHGG-SG-GR ::.::.: : :..: . : :: :: :: CCDS11 GGASSCSLSGGSSGAFGGSFGGGFGSCSVGGGFGGAS---GSGTGFGGGSSFGGVSGFGR 50 60 70 80 90 100 50 60 70 80 90 100 pF1KB6 GVSV-SSARFVSSSSSG--AYGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRA : . .:.:: :....: .::::.:: . .. ::..:.:: ::::::::::.::::::: CCDS11 GSGFCGSSRFSSGATGGFYSYGGGMGGGV-GDGGLFSGGEKQTMQNLNDRLANYLDKVRA 110 120 130 140 150 160 110 120 130 140 150 pF1KB6 LEAANGELEVKIRDWYQKQGPGPS-----RDYSHYYTTIQDLRDKILGATIENSRIVLQI :: :: .:: ::..::.: ::: . ::::.::. :.:::..:..::.::. :.:.: CCDS11 LEEANTDLENKIKEWYDKYGPGSGDGGSGRDYSKYYSIIEDLRNQIIAATVENAGIILHI 170 180 190 200 210 220 160 170 180 190 200 210 pF1KB6 DNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEELAYLK ::::::::::: :.:.: ::.::::::::::.:::.::..:.:::::::.. ::::::. CCDS11 DNARLAADDFRLKYENELCLRQSVEADINGLRKVLDDLTMTRSDLEMQIESFTEELAYLR 230 240 250 260 270 280 220 230 240 250 260 270 pF1KB6 KNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSRT ::::::.....:. ::.:.::...::::::.:.:.:::.::: .:::::..:: :.... CCDS11 KNHEEEMKNMQGSSGGEVTVEMNAAPGTDLTKLLNDMRAQYEELAEQNRREAEERFNKQS 290 300 310 320 330 340 280 290 300 310 320 330 pF1KB6 EELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARFGAQL :. ... . ...:.:.:.::::.:::::::::.::..:: :::.::: . ::: CCDS11 ASLQAQISTDAGAATSAKNEITELKRTLQALEIELQSQLAMKSSLEGTLADTEAGYVAQL 350 360 370 380 390 400 340 350 360 370 380 390 pF1KB6 AHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNLS ..::. ::..: .. .. .... :: ::..:.:::.::: :: ::: ::.:. CCDS11 SEIQTQISALEEEICQIWGETKCQNAEYKQLLDIKTRLEVEIETYRRLLDGEGGGSSFAE 410 420 430 440 450 460 400 pF1KB6 ASKVL CCDS11 FGGRNSGSVNMGSRDLVSGDSRSGSCSGQGRDSSKTRVTKTIVEELVDGKVVSSQVSSIS 470 480 490 500 510 520 400 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 11:28:45 2016 done: Sat Nov 5 11:28:45 2016 Total Scan time: 2.630 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]