FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8364, 483 aa 1>>>pF1KB8364 483 - 483 aa - 483 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4701+/-0.00122; mu= 5.4374+/- 0.072 mean_var=273.4849+/-55.600, 0's: 0 Z-trim(108.7): 111 B-trim: 85 in 1/53 Lambda= 0.077555 statistics sampled from 10279 (10386) to 10279 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.639), E-opt: 0.2 (0.319), width: 16 Scan time: 3.470 The best scores are: opt bits E(32554) CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 2985 347.8 1.5e-95 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 2985 347.9 1.5e-95 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 1739 208.5 1.6e-53 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 1715 205.8 9.8e-53 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 1711 205.4 1.3e-52 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 1703 204.5 2.5e-52 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1696 203.7 4.2e-52 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 1686 202.5 8.3e-52 CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 1652 198.8 1.4e-50 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 1595 192.3 1e-48 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 1571 189.8 7.5e-48 CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 1565 189.1 1.2e-47 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1505 182.3 1.1e-45 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 1506 182.5 1.2e-45 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1498 181.6 2.1e-45 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1485 180.0 5.1e-45 CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1474 178.8 1.3e-44 CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 1455 176.7 5.7e-44 CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1447 175.8 9.9e-44 CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1426 173.4 5.1e-43 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 1421 172.9 7.3e-43 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1388 169.2 9.5e-42 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 1362 166.2 6.9e-41 CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1360 166.1 8.4e-41 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 1357 165.7 1e-40 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 1349 164.8 1.9e-40 CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 1111 138.1 1.8e-32 CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 1083 135.0 1.6e-31 CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 1078 134.4 2.3e-31 CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 997 125.4 1.3e-28 CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 887 112.8 5e-25 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 858 109.8 6.4e-24 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 856 109.6 7.4e-24 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 832 106.9 4.8e-23 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 803 103.8 5e-22 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 745 97.1 3.9e-20 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 743 96.9 4.5e-20 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 743 96.9 4.6e-20 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 744 97.4 6.8e-20 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 715 93.9 4.4e-19 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 644 85.9 1e-16 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 643 85.8 1.1e-16 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 645 86.1 1.1e-16 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 640 85.4 1.3e-16 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 629 84.2 3.3e-16 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 628 84.5 5.9e-16 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 618 83.0 7.8e-16 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 617 82.8 7.9e-16 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 580 78.8 1.5e-14 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 566 77.1 4.1e-14 >>CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 (483 aa) initn: 2985 init1: 2985 opt: 2985 Z-score: 1829.0 bits: 347.8 E(32554): 1.5e-95 Smith-Waterman score: 2985; 99.8% identity (99.8% similar) in 483 aa overlap (1-483:1-483) 10 20 30 40 50 60 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSRISSSSFSRVGSSNFRGGLGGGYGGASGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSRISSSSFSRVGSSNFRGGLGGGYGGASGM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 GGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQNKMLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 GGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQNKMLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 TKWSLLQQQKTARSNMDNMFESYINNLRRQLETLGQEKLKLEAELGNMQGLVEDFKNKYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 TKWSLLQQQKTARSNMDNMFESYINNLRRQLETLGQEKLKLEAELGNMQGLVEDFKNKYE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 DEINKRTEMENEFVLIKKDVDVAYMNKVELESRLEGLTDEINFLRQLYEEEIRELQSQIS ::::::::::::::::::::: :::::::::::::::::::::::::::::::::::::: CCDS88 DEINKRTEMENEFVLIKKDVDEAYMNKVELESRLEGLTDEINFLRQLYEEEIRELQSQIS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 DTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAGKHGDDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 DTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAGKHGDDL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 RRTKTEISEMNRNISRLQAEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLSELEAAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 RRTKTEISEMNRNISRLQAEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLSELEAAL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 QRAKQDMARQLREYQELMNVKLALDIEIATYRKLLEGEESRLESGMQNMSIHTKTTSGYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 QRAKQDMARQLREYQELMNVKLALDIEIATYRKLLEGEESRLESGMQNMSIHTKTTSGYA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 GGLSSAYGGLTSPGLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRDGKLVSESSDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 GGLSSAYGGLTSPGLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRDGKLVSESSDV 430 440 450 460 470 480 pF1KB8 LPK ::: CCDS88 LPK >>CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 (511 aa) initn: 2985 init1: 2985 opt: 2985 Z-score: 1828.7 bits: 347.9 E(32554): 1.5e-95 Smith-Waterman score: 2985; 99.8% identity (99.8% similar) in 483 aa overlap (1-483:29-511) 10 20 30 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSR :::::::::::::::::::::::::::::::: CCDS58 MNGVSWSQDLQEGISAWFGPPASTPASTMSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSR 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB8 ISSSSFSRVGSSNFRGGLGGGYGGASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ISSSSFSRVGSSNFRGGLGGGYGGASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEK 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB8 EQIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQKTARSNMDNMFESYINNLRRQLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EQIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQKTARSNMDNMFESYINNLRRQLE 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB8 TLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDVAYMNKVELES ::::::::::::::::::::::::::::::::::::::::::::::::: :::::::::: CCDS58 TLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDEAYMNKVELES 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB8 RLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIAN 250 260 270 280 290 300 280 290 300 310 320 330 pF1KB8 RSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLE 310 320 330 340 350 360 340 350 360 370 380 390 pF1KB8 AAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYR 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB8 KLLEGEESRLESGMQNMSIHTKTTSGYAGGLSSAYGGLTSPGLSYSLGSSFGSGAGSSSF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KLLEGEESRLESGMQNMSIHTKTTSGYAGGLSSAYGGLTSPGLSYSLGSSFGSGAGSSSF 430 440 450 460 470 480 460 470 480 pF1KB8 SRTSSSRAVVVKKIETRDGKLVSESSDVLPK ::::::::::::::::::::::::::::::: CCDS58 SRTSSSRAVVVKKIETRDGKLVSESSDVLPK 490 500 510 >>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa) initn: 1352 init1: 1295 opt: 1739 Z-score: 1074.5 bits: 208.5 E(32554): 1.6e-53 Smith-Waterman score: 1739; 62.1% identity (83.4% similar) in 470 aa overlap (1-458:74-536) 10 20 30 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPG .:: .. :.. . : : .. .. .: : CCDS88 GGFGRVSLAGACGVGGYGSRSLYNLGGSKRISISTSGGSFR-NRFGAGAGGGYGFGGGAG 50 60 70 80 90 100 40 50 60 70 80 pF1KB8 SRI-----SSSSFSRVGSSNFRGGLGGGYGGASGMGGITAVTVNQSLLSPLVLEVDPNIQ : . ....:. :...: ::.:: . ::: ::::::::.:: :..::.:: CCDS88 SGFGFGGGAGGGFGLGGGAGFGGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPSIQ 110 120 130 140 150 160 90 100 110 120 130 140 pF1KB8 AVRTQEKEQIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQ--KTARSNMDNMFESY :::.:.:::::::::::::::::::::::::.:.:::.:::.: ::.:.:.. .::.: CCDS88 RVRTEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEPLFEQY 170 180 190 200 210 220 150 160 170 180 190 200 pF1KB8 INNLRRQLETLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDVA ::::::::... :. .:..:: ::: ::::::::::::::::: :::::..:::::.: CCDS88 INNLRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYEDEINKRTTAENEFVMLKKDVDAA 230 240 250 260 270 280 210 220 230 240 250 260 pF1KB8 YMNKVELESRLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEV ::::::::.....: :::::...... :. ..:...:::::::::::.:.::.::::::: CCDS88 YMNKVELEAKVDALMDEINFMKMFFDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEV 290 300 310 320 330 340 270 280 290 300 310 320 pF1KB8 KAQYEDIANRSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEG :::::.::::::.:::: :: ::::::. ::.:::::: :: ::::::: :.::.:::.. CCDS88 KAQYEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLRNTKHEISEMNRMIQRLRAEIDN 350 360 370 380 390 400 330 340 350 360 370 380 pF1KB8 LKGQRASLEAAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLA .: : :.:. ::::::::::::.::: ::.::: :::.::::::: :::::::::.::: CCDS88 VKKQCANLQNAIADAEQRGELALKDARNKLAELEEALQKAKQDMARLLREYQELMNTKLA 410 420 430 440 450 460 390 400 410 420 430 pF1KB8 LDIEIATYRKLLEGEESRLES---GMQNMSIHTKT-TSGYAGGLSSAYGGLTSPGLSYSL ::.::::::::::::: :: . : :.:. :.. .:::..: :.::: ::. .: CCDS88 LDVEIATYRKLLEGEECRLSGEGVGPVNISVVTSSVSSGYGSG--SGYGG----GLGGGL 470 480 490 500 510 440 450 460 470 480 pF1KB8 GSSFGSG-AGSSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK :...:.: ::.:: : ::: CCDS88 GGGLGGGLAGGSSGSYYSSSSGGVGLGGGLSVGGSGFSASSGRGLGVGFGSGGGSSSSVK 520 530 540 550 560 570 >>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa) initn: 1739 init1: 1284 opt: 1715 Z-score: 1060.2 bits: 205.8 E(32554): 9.8e-53 Smith-Waterman score: 1720; 62.3% identity (81.6% similar) in 478 aa overlap (9-461:67-535) 10 20 30 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSRISSS-S : ..: .: .: . ..: ::: ..: . CCDS41 SVSRSRGSGGLGGACGGAGFGSRSLYGLGGSKRISIGG----GSCAISGGYGSRAGGSYG 40 50 60 70 80 90 40 50 60 70 80 pF1KB8 FSRVGSS-NFRGG------LGGGYGGASGMGG----------ITAVTVNQSLLSPLVLEV :. .::. .: :: :::: : :.:.:: : ::::::::.:: :.. CCDS41 FGGAGSGFGFGGGAGIGFGLGGGAGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQI 100 110 120 130 140 150 90 100 110 120 130 pF1KB8 DPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQ--KTARSNMDN ::.:: ::..:.:::::::::::::::::::::::::.:::::.:::.: ::.:.:.. CCDS41 DPTIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWTLLQEQGTKTVRQNLEP 160 170 180 190 200 210 140 150 160 170 180 190 pF1KB8 MFESYINNLRRQLETLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKK .::.:::::::::... :. .:..:: .:: ::::::::::::::::: ::::: .:: CCDS41 LFEQYINNLRRQLDSIVGERGRLDSELRGMQDLVEDFKNKYEDEINKRTAAENEFVTLKK 220 230 240 250 260 270 200 210 220 230 240 250 pF1KB8 DVDVAYMNKVELESRLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDS :::.::::::::... . ::::::::: ::. :. ..:..::::::::::::.:.::.:: CCDS41 DVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDS 280 290 300 310 320 330 260 270 280 290 300 310 pF1KB8 IIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQ ::::::::::.::.:::::::: :: :::::: ::.:::::: :: ::.:.:: :.::. CCDS41 IIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLR 340 350 360 370 380 390 320 330 340 350 360 370 pF1KB8 AEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELM .::. .: : :.:.:::::::::::.:.:::. :: :: :::.::::.:: :.:::::: CCDS41 SEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELM 400 410 420 430 440 450 380 390 400 410 420 430 pF1KB8 NVKLALDIEIATYRKLLEGEESRLES---GMQNMSI-HTKTTSGYAGGLSSAYGGL-TSP :::::::.::::::::::::: ::.. :. :.:. .. ..::: :: :.. .:: . CCDS41 NVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSSGY-GGASGVGSGLGLGG 460 470 480 490 500 510 440 450 460 470 480 pF1KB8 GLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK : ::: ::..: :.: :: ::.::. CCDS41 GSSYSYGSGLGVGGGFSS----SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 520 530 540 550 560 >>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa) initn: 1735 init1: 1287 opt: 1711 Z-score: 1057.8 bits: 205.4 E(32554): 1.3e-52 Smith-Waterman score: 1716; 62.3% identity (81.2% similar) in 478 aa overlap (9-461:67-535) 10 20 30 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSRISSS-S : ..: .: .: . ..: ::: ..: . CCDS88 SVSRSRGSGGLGGACGGAGFGSRSLYGLGGSKRISIGG----GSCAISGGYGSRAGGSYG 40 50 60 70 80 90 40 50 60 70 80 pF1KB8 FSRVGSS-NFRGG------LGGGYGGASGMGG----------ITAVTVNQSLLSPLVLEV :. .::. .: :: :::: : :.:.:: : ::::::::.:: :.. CCDS88 FGGAGSGFGFGGGAGIGFGLGGGAGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQI 100 110 120 130 140 150 90 100 110 120 130 pF1KB8 DPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQ--KTARSNMDN :: :: ::..:.:::::::::::::::::::::::::.:.:::.:::.: ::.:.:.. CCDS88 DPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEP 160 170 180 190 200 210 140 150 160 170 180 190 pF1KB8 MFESYINNLRRQLETLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKK .::.:::::::::... :. .:..:: ::: ::::.:::::::::::: ::::: .:: CCDS88 LFEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKK 220 230 240 250 260 270 200 210 220 230 240 250 pF1KB8 DVDVAYMNKVELESRLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDS :::.::::::::... . ::::::::: ::. :. ..:..::::::::::::.:.::.:: CCDS88 DVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDS 280 290 300 310 320 330 260 270 280 290 300 310 pF1KB8 IIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQ ::::::::::.::.:::::::: :: :::::: ::.:::::: :: ::.:.:: :.::. CCDS88 IIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLR 340 350 360 370 380 390 320 330 340 350 360 370 pF1KB8 AEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELM .::. .: : :::.:::::::::::.:.:::. :: :: :::.::::.:: :.:::::: CCDS88 SEIDHVKKQCASLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELM 400 410 420 430 440 450 380 390 400 410 420 430 pF1KB8 NVKLALDIEIATYRKLLEGEESRLES---GMQNMSI-HTKTTSGYAGGLSSAYGGL-TSP :::::::.::::::::::::: ::.. :. :.:. .. .::: :: :.. .:: . CCDS88 NVKLALDVEIATYRKLLEGEECRLNGEGVGQVNVSVVQSTISSGY-GGASGVGSGLGLGG 460 470 480 490 500 510 440 450 460 470 480 pF1KB8 GLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK : ::: ::..: :.: :: ::.::. CCDS88 GSSYSYGSGLGIGGGFSS----SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 520 530 540 550 560 >>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa) initn: 1336 init1: 1281 opt: 1703 Z-score: 1053.0 bits: 204.5 E(32554): 2.5e-52 Smith-Waterman score: 1708; 62.3% identity (81.3% similar) in 477 aa overlap (9-460:67-534) 10 20 30 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSRISSS-S : ..: .: .: . ..: ::: ..: . CCDS88 SVSRSRGSGGLGGACGGAGFGSRSLYGLGGSKRISIGG----GSCAISGGYGSRAGGSYG 40 50 60 70 80 90 40 50 60 70 80 pF1KB8 FSRVGSS-NFRGG------LGGGYGGASGMGG----------ITAVTVNQSLLSPLVLEV :. .::. .: :: :::: : :.:.:: : ::::::::.:: :.. CCDS88 FGGAGSGFGFGGGAGIGFGLGGGAGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQI 100 110 120 130 140 150 90 100 110 120 130 pF1KB8 DPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQ--KTARSNMDN :: :: ::..:.:::::::::::::::::::::::::.:.:::.:::.: ::.:.:.. CCDS88 DPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEP 160 170 180 190 200 210 140 150 160 170 180 190 pF1KB8 MFESYINNLRRQLETLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKK .::.:::::::::... :. .:..:: ::: ::::.:::::::::::: ::::: .:: CCDS88 LFEQYINNLRRQLDNIVGERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKK 220 230 240 250 260 270 200 210 220 230 240 250 pF1KB8 DVDVAYMNKVELESRLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDS :::.::::::::... . ::::::::: ::. :. ..:..::::::::::::.:.::.:: CCDS88 DVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDS 280 290 300 310 320 330 260 270 280 290 300 310 pF1KB8 IIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQ ::::::::::.::.:::::::: :: :::::: ::.:::::: :: ::.:.:: :.::. CCDS88 IIAEVKAQYEEIAQRSRAEAESWYQTKYEELQITAGRHGDDLRNTKQEIAEINRMIQRLR 340 350 360 370 380 390 320 330 340 350 360 370 pF1KB8 AEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELM .::. .: : :.:.:::::::::::.:.:::. :: :: :::.::::.:: :.:::::: CCDS88 SEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELM 400 410 420 430 440 450 380 390 400 410 420 430 pF1KB8 NVKLALDIEIATYRKLLEGEESRLES---GMQNMSI-HTKTTSGYAGGLSSAYGGL-TSP :::::::.::::::::::::: ::.. :. :.:. .. ..::: :: :.. .:: . CCDS88 NVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSSGY-GGASGVGSGLGLGG 460 470 480 490 500 510 440 450 460 470 480 pF1KB8 GLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK : ::: ::..: :.: :: ::.:: CCDS88 GSSYSYGSGLGVGGGFSS----SSGRATGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 520 530 540 550 560 >>CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 (551 aa) initn: 1396 init1: 1245 opt: 1696 Z-score: 1048.8 bits: 203.7 E(32554): 4.2e-52 Smith-Waterman score: 1723; 63.2% identity (83.1% similar) in 462 aa overlap (11-457:70-526) 10 20 30 40 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSRISSSSFSR .:: .: . : :: :.: .:. :. CCDS88 SAAGSGGLGRISSAGASFGSRSLYNLGGAKRVSING----CGSSCRSGFGGR-ASNRFGV 40 50 60 70 80 90 50 60 70 80 90 pF1KB8 VGSSNFRGGLGGGYGGAS----GMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIK .. .. ::.:::..: : ::: ::::::::.:: :..::.:: ::..:.:::: CCDS88 NSGFGYGGGVGGGFSGPSFPVCPPGGIQEVTVNQSLLTPLHLQIDPTIQRVRAEEREQIK 100 110 120 130 140 150 100 110 120 130 140 150 pF1KB8 TLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQ--KTARSNMDNMFESYINNLRRQLETL :::::::::::::::::::::.:::::.:::.: .:.:.:.. .:.:: ..::::::.. CCDS88 TLNNKFASFIDKVRFLEQQNKVLETKWALLQEQGSRTVRQNLEPLFDSYTSELRRQLESI 160 170 180 190 200 210 160 170 180 190 200 210 pF1KB8 GQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDVAYMNKVELESRL :. .::::: ::: .::::: .::::::::: ::::: .:::::.:::::::::... CCDS88 TTERGRLEAELRNMQDVVEDFKVRYEDEINKRTAAENEFVALKKDVDAAYMNKVELEAKV 220 230 240 250 260 270 220 230 240 250 260 270 pF1KB8 EGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRS ..: .::::...... :. .::.:..::::::::::.:.::.:::::::::::::::::: CCDS88 KSLPEEINFIHSVFDAELSQLQTQVGDTSVVLSMDNNRNLDLDSIIAEVKAQYEDIANRS 280 290 300 310 320 330 280 290 300 310 320 330 pF1KB8 RAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLEAA :::::: :: :::::: ::.:::::: :: ::::::: :.::.:::...: : .::..: CCDS88 RAEAESWYQTKYEELQVTAGRHGDDLRNTKQEISEMNRMIQRLRAEIDSVKKQCSSLQTA 340 350 360 370 380 390 340 350 360 370 380 390 pF1KB8 IADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYRKL :::::::::::.::: ::: .:: :::.::::::: :::::::::.:::::.:::::::: CCDS88 IADAEQRGELALKDARAKLVDLEEALQKAKQDMARLLREYQELMNIKLALDVEIATYRKL 400 410 420 430 440 450 400 410 420 430 440 pF1KB8 LEGEESRLES-GMQ--NMSIHTKT-TSGYAGGLSSAYGGLTSPGLS-YSL----GSSFGS ::::: :: . :.. :.:. :.: .:::..: : . :.: : : ::. : :.:. CCDS88 LEGEECRLSGEGVSPVNISVVTSTLSSGYGSGSSIGGGNLGLGGGSGYSFTTSGGHSLGA 460 470 480 490 500 510 450 460 470 480 pF1KB8 GAGSSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK : :.:.:: ::. CCDS88 GLGGSGFSATSNRGLGGSGSSVKFVSTTSSSQKSYTH 520 530 540 550 >>CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 (469 aa) initn: 1279 init1: 1235 opt: 1686 Z-score: 1043.6 bits: 202.5 E(32554): 8.3e-52 Smith-Waterman score: 1686; 62.7% identity (82.0% similar) in 472 aa overlap (9-470:6-469) 10 20 30 40 50 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSY-----TSGPGSRISSSSFSRVGSSNFRGGLGGGYG : : :: :::.:. .. ::. ..:::. .:.: : .. ..:: CCDS88 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGG-LGSSSLYGLGASRPRVAVRSAYG 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 GASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQ : : .:: ::.:::::.:: :..::..: :: .:.::::::::::::::::::::::: CCDS88 GPVG-AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQ 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 NKMLETKWSLLQQQKTARSN-MDNMFESYINNLRRQLETLGQEKLKLEAELGNMQGLVED ::.:::::.:::.::.:.:. . ..::. : .:: :::.: . .::::: .:: .::: CCDS88 NKLLETKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVED 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 FKNKYEDEINKRTEMENEFVLIKKDVDVAYMNKVELESRLEGLTDEINFLRQLYEEEIRE ::::::::::.:: :::::..:::::.:::.:::::.....:.::::::: : : :. : CCDS88 FKNKYEDEINHRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 LQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAG :::::::::::::::::::::.:.::::::::::..:. ::::::. :: :.: ::. :: CCDS88 LQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 KHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLS ::::::: :..::::::: :.::::::...:.:::.::::::.::.:::::.::: :: CCDS88 KHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 ELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYRKLLEGEESRLES---GMQNMSI ::::::::.:::::::::::::::.::::::::::::::::::::::: . : :.:. CCDS88 ELEAALQRGKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 HTKTTSGYAGGLSSAYG-GLTSPGLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRD ..: :: ::. : ::: : : . ::.:.:: . . .. : :.. ... .:: CCDS88 MNST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAGPG-LLKAYSIRTASASRRSARD 420 430 440 450 460 480 pF1KB8 GKLVSESSDVLPK >>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 (628 aa) initn: 1618 init1: 1241 opt: 1652 Z-score: 1021.6 bits: 198.8 E(32554): 1.4e-50 Smith-Waterman score: 1652; 60.8% identity (83.3% similar) in 449 aa overlap (16-454:127-566) 10 20 30 40 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGSRISSSSFSRVGSSN : .:.. . .:::. .:..:. :: . CCDS44 FGSGYGGGFGGGFGGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLG 100 110 120 130 140 150 50 60 70 80 90 100 pF1KB8 FRGGLG-GGYGGASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIKTLNNKFAS ::.: ::. : :: ::.:::::.:: .:.::.: :..::.:::::::::::: CCDS44 SPGGFGPGGFPG-----GIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFAS 160 170 180 190 200 210 110 120 130 140 150 160 pF1KB8 FIDKVRFLEQQNKMLETKWSLLQQQKTAR----SNMDNMFESYINNLRRQLETLGQEKLK :::::::::::::.:::::.::::: :. .:.. .::..:: :: :... :. . CCDS44 FIDKVRFLEQQNKVLETKWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGR 220 230 240 250 260 270 170 180 190 200 210 220 pF1KB8 LEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDVAYMNKVELESRLEGLTDE :..:: ::. ::::::.:::::::::: ::::: .::::: ::::::::......: :: CCDS44 LDSELKNMEDLVEDFKKKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDE 280 290 300 310 320 330 230 240 250 260 270 280 pF1KB8 INFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRSRAEAES :.::: ::. :. ..::.::::::::::::.::::.:::::::.:::::::.::.::::. CCDS44 IDFLRTLYDAELSQMQSHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEA 340 350 360 370 380 390 290 300 310 320 330 340 pF1KB8 MYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLEAAIADAEQ .:: : :::. ::.:::::: ::.:: :.:: :.::.:::::.: : :.:..:::.::: CCDS44 LYQTKLGELQTTAGRHGDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQ 400 410 420 430 440 450 350 360 370 380 390 400 pF1KB8 RGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYRKLLEGEES .::.:.:::::::.::.::::.::.:.:: ::.::::::::::::.::::::::::::: CCDS44 HGEMALKDANAKLQELQAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEY 460 470 480 490 500 510 410 420 430 440 450 pF1KB8 RLE----SGMQNMSIHTKTTSGYAGGLSSAYGGLTSPGLSYSLGSSFGSGAGSSS-FSRT :. :... . ..:::. ::: ...::: :.. .::..:..:.::.: :.: CCDS44 RMSGECPSAVSISVVSSSTTSASAGGYGGGYGG----GMGGGLGGGFSAGGGSGSGFGRG 520 530 540 550 560 460 470 480 pF1KB8 SSSRAVVVKKIETRDGKLVSESSDVLPK CCDS44 GGGGIGGGFGGGSSGFSGGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYS 570 580 590 600 610 620 >>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 (520 aa) initn: 1298 init1: 1132 opt: 1595 Z-score: 988.1 bits: 192.3 E(32554): 1e-48 Smith-Waterman score: 1615; 55.6% identity (80.7% similar) in 491 aa overlap (2-469:32-519) 10 20 30 pF1KB8 MSIRVTQKSYKVSTSGPRAFSSRSYTSGPGS :. .. . . :..: :.::: . :. CCDS41 IARQQCVRGGPRGFSCGSAIVGGGKRGAFSSVSMSGGAGRCSSGG---FGSRSLYNLRGN 10 20 30 40 50 40 50 60 70 pF1KB8 RISSSSF--SRVGS-----SNF-RGGLGGGYGGA-SG----------MGGITAVTVNQSL . : : :: :. ..: ::.:::.::. :: ::: ::.:::: CCDS41 KSISMSVAGSRQGACFGGAGGFGTGGFGGGFGGSFSGKGGPGFPVCPAGGIQEVTINQSL 60 70 80 90 100 110 80 90 100 110 120 130 pF1KB8 LSPLVLEVDPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQKTA :.:: .:.::.:: :::.:.:::: ::::::::::::.:::::::.:::::.::::: :. CCDS41 LTPLHVEIDPEIQKVRTEEREQIKLLNNKFASFIDKVQFLEQQNKVLETKWNLLQQQTTT 120 130 140 150 160 170 140 150 160 170 180 190 pF1KB8 RS--NMDNMFESYINNLRRQLETLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEME : :.. .::.:.. ::.::.:::..: .:..:: .:: :::::.:::.:::::: : CCDS41 TSSKNLEPLFETYLSVLRKQLDTLGNDKGRLQSELKTMQDSVEDFKTKYEEEINKRTAAE 180 190 200 210 220 230 200 210 220 230 240 250 pF1KB8 NEFVLIKKDVDVAYMNKVELESRLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDN :.::..:::::.::.::::::.....:.::::::. ::. :. ..:...::::::::::: CCDS41 NDFVVLKKDVDAAYLNKVELEAKVDSLNDEINFLKVLYDAELSQMQTHVSDTSVVLSMDN 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB8 SRSLDMDSIIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEM .:.::.:::::::.::::.::.::.::::..:: : ..:: . .:::.:. ::.::.:. CCDS41 NRNLDLDSIIAEVRAQYEEIAQRSKAEAEALYQTKVQQLQISVDQHGDNLKNTKSEIAEL 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB8 NRNISRLQAEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQ :: :.::.::::..: : .:....:::::::: :.:::..: :::::::.::...::. CCDS41 NRMIQRLRAEIENIKKQCQTLQVSVADAEQRGENALKDAHSKRVELEAALQQAKEELARM 360 370 380 390 400 410 380 390 400 410 420 pF1KB8 LREYQELMNVKLALDIEIATYRKLLEGEESRLESGMQN-MSIHTKTTSGYAGGLSSAYGG ::::::::.:::::::::::::::::::: :. . :. .:: . . : .::.:.. :. CCDS41 LREYQELMSVKLALDIEIATYRKLLEGEEYRMSGECQSAVSISVVSGSTSTGGISGGLGS 420 430 440 450 460 470 430 440 450 460 470 480 pF1KB8 LTSPGLSYSLGSSFGSGAG-SSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK .. ::: ..::. ::: : ..: : .:::. . . .. : CCDS41 GSGFGLSSGFGSGSGSGFGFGGSVSGSSSSKIISTTTLNKRR 480 490 500 510 520 483 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 20:01:53 2016 done: Fri Nov 4 20:01:53 2016 Total Scan time: 3.470 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]