FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0457, 505 aa 1>>>pF1KB0457 505 - 505 aa - 505 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4160+/-0.00115; mu= 10.1307+/- 0.070 mean_var=188.4667+/-35.510, 0's: 0 Z-trim(110.3): 108 B-trim: 77 in 2/51 Lambda= 0.093424 statistics sampled from 11422 (11533) to 11422 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.701), E-opt: 0.2 (0.354), width: 16 Scan time: 2.930 The best scores are: opt bits E(32554) CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 3386 469.1 5.2e-132 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 3130 434.6 1.2e-121 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 2994 416.2 4e-116 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 2465 344.9 1.2e-94 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1804 255.9 9e-68 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1768 251.0 2.3e-66 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 1467 210.5 4.2e-54 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 1434 206.0 8.8e-53 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 1427 205.1 1.7e-52 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 1426 205.0 1.9e-52 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1411 202.9 7.5e-52 CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 1397 200.8 1.8e-51 CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 1372 197.7 3.1e-50 CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 1361 196.2 8.9e-50 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 1357 195.6 1.1e-49 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 1357 195.6 1.1e-49 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 1344 193.9 3.7e-49 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 1343 193.7 3.8e-49 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 1341 193.5 5.7e-49 CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1322 190.9 2.9e-48 CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1315 190.0 5.8e-48 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1308 189.0 1.1e-47 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 1305 188.7 1.7e-47 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1276 184.7 2.1e-46 CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1251 181.3 2.2e-45 CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 1190 173.2 7.1e-43 CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1172 170.7 3.6e-42 CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 950 140.7 3.1e-33 CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 936 138.8 1.2e-32 CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 936 138.8 1.2e-32 CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 885 132.0 1.5e-30 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 731 111.2 2.6e-24 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 708 108.1 2.2e-23 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 702 107.2 3.7e-23 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 702 107.3 3.7e-23 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 702 107.3 3.7e-23 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 700 107.0 4.7e-23 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 689 105.6 1.5e-22 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 643 99.4 1e-20 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 633 98.3 3.9e-20 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 606 94.4 3.6e-19 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 604 94.1 3.6e-19 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 597 93.1 6.7e-19 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 579 90.7 3.6e-18 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 570 89.5 8.9e-18 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 568 89.2 9.8e-18 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 568 89.2 1e-17 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 565 88.8 1.4e-17 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 564 88.6 1.4e-17 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 564 88.7 1.5e-17 >>CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 (505 aa) initn: 3386 init1: 3386 opt: 3386 Z-score: 2483.5 bits: 469.1 E(32554): 5.2e-132 Smith-Waterman score: 3386; 99.8% identity (99.8% similar) in 505 aa overlap (1-505:1-505) 10 20 30 40 50 60 pF1KB0 MTCGSGFGGRAFSCISACGPRPGRCCITAAPYRGISCYRGLTGGFGSHSVCGGFRAGSCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MTCGSGFGGRAFSCISACGPRPGRCCITAAPYRGISCYRGLTGGFGSHSVCGGFRAGSCG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 RSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 IDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFEGYIETLRREAECVEADSGRLASEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFEGYIETLRREAECVEADSGRLASEL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 NHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 RLYEEEIRILQSHISDTSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSK ::::::: :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RLYEEEILILQSHISDTSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 CEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 LSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLCEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLCEG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB0 IGAVNVCVSSSRGGVVCGDLCVSGSRPVTGSVCSAPCNGNVAVSTGLCAPCGQLNTTCGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IGAVNVCVSSSRGGVVCGDLCVSGSRPVTGSVCSAPCNGNVAVSTGLCAPCGQLNTTCGG 430 440 450 460 470 480 490 500 pF1KB0 GSCGVGSCGISSLGVGSCGSSCRKC ::::::::::::::::::::::::: CCDS31 GSCGVGSCGISSLGVGSCGSSCRKC 490 500 >>CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 (493 aa) initn: 3212 init1: 3118 opt: 3130 Z-score: 2297.2 bits: 434.6 E(32554): 1.2e-121 Smith-Waterman score: 3130; 95.5% identity (97.1% similar) in 491 aa overlap (1-486:1-491) 10 20 30 40 50 pF1KB0 MTCG-----SGFGGRAFSCISACGPRPGRCCITAAPYRGISCYRGLTGGFGSHSVCGGFR :::: :: :::.:::::::.:::::::::::::::::::::::::::::::: CCDS88 MTCGFNSIGCGFRPGNFSCVSACGPRPSRCCITAAPYRGISCYRGLTGGFGSHSVCGGFR 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB0 AGSCGRSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 AGSCGRSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 RFAAFIDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFEGYIETLRREAECVEADSGR :::::::::::::::::::::::::::::::::::::::: ::::::::::::::::::: CCDS88 RFAAFIDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFAGYIETLRREAECVEADSGR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 LASELNHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQE :::::::::::::::::::::::.:::::::::::::::::::::::::::::::::::: CCDS88 LASELNHVQEVLEGYKKKYEEEVALRATAENEFVALKKDVDCAYLRKSDLEANVEALIQE 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB0 IDFLRRLYEEEIRILQSHISDTSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAES :::::::::::::::::::::::::::::::::::::::.::::::::::.::::::::: CCDS88 IDFLRRLYEEEIRILQSHISDTSVVVKLDNSRDLNMDCIVAEIKAQYDDIATRSRAEAES 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB0 WYRSKCEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 WYRSKCEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB0 QGEAALSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 QGEAALSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQ 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB0 RLCEGIGAVNVCVSSSRGGVVCGDLCVSGSRPVTGSVCSAPCNGNVAVSTGLCAPCGQLN :::::. ::::::::::::::::::::::::::::::::::::::..:::::: :::::: CCDS88 RLCEGVEAVNVCVSSSRGGVVCGDLCVSGSRPVTGSVCSAPCNGNLVVSTGLCKPCGQLN 430 440 450 460 470 480 480 490 500 pF1KB0 TTCGGGSCGVGSCGISSLGVGSCGSSCRKC ::::::::: : CCDS88 TTCGGGSCGQGRH 490 >>CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 (486 aa) initn: 2987 init1: 2932 opt: 2994 Z-score: 2198.2 bits: 416.2 E(32554): 4e-116 Smith-Waterman score: 2994; 93.8% identity (97.5% similar) in 485 aa overlap (1-483:1-483) 10 20 30 40 50 60 pF1KB0 MTCGSGFGGRAFSCISACGPRPGRCCITAAPYRGISCYRGLTGGFGSHSVCGGFRAGSCG ::::: ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MTCGSYCGGRAFSCISACGPRPGRCCITAAPYRGISCYRGLTGGFGSHSVCGGFRAGSCG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 RSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 RSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 IDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFEGYIETLRREAECVEADSGRLASEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 IDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFEGYIETLRREAECVEADSGRLASEL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 NHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 RLYEEEIRILQSHISDTSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSK ::::::::.::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 RLYEEEIRVLQSHISDTSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 CEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 CEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 LSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLCEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLCEG 370 380 390 400 410 420 430 440 450 460 470 pF1KB0 IGAVNVCVSSSRGGVVCGDLCVSGSRPVTGS-VCSAPCNGNVAV-STGLCAPCGQLNTTC .:.::::::::::::::::::.: . ::... : :.: :.::.: .:. ::: ..... : CCDS41 VGSVNVCVSSSRGGVVCGDLCASTTAPVVSTRVSSVPSNSNVVVGTTNACAPSARVGV-C 430 440 450 460 470 480 490 500 pF1KB0 GGGSCGVGSCGISSLGVGSCGSSCRKC :: :: CCDS41 GG-SCKRC 480 >>CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 (507 aa) initn: 2567 init1: 2390 opt: 2465 Z-score: 1812.6 bits: 344.9 E(32554): 1.2e-94 Smith-Waterman score: 2608; 81.0% identity (89.3% similar) in 504 aa overlap (1-484:1-499) 10 20 30 40 50 pF1KB0 MTC-----GSGFG-GRAFSCISACGPRPG-RCCITAAPYRGISCYRGLTGGFGSHSVC-- :.: .:: : : :: :: .:. : ::::.::::::.:::::::: :::.:.: CCDS88 MSCRSYRISSGCGVTRNFSSCSAVAPKTGNRCCISAAPYRGVSCYRGLTG-FGSRSLCNL 10 20 30 40 50 60 70 80 90 100 pF1KB0 ---------GGFRAGSCGRSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCV ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 GSCGPRIAVGGFRAGSCGRSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCV 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB0 KQEEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFEGYIETL ::::::::::::::::::::::::::::::::::: :::::..::.::::::: :::::: CCDS88 KQEEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKWQFYQNQRCCESNLEPLFSGYIETL 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB0 RREAECVEADSGRLASELNHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDVDCAYLRK ::::::::::::::::::::::::::::::::::::.::::::::::.:::::::::::: CCDS88 RREAECVEADSGRLASELNHVQEVLEGYKKKYEEEVALRATAENEFVVLKKDVDCAYLRK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB0 SDLEANVEALIQEIDFLRRLYEEEIRILQSHISDTSVVVKLDNSRDLNMDCIIAEIKAQY ::::::::::..: .:::::::::::.::.:::::::.::.::::::::::::::::::: CCDS88 SDLEANVEALVEESSFLRRLYEEEIRVLQAHISDTSVIVKMDNSRDLNMDCIIAEIKAQY 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB0 DDIVTRSRAEAESWYRSKCEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQ ::...::::::::::::::::::::::::::::::::::::::::::::::::.:::::: CCDS88 DDVASRSRAEAESWYRSKCEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEIENAKCQ 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB0 NSKLEAAVAQSEQQGEAALSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIE .:::::::..::::::::::::::::::::::::::::::::..::::::::::::::: CCDS88 RAKLEAAVAEAEQQGEAALSDARCKLAELEGALQKAKQDMACLLKEYQEVMNSKLGLDIE 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB0 IATYRRLLEGEEQRLCEGIGAVNVCVSSSRGGVVCGDLCVSGS--RPVTGSVCSAPCNGN ::::::::::::.:::::.:.:::::::::::: :: : : . : .: : :: .. CCDS88 IATYRRLLEGEEHRLCEGVGSVNVCVSSSRGGVSCGGLSYSTTPGRQIT-SGPSAIGGSI 420 430 440 450 460 470 470 480 490 500 pF1KB0 VAVSTGLCAPCGQLNTTCGGGSCGVGSCGISSLGVGSCGSSCRKC ..:. :::: ... ::: CCDS88 TVVAPDSCAPCQPRSSSF---SCGSSRSVRFA 480 490 500 >>CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 (600 aa) initn: 1781 init1: 1752 opt: 1804 Z-score: 1330.2 bits: 255.9 E(32554): 9e-68 Smith-Waterman score: 1812; 60.5% identity (80.6% similar) in 496 aa overlap (15-500:65-555) 10 20 30 40 pF1KB0 MTCGSGFGGRAFSCISACGPRPGRCCITAAPYRGISCYRGLTGG :.: : :: .: . . :.. : : CCDS88 SVSCWSGPGFRGLGSFGSRSVITFGSYSPRIAAVGSRPIHCGVRFGAGCGMGFGDGRGVG 40 50 60 70 80 90 50 60 70 80 90 pF1KB0 FG--SHSVCG-GFRAGSC------GRSFGYRSGGVCGPSPPCITTVSVNESLLTPLNLEI .: . : : :: ::: : .:::: ::: :. : ::.:.::.:::::::::: CCDS88 LGPRADSCVGLGFGAGSGIGYGFGGPGFGYRVGGVGVPAAPSITAVTVNKSLLTPLNLEI 100 110 120 130 140 150 100 110 120 130 140 150 pF1KB0 DPNAQCVKQEEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLF ::::: ::..::::::.::..::.:::::::::::::::::: .: :...: .::::::: CCDS88 DPNAQRVKKDEKEQIKTLNNKFASFIDKVRFLEQQNKLLETKWSFLQEQKCIRSNLEPLF 160 170 180 190 200 210 160 170 180 190 200 210 pF1KB0 EGYIETLRREAECVEADSGRLASELNHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDV :.:: .:::. : . .:..:: .: ::.:.::::.:::::::: ::.:::::::::::: CCDS88 ESYITNLRRQLEVLVSDQARLQAERNHLQDVLEGFKKKYEEEVVCRANAENEFVALKKDV 220 230 240 250 260 270 220 230 240 250 260 270 pF1KB0 DCAYLRKSDLEANVEALIQEIDFLRRLYEEEIRILQSHISDTSVVVKLDNSRDLNMDCII : :.. ::::::::..: ::::::. :: :::..::::::.:::.::.:::::::.: :: CCDS88 DAAFMNKSDLEANVDTLTQEIDFLKTLYMEEIQLLQSHISETSVIVKMDNSRDLNLDGII 280 290 300 310 320 330 280 290 300 310 320 330 pF1KB0 AEIKAQYDDIVTRSRAEAESWYRSKCEEMKATVIRHGETLRRTKEEINELNRMIQRLTAE ::.::::.... ::::.::.::..: :::..:. .: ..:: ..:::::.:.:::: :: CCDS88 AEVKAQYEEVARRSRADAEAWYQTKYEEMQVTAGQHCDNLRNIRNEINELTRLIQRLKAE 340 350 360 370 380 390 340 350 360 370 380 390 pF1KB0 VENAKCQNSKLEAAVAQSEQQGEAALSDARCKLAELEGALQKAKQDMACLIREYQEVMNS .:.:: : .:::::::..::::::.::::.::::.:: :::.:::::: . ::::.::. CCDS88 IEHAKAQRAKLEAAVAEAEQQGEATLSDAKCKLADLECALQQAKQDMARQLCEYQELMNA 400 410 420 430 440 450 400 410 420 430 440 450 pF1KB0 KLGLDIEIATYRRLLEGEEQRLCEGIGAVNVCVSSSRGGVVCG-DLCVSGSRPVTGSVCS :::::::::::::::::::.:::::.: ::. :::::::.::: . :.:: :.: . CCDS88 KLGLDIEIATYRRLLEGEESRLCEGVGPVNISVSSSRGGLVCGPEPLVAGSTLSRGGV-T 460 470 480 490 500 510 460 470 480 490 500 pF1KB0 APCNGNVAVSTGLCAPCGQLNTTCGGGSCGVGSCGISSLGVGSCGSSCRKC ...: ...:. : :: . ::. . .. . : :. : :: CCDS88 FSGSSSVCATSGVLASCGP---SLGGARVAPATGDLLSTGTRS-GSMLISEACVPSVPCP 520 530 540 550 560 CCDS88 LPTQGGFSSCSGGRSSSVRFVSTTTSCRTKY 570 580 590 600 >>CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 (513 aa) initn: 1748 init1: 1626 opt: 1768 Z-score: 1304.9 bits: 251.0 E(32554): 2.3e-66 Smith-Waterman score: 1799; 59.6% identity (78.6% similar) in 513 aa overlap (4-501:9-508) 10 20 30 40 50 pF1KB0 MTCGSGFGGRAFSCISACGPRP-GRCCITAAPYRGISCYRGLT--GGFGSHSVCG :: :...:: :: :: . .. .: : . ::: : .::.:.:. CCDS88 MSYHSFQPGSRCGSQSFSSYSAVMPRMVTHYAVSKGPCRP-GGGRGLRALGCLGSRSLCN 10 20 30 40 50 60 70 80 90 100 pF1KB0 -GF---RAGS-CGRS---FGYRSGGVCGPSPPCITTVSVNESLLTPLNLEIDPNAQCVKQ :: :..: :: . :::: :..:::: ::: :..:::::.:: :::::..: ::. CCDS88 VGFGRPRVASRCGGTLPGFGYRLGATCGPSA-CITPVTINESLLVPLALEIDPTVQRVKR 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB0 EEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKLQFYQNRECCQSNLEPLFEGYIETLRR .:::::: ::.:::.::.:::::::.::::::: .:.:...:::.:.::.::::: .::: CCDS88 DEKEQIKCLNNRFASFINKVRFLEQKNKLLETKWNFMQQQRCCQTNIEPIFEGYISALRR 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB0 EAECVEADSGRLASELNHVQEVLEGYKKKYEEEVSLRATAENEFVALKKDVDCAYLRKSD . .:: .: :: ::: .: .:::::::::::.::: .:::::::::::: :.: :.: CCDS88 QLDCVSGDRVRLESELCSLQAALEGYKKKYEEELSLRPCVENEFVALKKDVDTAFLMKAD 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB0 LEANVEALIQEIDFLRRLYEEEIRILQSHISDTSVVVKLDNSRDLNMDCIIAEIKAQYDD ::.:.:::.::::::. :::::: .:::.::.:::.::.::::.:..: ::::::::::: CCDS88 LETNAEALVQEIDFLKSLYEEEICLLQSQISETSVIVKMDNSRELDVDGIIAEIKAQYDD 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB0 IVTRSRAEAESWYRSKCEEMKATVIRHGETLRRTKEEINELNRMIQRLTAEVENAKCQNS :..::.::::.::. . ::...:. : ..:: :.:: :.:..:::: :.::.: : CCDS88 IASRSKAEAEAWYQCRYEELRVTAGNHCDNLRNRKNEILEMNKLIQRLQQETENVKAQRC 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB0 KLEAAVAQSEQQGEAALSDARCKLAELEGALQKAKQDMACLIREYQEVMNSKLGLDIEIA :::.:.:..::::::::.::.:::: :: ::::::::::::..::::::::::::::::: CCDS88 KLEGAIAEAEQQGEAALNDAKCKLAGLEEALQKAKQDMACLLKEYQEVMNSKLGLDIEIA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB0 TYRRLLEGEEQRLCEGIGAVNVCVSSSRGGVV---CGDLCVSGSRPVTGSVCSAPCNGNV ::::::::::.::::::: ::. ::::.:. . :: : :: .. .: CCDS88 TYRRLLEGEEHRLCEGIGPVNISVSSSKGAFLYEPCGV-----STPVLSTGVLRSNGGCS 420 430 440 450 460 470 470 480 490 500 pF1KB0 AVSTG-LCAPCGQLNTTCGGGSCGVGSCGISSLGVGSCGSSCRKC :.:: : .:: : ::: : ::. .:. ::: CCDS88 IVGTGELYVPC----EPQGLLSCGSGR--KSSMTLGAGGSSPSHKH 480 490 500 510 >>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa) initn: 1423 init1: 1083 opt: 1467 Z-score: 1084.8 bits: 210.5 E(32554): 4.2e-54 Smith-Waterman score: 1478; 49.2% identity (73.6% similar) in 535 aa overlap (3-504:55-586) 10 20 30 pF1KB0 MTCG-SGFGGRAFSCISACGPRPGRCCITAAP :: .:.:.:.. .. : . ... CCDS88 PSVSRTSFTSVSRSGGGGGGGFGRVSLAGACGVGGYGSRSLYNLG--GSKRISISTSGGS 30 40 50 60 70 80 40 50 60 70 80 pF1KB0 YR-----GISCYRGLTGGFGSHSVCGGFRAGSCGRSFGYR-SGGVCGPS-PPC----ITT .: : . :. :: :: :: .:. : . : .:: ::. : : : CCDS88 FRNRFGAGAGGGYGFGGGAGSGFGFGGGAGGGFGLGGGAGFGGGFGGPGFPVCPPGGIQE 90 100 110 120 130 140 90 100 110 120 130 140 pF1KB0 VSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKLQF :.::.::::::::.:::. : :. ::.::::.::..::.:::::::::::::.:.:: . CCDS88 VTVNQSLLTPLNLQIDPSIQRVRTEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTL 150 160 170 180 190 200 150 160 170 180 190 pF1KB0 YQNR--ECCQSNLEPLFEGYIETLRREAECVEADSGRLASELNHVQEVLEGYKKKYEEEV :.. . ..::::::: ::..:::. . . .. ::: ::: ..:...: .:.:::.:. CCDS88 LQEQGTKTVRQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYEDEI 210 220 230 240 250 260 200 210 220 230 240 250 pF1KB0 SLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLRRLYEEEIRILQSHISDTS . :.::::::: :::::: ::. : .:::.:.::..::.:.. ... :. .:.:.:::: CCDS88 NKRTTAENEFVMLKKDVDAAYMNKVELEAKVDALMDEINFMKMFFDAELSQMQTHVSDTS 270 280 290 300 310 320 260 270 280 290 300 310 pF1KB0 VVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSKCEEMKATVIRHGETLRRT ::...::.:.:..: ::::.::::..:..:::.::::::..: ::.. :. :::. :: : CCDS88 VVLSMDNNRNLDLDSIIAEVKAQYEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLRNT 330 340 350 360 370 380 320 330 340 350 360 370 pF1KB0 KEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAALSDARCKLAELEGALQKA :.::.:.::::::: ::..:.: : ..:. :.:..::.:: ::.::: :::::: ::::: CCDS88 KHEISEMNRMIQRLRAEIDNVKKQCANLQNAIADAEQRGELALKDARNKLAELEEALQKA 390 400 410 420 430 440 380 390 400 410 420 430 pF1KB0 KQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLC-EGIGAVNVCVSSSR----- ::::: :.:::::.::.::.::.::::::.:::::: :: ::.: ::. : .: CCDS88 KQDMARLLREYQELMNTKLALDVEIATYRKLLEGEECRLSGEGVGPVNISVVTSSVSSGY 450 460 470 480 490 500 440 450 460 470 480 pF1KB0 ----------GGVVCGDLCVSGSRPVTGSVCSAPCNGNVAVSTGLCAPCGQLNTTCGGG- :: . : : . . .:: :. .:.:... :: . . .... : : CCDS88 GSGSGYGGGLGGGLGGGLGGGLAGGSSGSYYSSS-SGGVGLGGGLSVGGSGFSASSGRGL 510 520 530 540 550 560 490 500 pF1KB0 SCGVGSCGISSLGVG--SCGSSCRKC . : :: : :: .: : :: :: CCDS88 GVGFGSGGGSSSSVKFVSTTSSSRKSFKS 570 580 590 >>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa) initn: 1074 init1: 1046 opt: 1434 Z-score: 1061.0 bits: 206.0 E(32554): 8.8e-53 Smith-Waterman score: 1461; 49.3% identity (74.4% similar) in 519 aa overlap (3-504:51-560) 10 20 pF1KB0 MTCG-SGFGGRAFSCISAC---GPRPGRCCIT :: .:::.:.. ... . : : :. CCDS41 NSARLPGVSRSGFSSVSVSRSRGSGGLGGACGGAGFGSRSLYGLGGSKRISIGGGSCAIS 30 40 50 60 70 80 30 40 50 60 70 pF1KB0 AAPYRGISCYRGLTGGFGSHSVCGGFRAGSCGRSFGYR-----SGGVCGPS-PPC----I . : . : . :::. . :: .:. : .:: .:: ::. : : : CCDS41 G----GYGSRAGGSYGFGGAGSGFGF-GGGAGIGFGLGGGAGLAGGFGGPGFPVCPPGGI 90 100 110 120 130 80 90 100 110 120 130 pF1KB0 TTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKL :.::.::::::::.:::. : :. ::.::::.::..::.:::::::::::::.:::: CCDS41 QEVTVNQSLLTPLNLQIDPTIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLETKW 140 150 160 170 180 190 140 150 160 170 180 190 pF1KB0 QFYQNR--ECCQSNLEPLFEGYIETLRREAECVEADSGRLASELNHVQEVLEGYKKKYEE . :.. . ..::::::: ::..:::. . . .. ::: ::: .:...: .:.:::. CCDS41 TLLQEQGTKTVRQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRGMQDLVEDFKNKYED 200 210 220 230 240 250 200 210 220 230 240 250 pF1KB0 EVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLRRLYEEEIRILQSHISD :.. :..::::::.:::::: ::. : .:.:....: .::.::: ::. :. .:.:::: CCDS41 EINKRTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISD 260 270 280 290 300 310 260 270 280 290 300 310 pF1KB0 TSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSKCEEMKATVIRHGETLR ::::...::.:.:..: ::::.::::..:. ::::::::::..: ::...:. :::. :: CCDS41 TSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLR 320 330 340 350 360 370 320 330 340 350 360 370 pF1KB0 RTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAALSDARCKLAELEGALQ ::.:: :.::::::: .:....: : ..:.::.:..::.:: ::.::. :: :: ::: CCDS41 NTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQ 380 390 400 410 420 430 380 390 400 410 420 430 pF1KB0 KAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLC-EGIGAVNVCVSSSRGGV :::::.: :..::::.:: ::.::.::::::.:::::: :: ::.: ::. : .: . CCDS41 KAKQDLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSS 440 450 460 470 480 490 440 450 460 470 480 490 pF1KB0 VCGDLCVSGSRPVTGSVCSAPCNGNVAVSTGLCAPCGQLNTTCGGGSCGVGSCGISSLGV : :: :. : .....:. :. . :. . ::: .::. : :.. CCDS41 GYGGASGVGSGLGLGGGSSYSYGSGLGVGGGFSSSSGR---AIGGGLSSVGG-GSSTIKY 500 510 520 530 540 550 500 pF1KB0 GSCGSSCRKC . .:: :: CCDS41 TTTSSSSRKSYKH 560 >>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa) initn: 1072 init1: 1044 opt: 1427 Z-score: 1055.9 bits: 205.1 E(32554): 1.7e-52 Smith-Waterman score: 1454; 49.1% identity (74.2% similar) in 519 aa overlap (3-504:51-560) 10 20 pF1KB0 MTCG-SGFGGRAFSCISAC---GPRPGRCCIT :: .:::.:.. ... . : : :. CCDS88 NSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAGFGSRSLYGLGGSKRISIGGGSCAIS 30 40 50 60 70 80 30 40 50 60 70 pF1KB0 AAPYRGISCYRGLTGGFGSHSVCGGFRAGSCGRSFGYR-----SGGVCGPS-PPC----I . : . : . :::. . :: .:. : .:: .:: ::. : : : CCDS88 G----GYGSRAGGSYGFGGAGSGFGF-GGGAGIGFGLGGGAGLAGGFGGPGFPVCPPGGI 90 100 110 120 130 80 90 100 110 120 130 pF1KB0 TTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKL :.::.::::::::.::: : :. ::.::::.::..::.:::::::::::::.:.:: CCDS88 QEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKW 140 150 160 170 180 190 140 150 160 170 180 190 pF1KB0 QFYQNR--ECCQSNLEPLFEGYIETLRREAECVEADSGRLASELNHVQEVLEGYKKKYEE . :.. . ..::::::: ::..:::. . . .. ::: ::: ..:...: :.:::. CCDS88 TLLQEQGTKTVRQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDLKNKYED 200 210 220 230 240 250 200 210 220 230 240 250 pF1KB0 EVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLRRLYEEEIRILQSHISD :.. :..::::::.:::::: ::. : .:.:....: .::.::: ::. :. .:.:::: CCDS88 EINKRTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISD 260 270 280 290 300 310 260 270 280 290 300 310 pF1KB0 TSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSKCEEMKATVIRHGETLR ::::...::.:.:..: ::::.::::..:. ::::::::::..: ::...:. :::. :: CCDS88 TSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLR 320 330 340 350 360 370 320 330 340 350 360 370 pF1KB0 RTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAALSDARCKLAELEGALQ ::.:: :.::::::: .:....: : ..:.::.:..::.:: ::.::. :: :: ::: CCDS88 NTKQEIAEINRMIQRLRSEIDHVKKQCASLQAAIADAEQRGEMALKDAKNKLEGLEDALQ 380 390 400 410 420 430 380 390 400 410 420 430 pF1KB0 KAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLC-EGIGAVNVCVSSSRGGV :::::.: :..::::.:: ::.::.::::::.:::::: :: ::.: ::: : .: . CCDS88 KAKQDLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNVSVVQSTISS 440 450 460 470 480 490 440 450 460 470 480 490 pF1KB0 VCGDLCVSGSRPVTGSVCSAPCNGNVAVSTGLCAPCGQLNTTCGGGSCGVGSCGISSLGV : :: :. : ....... :. . :. . ::: .::. : :.. CCDS88 GYGGASGVGSGLGLGGGSSYSYGSGLGIGGGFSSSSGR---AIGGGLSSVGG-GSSTIKY 500 510 520 530 540 550 500 pF1KB0 GSCGSSCRKC . .:: :: CCDS88 TTTSSSSRKSYKH 560 >>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa) initn: 1070 init1: 1042 opt: 1426 Z-score: 1055.2 bits: 205.0 E(32554): 1.9e-52 Smith-Waterman score: 1453; 49.1% identity (74.0% similar) in 519 aa overlap (3-504:51-560) 10 20 pF1KB0 MTCG-SGFGGRAFSCISAC---GPRPGRCCIT :: .:::.:.. ... . : : :. CCDS88 NSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAGFGSRSLYGLGGSKRISIGGGSCAIS 30 40 50 60 70 80 30 40 50 60 70 pF1KB0 AAPYRGISCYRGLTGGFGSHSVCGGFRAGSCGRSFGYR-----SGGVCGPS-PPC----I . : . : . :::. . :: .:. : .:: .:: ::. : : : CCDS88 G----GYGSRAGGSYGFGGAGSGFGF-GGGAGIGFGLGGGAGLAGGFGGPGFPVCPPGGI 90 100 110 120 130 80 90 100 110 120 130 pF1KB0 TTVSVNESLLTPLNLEIDPNAQCVKQEEKEQIKSLNSRFAAFIDKVRFLEQQNKLLETKL :.::.::::::::.::: : :. ::.::::.::..::.:::::::::::::.:.:: CCDS88 QEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKW 140 150 160 170 180 190 140 150 160 170 180 190 pF1KB0 QFYQNR--ECCQSNLEPLFEGYIETLRREAECVEADSGRLASELNHVQEVLEGYKKKYEE . :.. . ..::::::: ::..:::. . . .. ::: ::: ..:...: :.:::. CCDS88 TLLQEQGTKTVRQNLEPLFEQYINNLRRQLDNIVGERGRLDSELRNMQDLVEDLKNKYED 200 210 220 230 240 250 200 210 220 230 240 250 pF1KB0 EVSLRATAENEFVALKKDVDCAYLRKSDLEANVEALIQEIDFLRRLYEEEIRILQSHISD :.. :..::::::.:::::: ::. : .:.:....: .::.::: ::. :. .:.:::: CCDS88 EINKRTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISD 260 270 280 290 300 310 260 270 280 290 300 310 pF1KB0 TSVVVKLDNSRDLNMDCIIAEIKAQYDDIVTRSRAEAESWYRSKCEEMKATVIRHGETLR ::::...::.:.:..: ::::.::::..:. ::::::::::..: ::.. :. :::. :: CCDS88 TSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQITAGRHGDDLR 320 330 340 350 360 370 320 330 340 350 360 370 pF1KB0 RTKEEINELNRMIQRLTAEVENAKCQNSKLEAAVAQSEQQGEAALSDARCKLAELEGALQ ::.:: :.::::::: .:....: : ..:.::.:..::.:: ::.::. :: :: ::: CCDS88 NTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQ 380 390 400 410 420 430 380 390 400 410 420 430 pF1KB0 KAKQDMACLIREYQEVMNSKLGLDIEIATYRRLLEGEEQRLC-EGIGAVNVCVSSSRGGV :::::.: :..::::.:: ::.::.::::::.:::::: :: ::.: ::. : .: . CCDS88 KAKQDLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSS 440 450 460 470 480 490 440 450 460 470 480 490 pF1KB0 VCGDLCVSGSRPVTGSVCSAPCNGNVAVSTGLCAPCGQLNTTCGGGSCGVGSCGISSLGV : :: :. : .....:. :. . :. . ::: .::. : :.. CCDS88 GYGGASGVGSGLGLGGGSSYSYGSGLGVGGGFSSSSGR---ATGGGLSSVGG-GSSTIKY 500 510 520 530 540 550 500 pF1KB0 GSCGSSCRKC . .:: :: CCDS88 TTTSSSSRKSYKH 560 505 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 11:54:05 2016 done: Sat Nov 5 11:54:06 2016 Total Scan time: 2.930 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]