FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8148, 543 aa 1>>>pF1KB8148 543 - 543 aa - 543 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.2819+/-0.00134; mu= -6.1899+/- 0.081 mean_var=444.1823+/-90.935, 0's: 0 Z-trim(110.8): 113 B-trim: 122 in 1/54 Lambda= 0.060855 statistics sampled from 11811 (11915) to 11811 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.66), E-opt: 0.2 (0.366), width: 16 Scan time: 3.020 The best scores are: opt bits E(32554) CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 3338 307.8 2.1e-83 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 1313 130.3 9.9e-30 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 1288 127.8 3e-29 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 1161 116.6 6.5e-26 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 1150 115.7 1.3e-25 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 1124 113.4 6.2e-25 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 1047 106.6 6.4e-23 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 1045 106.4 7.1e-23 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 1045 106.4 7.1e-23 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 1015 104.2 8e-22 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 812 86.0 1.1e-16 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 812 86.0 1.2e-16 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 791 84.1 3.9e-16 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 774 82.7 1.3e-15 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 763 81.8 2.4e-15 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 757 81.2 3.5e-15 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 755 81.1 4e-15 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 747 80.4 6.7e-15 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 735 79.3 1.3e-14 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 724 78.3 2.5e-14 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 723 78.3 3e-14 CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 715 77.6 4.9e-14 CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 713 77.4 4.9e-14 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 705 76.6 7.5e-14 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 702 76.4 9.2e-14 CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 693 75.7 1.9e-13 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 689 75.2 2e-13 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 680 74.4 3.5e-13 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 680 74.4 3.6e-13 CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 674 73.9 5.2e-13 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 674 73.9 5.3e-13 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 676 74.2 5.3e-13 CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 672 73.7 5.9e-13 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 667 73.3 7.8e-13 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 647 71.5 2.5e-12 CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 645 71.4 3.2e-12 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 641 71.0 3.6e-12 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 638 70.7 4.1e-12 CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 639 70.8 4.3e-12 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 630 70.0 6.9e-12 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 625 69.5 8.5e-12 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 616 68.7 1.5e-11 CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 616 68.8 1.6e-11 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 611 68.3 2.2e-11 CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 609 68.1 2.3e-11 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 593 66.7 6.3e-11 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 595 67.0 6.9e-11 >>CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 (543 aa) initn: 3338 init1: 3338 opt: 3338 Z-score: 1610.9 bits: 307.8 E(32554): 2.1e-83 Smith-Waterman score: 3338; 100.0% identity (100.0% similar) in 543 aa overlap (1-543:1-543) 10 20 30 40 50 60 pF1KB8 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAYSSYSAPVSSSLSVRRSYSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAYSSYSAPVSSSLSVRRSYSSS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 SGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVLEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 SGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVLEA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 ELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARYEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARYEE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 EVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQIQY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 EVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQIQY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 AQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAKNTDAVRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 AQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAKNTDAVRA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 AKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINKLENELRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 AKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINKLENELRT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 TKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGSITSGYSQSSQVFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 TKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGSITSGYSQSSQVFG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 RSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAKDEPPSEGEAEEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 RSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAKDEPPSEGEAEEEE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 KDKEEAEEEEAAEEEEAAKEESEEAKEEEEGGEGEEGEETKEAEEEEKKVEGAGEEQAAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 KDKEEAEEEEAAEEEEAAKEESEEAKEEEEGGEGEEGEETKEAEEEEKKVEGAGEEQAAK 490 500 510 520 530 540 pF1KB8 KKD ::: CCDS75 KKD >>CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 (916 aa) initn: 1732 init1: 656 opt: 1313 Z-score: 647.3 bits: 130.3 E(32554): 9.9e-30 Smith-Waterman score: 1338; 43.9% identity (72.6% similar) in 563 aa overlap (3-543:2-562) 10 20 30 40 50 pF1KB8 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTA-RSAYSSYSAPVSSSLSVRRSYSS :.. . . : :: .:: : .: : .. :.. :: : ..: . : : .::. . CCDS60 MSYTLDSLGNPSAYRRVTET-RSSFSRVSGSPSSGFRSQSWSRGSPSTVSSSYKRSMLA 10 20 30 40 50 60 70 80 90 100 pF1KB8 S----SGSLMPSLEN-LDLSQVAAISN-------DLKSIRTQEKAQLQDLNDRFASFIER :.... : :. ::.:: ... : : : :..:: ::: ::::::..::. CCDS60 PRLAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAGYIEK 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB8 VHELEQQNKVLEAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGL :: :::::: .:::. .::::.. ... :.::::.:: . : ...:: .: . . : CCDS60 VHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLDSDHL 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB8 EETLRNLQARYEEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVH :: .. :. :.:::. :.:.:. . :: .::.:...::.:...::.::..::.. : CCDS60 EEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFLRSNH 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB8 EEEIAELQAQIQYAQISVEM-DVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTV :::.:.: :::: ..:.:: : : :.:.:::.::.: :. . .::..:::::: :.. CCDS60 EEEVADLLAQIQASHITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAEEWFKCRYAK 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 LTESAAKNTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISA :::.: .: .:.:.::.:..: :: :..:..:.:. :: .:.::.::...:...: :.:. CCDS60 LTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIEERHNHDLSS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 MQDTINKLENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVG .::::..:::::: :: ::::.:.:::::::::::::::::::::::::::::.: : .: CCDS60 YQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFS-TFAG 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB8 SITSG-YSQSSQVFGRSAYGGLQTSSYLMSTR-SFPSYYT--SHVQEEQIEVEETIEAAK :::. :.. . : .. . .... .: ..:..:. :.::.. : CCDS60 SITGPLYTHRPPITISSKIQKPKVEAPKLKVQHKFVEEIIEETKVEDEKSEMEEALTAIT 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB8 AEEAKDEPPSEGEAEEEEKDKEEAEEEEAAEEEEAAKEESEEAKEEEEGGEGEEGEETKE : : . . :: ::.... ::::::.: .. .: . :.:::: : :::.: .: CCDS60 EELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGEKEEEEGQEEEE 480 490 500 510 520 530 530 540 pF1KB8 AEEEEKKV----EGAGEEQAAKKKD :.: : ::..:......:. CCDS60 EEDEGAKSDQAEEGGSEKEGSSEKEEGEQEEGETEAEAEGEEAEAKEEKKVEEKSEEVAT 540 550 560 570 580 590 >>CCDS7545.1 INA gene_id:9118|Hs108|chr10 (499 aa) initn: 1287 init1: 690 opt: 1288 Z-score: 638.6 bits: 127.8 E(32554): 3e-29 Smith-Waterman score: 1311; 49.2% identity (74.4% similar) in 488 aa overlap (3-479:2-472) 10 20 30 40 50 60 pF1KB8 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAYSSYSAPVSSSLSVRRSYSSS ::. : : .: . : : ..:. :: . : ... : : :. : :.: CCDS75 MSFGSEHYLCSSSSYRKVFGDGSRLSARLSGAGGA-GGFRSQSLSRSNVASSAACSSAS 10 20 30 40 50 70 80 90 100 110 pF1KB8 SGSLM------PSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQ : .: :. ..:::::.:: .:. : :::.:: ::: :::::: :::.::.:: : CCDS75 SLGLGLAYRRPPASDGLDLSQAAARTNEYKIIRTNEKEQLQGLNDRFAVFIEKVHQLETQ 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 NKVLEAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEK-QALQGEREGLEETLRN :..::::: .:::.:.:::: :...:.:::: :.:.. . ::: ::.:: : .. CCDS75 NRALEAELAALRQRHAEPSRVGELFQRELRDLRAQLEEASSARSQALL-ERDGLAEEVQR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 LQARYEEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAE :.:: ::: .:: :: : .. .: :.::: .:::...::.::..:...::.::.:: CCDS75 LRARCEEESRGREGAERALKAQQRDVDGATLARLDLEKKVESLLDELAFVRQVHDEEVAE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 LQAQIQYA-QISVEMDVT--KPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTES : : .: . : ..:.::: ::::..::..::::::.:::::.:.::::.::.:. :.:. CCDS75 LLATLQASSQAAAEVDVTVAKPDLTSALREIRAQYESLAAKNLQSAEEWYKSKFANLNEQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 AAKNTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDT ::..:.:.::...:. : :: :.:.:.:::. :: ::.::.:. :::....:.....::. CCDS75 AARSTEAIRASREEIHEYRRQLQARTIEIEGLRGANESLERQILELEERHSAEVAGYQDS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 INKLENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGSITS :..:::.::.:::::::.:.:::::::::::::::::::::::::::::.: :: CCDS75 IGQLENDLRNTKSEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFS-------TS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 GYSQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAKDEP : : :. . : . :::. : . : ::.:. . ... : .: .. .. CCDS75 GLSISG-------LNPLPNPSYLLPPRIL-SATTSKVSSTGLSLKKEEEEEEASKVASKK 420 430 440 450 460 480 490 500 510 520 pF1KB8 PSE-GEAEEEEKDKEEAEEEEAAEEEEAAKEESEEAKEEEEGGEGEEGEETKEAEEEEKK :. ::. :: CCDS75 TSQIGESFEEILEETVISTKKTEKSNIEETTISSQKI 470 480 490 >>CCDS7120.1 VIM gene_id:7431|Hs108|chr10 (466 aa) initn: 1218 init1: 956 opt: 1161 Z-score: 578.8 bits: 116.6 E(32554): 6.5e-26 Smith-Waterman score: 1161; 48.6% identity (79.9% similar) in 393 aa overlap (13-402:25-413) 10 20 30 40 pF1KB8 MSSFSYEPYYSTSYKRRYVETP-RVHI--SSVRSGYSTARSAYSSYSA : .: :: : :.. :..: ::.:: :.: . CCDS71 MSTRSVSSSSYRRMFGGPGTASRPSSSRSYVTTSTRTYSLGSALRP--STSRSLYASSPG 10 20 30 40 50 50 60 70 80 90 100 pF1KB8 PVSSSLSVRRSYSSSSGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFI : .. : :: .. ...:.: . ::....:. ::.::..::.::::::..: CCDS71 GVYATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKNTRTNEKVELQELNDRFANYI 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB8 ERVHELEQQNKVLEAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGERE ..:. ::::::.: ::: :. . . ::. :::.:.:.:: ... ::.: .. ::. CCDS71 DKVRFLEQQNKILLAELEQLKGQGK--SRLGDLYEEEMRELRRQVDQLTNDKARVEVERD 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB8 GLEETLRNLQARYEEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKK .: : . :. . .::.:.::.::. :. :. .:.:.::: .::....::..::.:::: CCDS71 NLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLKK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB8 VHEEEIAELQAQIQYAQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFT .::::: ::::::: ......::.::::.:::.:.: :::..::::.:.::::.::.:. CCDS71 LHEEEIQELQAQIQEQHVQIDVDVSKPDLTAALRDVRQQYESVAAKNLQEAEEWYKSKFA 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 VLTESAAKNTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADIS :.:.: .:.::.: ::.: .: :: ... : :..: .: ::.::.:..:.:.. .. . CCDS71 DLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEENFAVEAA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 AMQDTINKLENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSV .::::..:..:... : ::::.:.:::::::::::::::::.:::::::::.:.:. CCDS71 NYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESRISLPLP 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB8 GSITSGYSQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEE CCDS71 NFSSLNLRETNLDSLPLVDTHSKRTLLIKTVETRDGQVINETSQHHDDLE 420 430 440 450 460 >>CCDS33383.1 DES gene_id:1674|Hs108|chr2 (470 aa) initn: 1227 init1: 961 opt: 1150 Z-score: 573.5 bits: 115.7 E(32554): 1.3e-25 Smith-Waterman score: 1150; 49.9% identity (78.2% similar) in 385 aa overlap (22-402:36-418) 10 20 30 40 pF1KB8 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAY----SSYSAPV ::. ..: :. :.. .: .: .: CCDS33 SSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTSGGAGG 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB8 SSSLSVRRSYSSSSGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIER .:: . : .. . : . . : ::.: . :..... . ::.::..::.::::::..::. CCDS33 LGSLRASRLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDRFANYIEK 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB8 VHELEQQNKVLEAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGL :. ::::: .: :: : : : ::.: :::.:.:.:: .: ::.. .. ::..: CCDS33 VRFLEQQNAALAAE--VNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARVDVERDNL 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB8 EETLRNLQARYEEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVH . :. :.:. .::. .:.::. : : .: :.::: .::.::.:: .::.:::::: CCDS33 LDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEIAFLKKVH 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB8 EEEIAELQAQIQYAQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVL :::: :::::.: :..::::..::::.:::.::::::: .::::...::::.::. . : CCDS33 EEEIRELQAQLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWYKSKVSDL 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB8 TESAAKNTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAM :..: ::.::.: ::.:. : :. ... : ::.: .: :..: .:..::::. .. :.. CCDS33 TQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRFASEASGY 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB8 QDTINKLENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGS ::.: .::.:.: :.::::.:.:::::::::::::.:::.:::::::::.:... CCDS33 QDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRINLPIQTY 370 380 390 400 410 420 410 420 430 440 450 460 pF1KB8 ITSGYSQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAK CCDS33 SALNFRETSPEQRGSEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL 430 440 450 460 470 >>CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 (470 aa) initn: 645 init1: 645 opt: 1124 Z-score: 561.2 bits: 113.4 E(32554): 6.2e-25 Smith-Waterman score: 1124; 49.1% identity (76.3% similar) in 401 aa overlap (9-401:12-408) 10 20 30 40 50 pF1KB8 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAYSSYSAPVSSSLSVR--- . ::::.: . : . .. : :..: . : . .: : ::: CCDS87 MSHHPSGLRAGFSSTSYRRTFGPPPSLSPGAF-SYSSSSRFSSSRLLGSASPSSSVRLGS 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 -RSYSSSSGSLM--PSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHEL :: ...:.:. :: : ::.:.. :..... . :..:: .::.::::::.:::.:. : CCDS87 FRSPRAGAGALLRLPS-ERLDFSMAEALNQEFLATRSNEKQELQELNDRFANFIEKVRFL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 EQQNKVLEAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETL :::: .:..:: : . ::.: : .::.:.:: : :.. .: ::.:: : : CCDS87 EQQNAALRGELSQARGQ--EPARADQLCQQELRELRRELELLGRERDRVQVERDGLAEDL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 RNLQARYEEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEI :. : :::. .::::: :. :: .:.:.:.: :::..:.:::::: ::::.::::. CCDS87 AALKQRLEEETRKREDAEHNLVLFRKDVDDATLSRLELERKIESLMDEIEFLKKLHEEEL 180 190 200 210 220 230 240 250 260 270 280 pF1KB8 AELQAQIQYAQIS-VEMDVT-KPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTE .::.... :.. ::...: ::.:.:::.:::::::..::::.:.::::.::... :.. CCDS87 RDLQVSVESQQVQQVEVEATVKPELTAALRDIRAQYESIAAKNLQEAEEWYKSKYADLSD 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 SAAKNTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQD .: .: .:.: ::.:..:::: ... : :... :: :::: .::.:::.. . ...: CCDS87 AANRNHEALRQAKQEMNESRRQIQSLTCEVDGLRGTNEALLRQLRELEEQFALEAGGYQA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 TINKLENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGSIT .::.::: : ::::.:.:::.:::::::::::::.:::::::::.:.: CCDS87 GAARLEEELRQLKEEMARHLREYQELLNVKMALDIEIATYRKLLEGEESRISVPVHSFAS 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB8 SGYSQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAKDE CCDS87 LNIKTTVPEVEPPQDSHSRKTVLIKTIETRNGEVVTESQKEQRSELDKSSAHSY 420 430 440 450 460 470 >>CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 (438 aa) initn: 865 init1: 865 opt: 1047 Z-score: 525.0 bits: 106.6 E(32554): 6.4e-23 Smith-Waterman score: 1047; 45.3% identity (77.1% similar) in 393 aa overlap (34-416:8-397) 10 20 30 40 50 60 pF1KB8 FSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAYSSYSAPVSSSLSV-RRSYSSSSG :.:: .: : . . ..:. :: .. CCDS59 MERRRITSAARRSYVSSGEMMVGGLAPGRRLGPGTRL 10 20 30 70 80 90 100 110 pF1KB8 SLM---PSLEN-LDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVL :: : : . .:.: ..:.. .: :..:.:....:::::::.::.:. ::::::.: CCDS59 SLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQNKAL 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB8 EAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARY ::: :: : ::... .:. :.:.::: .. : .. :. ::..: . : ... . CCDS59 AAELNQLRAK--EPTKLADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQKL 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB8 EEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQI ..:. : .::. : :. ::::.::: .::..:.:: .:: ::.:.::::. ::: :. CCDS59 QDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQEQL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB8 QYAQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAKNTDAV :. ::.::.::::.::::.::.::: .:..::..::::..:.:. ::..::.:.. . CCDS59 ARQQVHVELDVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAELL 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB8 RAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINKLENEL : :: :... :: :.. : ..:. :: ::.::.:..: :... . ...:... .::.: CCDS59 RQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEEEG 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB8 RTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLS-----FTSVGSITSGYS .. :.::::.:.:::::::::.:::::::.:::::::::.:.. :... .: . :: CCDS59 QSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNL-QIRGQYS 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB8 QSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAKDEPPSE ..: CCDS59 RASWEGHWSPAPSSRACRLLQTGTEDQGKGIQLSLGAFVTLQRS 400 410 420 430 >>CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 (431 aa) initn: 1085 init1: 864 opt: 1045 Z-score: 524.1 bits: 106.4 E(32554): 7.1e-23 Smith-Waterman score: 1045; 46.4% identity (78.0% similar) in 373 aa overlap (34-401:8-378) 10 20 30 40 50 60 pF1KB8 FSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAYSSYSAPVSSSLSV-RRSYSSSSG :.:: .: : . . ..:. :: .. CCDS45 MERRRITSAARRSYVSSGEMMVGGLAPGRRLGPGTRL 10 20 30 70 80 90 100 110 pF1KB8 SLM---PSLEN-LDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVL :: : : . .:.: ..:.. .: :..:.:....:::::::.::.:. ::::::.: CCDS45 SLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQNKAL 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB8 EAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARY ::: :: : ::... .:. :.:.::: .. : .. :. ::..: . : ... . CCDS45 AAELNQLRAK--EPTKLADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQKL 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB8 EEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQI ..:. : .::. : :. ::::.::: .::..:.:: .:: ::.:.::::. ::: :. CCDS45 QDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQEQL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB8 QYAQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAKNTDAV :. ::.::.::::.::::.::.::: .:..::..::::..:.:. ::..::.:.. . CCDS45 ARQQVHVELDVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAELL 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB8 RAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINKLENEL : :: :... :: :.. : ..:. :: ::.::.:..: :... . ...:... .::.: CCDS45 RQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEEEG 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB8 RTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGSITSGYSQSSQV .. :.::::.:.:::::::::.:::::::.:::::::::.:.. CCDS45 QSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNLQIRGGKST 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB8 FGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAKDEPPSEGEAEE CCDS45 KDGENHKVTRYLKSLTIRVIPIQAHQIVNGTPPARG 400 410 420 430 >>CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 (432 aa) initn: 1085 init1: 864 opt: 1045 Z-score: 524.1 bits: 106.4 E(32554): 7.1e-23 Smith-Waterman score: 1045; 46.4% identity (78.0% similar) in 373 aa overlap (34-401:8-378) 10 20 30 40 50 60 pF1KB8 FSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAYSSYSAPVSSSLSV-RRSYSSSSG :.:: .: : . . ..:. :: .. CCDS11 MERRRITSAARRSYVSSGEMMVGGLAPGRRLGPGTRL 10 20 30 70 80 90 100 110 pF1KB8 SLM---PSLEN-LDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVL :: : : . .:.: ..:.. .: :..:.:....:::::::.::.:. ::::::.: CCDS11 SLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQNKAL 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB8 EAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARY ::: :: : ::... .:. :.:.::: .. : .. :. ::..: . : ... . CCDS11 AAELNQLRAK--EPTKLADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQKL 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB8 EEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQI ..:. : .::. : :. ::::.::: .::..:.:: .:: ::.:.::::. ::: :. CCDS11 QDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQEQL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB8 QYAQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAKNTDAV :. ::.::.::::.::::.::.::: .:..::..::::..:.:. ::..::.:.. . CCDS11 ARQQVHVELDVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAELL 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB8 RAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINKLENEL : :: :... :: :.. : ..:. :: ::.::.:..: :... . ...:... .::.: CCDS11 RQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEEEG 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB8 RTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGSITSGYSQSSQV .. :.::::.:.:::::::::.:::::::.:::::::::.:.. CCDS11 QSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNLQIRETSLD 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB8 FGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAKDEPPSEGEAEE CCDS11 TKSVSEGHLKRNIVVKTVEMRDGEVIKESKQEHKDVM 400 410 420 430 >>CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020 aa) initn: 915 init1: 583 opt: 1015 Z-score: 505.3 bits: 104.2 E(32554): 8e-22 Smith-Waterman score: 1015; 39.2% identity (67.8% similar) in 521 aa overlap (31-536:45-557) 10 20 30 40 50 pF1KB8 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGY-STARSAYSSYSAPVSSSLSVRRSYSS ::. : .:.. :: :: : : . .. CCDS13 FAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSVSASPSR---FRGAGAA 20 30 40 50 60 70 60 70 80 90 100 110 pF1KB8 SSGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVLE :: . . .: : . ..:.... .:: ::: ::::::..:..:..:: .:. :: CCDS13 SSTDSLDTLSNGPEGCMVAVATS-----RSEKEQLQALNDRFAGYIDKVRQLEAHNRSLE 80 90 100 110 120 120 130 140 150 160 170 pF1KB8 AELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARYE .: .:::... : . :::.:.:..: :. . :. :.: : : . ... : . CCDS13 GEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVRQRLD 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB8 EEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQIQ .:. .::.::. . :.:: ::..:.:. ..:..: ..:.. :.::..:: .::: CCDS13 DEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELLGQIQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB8 -----YAQISVEM-DVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAK ::...: :. : :...::..:::: : :... ..::::. :. :.:.: CCDS13 GSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSEAAKV 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB8 NTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINK ::::.:.:..:..: :: :.:.: :.:: .. ...::.: .::::...:::...:..:.. CCDS13 NTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQEAIQQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB8 LENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVG-SITSGY :. :::.:: ::: :.::::::::::::::::::::::::::: :..: . :. : CCDS13 LDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSLPEGL 370 380 390 400 410 420 420 430 440 450 460 pF1KB8 SQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQI--EV-EETIEAAKAEEAKDE . .: . . . . . .... ...: :. :: :: . :: ::.:.: CCDS13 PKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKEEEGKEE 430 440 450 460 470 480 470 480 490 500 510 520 pF1KB8 PPSEGEAEE--EEKDKEEAEEEEAAEEEEAAKEESEEAKE--EEEGGEGEEGEETKEAEE .: : : ::. : :: :. :.:: . .:::: : .. : ::.. :.. CCDS13 EGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEAKSPAEVKS 490 500 510 520 530 540 530 540 pF1KB8 EEKKVEGAGEEQAAKKKD :: : :: CCDS13 PEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPAEAKSPEKAKS 550 560 570 580 590 600 543 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 10:00:42 2016 done: Fri Nov 4 10:00:43 2016 Total Scan time: 3.020 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]