FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0845, 1026 aa 1>>>pF1KSDA0845 1026 - 1026 aa - 1026 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 18.7553+/-0.00153; mu= -40.3028+/- 0.092 mean_var=770.1205+/-159.037, 0's: 0 Z-trim(113.4): 185 B-trim: 0 in 0/53 Lambda= 0.046216 statistics sampled from 13884 (14046) to 13884 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.691), E-opt: 0.2 (0.431), width: 16 Scan time: 5.430 The best scores are: opt bits E(32554) CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 6420 444.1 6.9e-124 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 1699 129.3 3.6e-29 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 1120 90.6 8.8e-18 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 1015 83.6 1.2e-15 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 964 80.2 1.1e-14 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 938 78.5 3.8e-14 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 881 74.6 4.9e-13 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 869 73.8 8.5e-13 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 869 73.8 8.6e-13 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 863 73.5 1.2e-12 >>CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020 aa) initn: 7437 init1: 4449 opt: 6420 Z-score: 2337.7 bits: 444.1 E(32554): 6.9e-124 Smith-Waterman score: 6420; 99.4% identity (99.4% similar) in 1026 aa overlap (1-1026:1-1020) 10 20 30 40 50 60 pF1KSD MMSFGGADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSVSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MMSFGGADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSVSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SPSRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SPSRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD HNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 HNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD VRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD LLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD SEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD QEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SLPEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SLPEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD EEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEAKS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD PAEVKSPEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPAEAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PAEVKSPEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPAEAKS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD PEKAKSPVKEEAKSPAEAKSPVKEEAKSPAEVKSPEKAKSPTKEEAKSPEKAKSPEKAKS ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PEKAKSPVKEEAKSPAEAKSPVKEEAKSPAEVKSPEKAKSPTKEEAKSPEKAKSPEK--- 610 620 630 640 650 670 680 690 700 710 720 pF1KSD PEKEEAKSPEKAKSPVKAEAKSPEKAKSPVKAEAKSPEKAKSPVKEEAKSPEKAKSPVKE ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ---EEAKSPEKAKSPVKAEAKSPEKAKSPVKAEAKSPEKAKSPVKEEAKSPEKAKSPVKE 660 670 680 690 700 710 730 740 750 760 770 780 pF1KSD EAKSPEKAKSPVKEEAKTPEKAKSPVKEEAKSPEKAKSPEKAKTLDVKSPEAKTPAKEEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EAKSPEKAKSPVKEEAKTPEKAKSPVKEEAKSPEKAKSPEKAKTLDVKSPEAKTPAKEEA 720 730 740 750 760 770 790 800 810 820 830 840 pF1KSD RSPADKFPEKAKSPVKEEVKSPEKAKSPLKEDAKAPEKEIPKKEEVKSPVKEEEKPQEVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RSPADKFPEKAKSPVKEEVKSPEKAKSPLKEDAKAPEKEIPKKEEVKSPVKEEEKPQEVK 780 790 800 810 820 830 850 860 870 880 890 900 pF1KSD VKEPPKKAEEEKAPATPKTEEKKDSKKEEAPKKEAPKPKVEEKKEPAVEKPKESKVEAKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VKEPPKKAEEEKAPATPKTEEKKDSKKEEAPKKEAPKPKVEEKKEPAVEKPKESKVEAKK 840 850 860 870 880 890 910 920 930 940 950 960 pF1KSD EEAEDKKKVPTPEKEAPAKVEVKEDAKPKEKTEVAKKEPDDAKAKEPSKPAEKKEAAPEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EEAEDKKKVPTPEKEAPAKVEVKEDAKPKEKTEVAKKEPDDAKAKEPSKPAEKKEAAPEK 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KSD KDTKEEKAKKPEEKPKTEAKAKEDDKTLSKEPSKPKAEKAEKSSSTDQKDSKPPEKATED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KDTKEEKAKKPEEKPKTEAKAKEDDKTLSKEPSKPKAEKAEKSSSTDQKDSKPPEKATED 960 970 980 990 1000 1010 pF1KSD KAAKGK :::::: CCDS13 KAAKGK 1020 >>CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 (916 aa) initn: 1017 init1: 803 opt: 1699 Z-score: 637.2 bits: 129.3 E(32554): 3.6e-29 Smith-Waterman score: 1800; 41.8% identity (65.3% similar) in 979 aa overlap (37-983:25-911) 10 20 30 40 50 60 pF1KSD ADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGF--HSWTRTSVSSVSASPSR .: ... :::: .::.: : :.::.: .: CCDS60 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSPSSGFRSQSWSRGSPSTVSSSYKR 10 20 30 40 50 70 80 90 100 110 pF1KSD --------FRGAGAASSTDSLD-----TLSNGPEGCMVAVATSRS-EKEQLQALNDRFAG . .: .:. .::: .: :: : ::: ::::::.::::::: CCDS60 SMLAPRLAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD YIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLE ::.::. :: .:. .:.: ::::.::... .:. :..:.::.:... .. ..:..:. CCDS60 YIEKVHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD QEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYL ..:: ::: ....:...::: :...::: ::: . .:: ..:.:.::.:.::.: ..: CCDS60 SDHLEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD RRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSE : .:.:::..::.:::.: .. .: .: :: :...::.:::.:::.:. :. :.: CCDS60 RSNHEEEVADLLAQIQAS-----HITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAE 240 250 260 270 280 300 310 320 330 340 350 pF1KSD EWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELE :::. : .:.:::. : .:.:::.:::.:::::::... :::....::.::::: :..: CCDS60 EWFKCRYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIE 290 300 310 320 330 340 360 370 380 390 400 410 pF1KSD DRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEE .::. :..:::..::::. :::.:::::: .::::::::::::::::::::::::::::: CCDS60 ERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEE 350 360 370 380 390 400 420 430 440 450 460 pF1KSD CRIGF--GPIPFSLPEGLPKIPSVSTHI-KVKSEE-KIKVVEKSEKETVIVEEQTEETQV :.. : : : : : ..:..: : : : :.:: .: .::: :::.: CCDS60 TRFSTFAGSITGPLYTHRPPI-TISSKIQKPKVEAPKLKVQHK------FVEEIIEETKV 410 420 430 440 450 460 470 480 490 500 510 520 pF1KSD TEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKS .: .: :: . : . . .::. :..::. . : ::: : ::::: : CCDS60 EDEKSEMEEALTAITE-ELAVSMKEEKKEAAEEKEEEPEAEEEEVAAK--KSPVKATAPE 470 480 490 500 510 530 540 550 560 570 580 pF1KSD PAEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKS : .. ..:: . : . : ::: ::. : :..: ::::.. CCDS60 VKEEEGEKEEEEGQEEEEEEDEGAKSDQAEEGGSEKEGSS-EKEEGE------------- 520 530 540 550 560 590 600 610 620 630 640 pF1KSD PAKEEAKSPAEAKSPEKAKSPVKEEAKSPAEAKSPVKEEAKSPAEVKSPEKAKSPTKEEA .::... :::.. : :::: :: : .: :: : : :::: CCDS60 --QEEGETEAEAEGEE-------------AEAK----EEKK--VEEKSEEVA---TKEEL 570 580 590 600 650 660 670 680 690 700 pF1KSD KSPEKAKSPEKAKSPEKEEAKSPEKAKSPVKAEAKSPEKAKSPVKAEAKSPEKAKSPVKE . :...::::::: : ::::. ..::: ::::. ..::: ::::.: CCDS60 VADAKVEKPEKAKSP------VP---KSPVEEKGKSPVP-KSPVEEKGKSPVP-KSPVEE 610 620 630 640 650 710 720 730 740 750 760 pF1KSD EAKSPEKAKSPVKEEAKSPEKAKSPVKEEAKTPEKAKSPVKEEAKSPEKAKSPEKAKTLD ..::: ::::.:..::: .::::.:.::.: :::: ::::: .. . :. . CCDS60 KGKSPVP-KSPVEEKGKSPV-SKSPVEEKAKSPVP-KSPV-EEAKSKAEVGKGEQKEE-- 660 670 680 690 700 770 780 790 800 810 820 pF1KSD VKSPEAKTPAKEEARSPADKFPEKAKSPVKEEVKSPEKAKSPLKEDAKAPEKEIPK--KE . :.: ::: : .: ..: ..: .::.::.::.: : : : : CCDS60 -EEKEVKEAPKEE------KVEKKEEKP--KDVPEKKKAESPVKEEAVAEVVTITKSVKV 710 720 730 740 750 830 840 850 860 870 880 pF1KSD EVKSPVKEEEKPQEVKVKEPPKKAEEEKAPATPKTEEKKDSKKEEAPKKE--APKPKVEE .... .::: :: . .. :.::: . .::. ..: .. .:: : . .:: CCDS60 HLEKETKEEGKPLQ-------QEKEKEKAGGEGGSEEEGSDKGAKGSRKEDIAVNGEVEG 760 770 780 790 800 890 900 910 920 930 pF1KSD KKEPAVEKPKESKVEAKKEEAEDKKKVPTPEKEAPAKVEVKEDAKPKEKTEVAK------ :.: ::. . : ...:: : : . .:: : : : .::. :.: CCDS60 KEE--VEQETKEKGSGREEE---KGVVTNGLDLSPAD-EKKGGDKSEEKVVVTKTVEKIT 810 820 830 840 850 860 940 950 960 970 980 990 pF1KSD KEPDDAKAKEPSKPAEKKEAAPEKKDTKEEK--AKKPEEKPKTEAKAKEDDKTLSKEPSK .: :. .: .: . . . :...: ::: . : :: ..: .:: CCDS60 SEGGDGATKYITKSVTVTQKVEEHEETFEEKLVSTKKVEKVTSHAIVKEVTQSD 870 880 890 900 910 1000 1010 1020 pF1KSD PKAEKAEKSSSTDQKDSKPPEKATEDKAAKGK >>CCDS7545.1 INA gene_id:9118|Hs108|chr10 (499 aa) initn: 737 init1: 592 opt: 1120 Z-score: 432.7 bits: 90.6 E(32554): 8.8e-18 Smith-Waterman score: 1130; 44.5% identity (70.9% similar) in 501 aa overlap (2-482:1-485) 10 20 30 40 50 pF1KSD MMSFGGADALLGAP-FAPLHGGGS-LHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSV ::::. : .. . . : :: : :. ::::: :: .: .:..:.: CCDS75 MSFGSEHYLCSSSSYRKVFGDGSRLSARLSGAGGAGGFRS--------QSLSRSNVASS 10 20 30 40 50 60 70 80 90 100 110 pF1KSD SA-SPSRFRGAGAA----SSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYID .: : . : : : ..:.:: ::.. .::::::.:::::: .:. CCDS75 AACSSASSLGLGLAYRRPPASDGLD-LSQAAARTNEYKIIRTNEKEQLQGLNDRFAVFIE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD KVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEH ::.:::..::.::.: :::::..: : .:::..::.:..:. . . ..::.: ::.. CCDS75 KVHQLETQNRALEAELAALRQRHAEPSRVGELFQRELRDLRAQLEEASSARSQALLERDG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD LLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRH : :.. ..: : ..:.: :: :: : .: : .. : ::.::.::...: .: ...:. CCDS75 LAEEVQRLRARCEEESRGREGAERALKAQQRDVDGATLARLDLEKKVESLLDELAFVRQV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD HQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWF :.:::.:::. .:.:. : :.... . : :.:::::::::: :. :... ..:::. CCDS75 HDEEVAELLATLQASSQAAAEVDVTVA---KPDLTSALREIRAQYESLAAKNLQSAEEWY 240 250 260 270 280 300 310 320 330 340 350 pF1KSD RVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRH . .. :.: : .:.:.:...::: :::::::::: :.:.:.....::::: :::.:: CCDS75 KSKFANLNEQAARSTEAIRASREEIHEYRRQLQARTIEIEGLRGANESLERQILELEERH 290 300 310 320 330 340 360 370 380 390 400 410 pF1KSD QADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRI .:..:.::..: ::. .::::: ::: .::::::::::::::::::::::::::::: :. CCDS75 SAEVAGYQDSIGQLENDLRNTKSEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRF 350 360 370 380 390 400 420 430 440 450 460 pF1KSD --------GFGPIP---FSLPEGLPKIPSVSTHIKVKSEE-KIKVVEKSEKETVIVEEQT :..:.: . :: :.: :..: ::.: ..: :. :. . .. ..: CCDS75 STSGLSISGLNPLPNPSYLLP---PRILSATTS-KVSSTGLSLKKEEEEEEASKVASKKT 410 420 430 440 450 460 470 480 490 500 510 520 pF1KSD EET-QVTEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPV . . ::. :: .:. : CCDS75 SQIGESFEEILEETVISTKKTEKSNIEETTISSQKI 470 480 490 >>CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 (543 aa) initn: 915 init1: 583 opt: 1015 Z-score: 394.3 bits: 83.6 E(32554): 1.2e-15 Smith-Waterman score: 1015; 39.3% identity (67.9% similar) in 521 aa overlap (45-557:31-536) 20 30 40 50 60 70 pF1KSD FAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSVSASPSR---FRGAGAA ::. : .:.. :: :: : : . .. CCDS75 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGY-STARSAYSSYSAPVSSSLSVRRSYSS 10 20 30 40 50 80 90 100 110 120 pF1KSD SSTDSLDTLSNGPEGCMVAVATS----RS-EKEQLQALNDRFAGYIDKVRQLEAHNRSLE :: . . .: : . ..:.... :. :: ::: ::::::..:..:..:: .:. :: CCDS75 SSGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIERVHELEQQNKVLE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD GEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVRQRLD .: .:::... : . :::.:.:..: :. . :. :.: : : . ... : . CCDS75 AELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGLEETLRNLQARYE 120 130 140 150 160 170 190 200 210 220 230 240 pF1KSD DEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELLGQIQ .:. .::.::. . :.:: ::..:.:. ..:..: ..:.. :.::..:: .::: CCDS75 EEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVHEEEIAELQAQIQ 180 190 200 210 220 230 250 260 270 280 290 300 pF1KSD GSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSEAAKV ::...: :. : :...::..:::: : :... ..::::. :. :.:.: CCDS75 -----YAQISVEM-DVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVLTESAAK 240 250 260 270 280 290 310 320 330 340 350 360 pF1KSD NTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQEAIQQ ::::.:.:..:..: :: :.:.: :.:: .. ...::.: .::::...:::...:..:.. CCDS75 NTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAMQDTINK 300 310 320 330 340 350 370 380 390 400 410 420 pF1KSD LDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSLPEGL :. :::.:: ::: :.::::::::::::::::::::::::::: :..: . :. : CCDS75 LENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVG-SITSGY 360 370 380 390 400 410 430 440 450 460 470 480 pF1KSD PKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKEEEGKEE . .: . . . . . .... ...: :. :: :: . :: ::.:.: CCDS75 SQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQI--EV-EETIEAAKAEEAKDE 420 430 440 450 460 490 500 510 520 530 540 pF1KSD EGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEAKSPAEVKS .: : : ::. : :: :. :.:: . .:::: : .. : ::.. :.. CCDS75 PPSEGEAEE--EEKDKEEAEEEEAAEEEEAAKEESEEAKE--EEEGGEGEEGEETKEAEE 470 480 490 500 510 520 550 560 570 580 590 600 pF1KSD PEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPAEAKSPEKAKS :: : :: CCDS75 EEKKVEGAGEEQAAKKKD 530 540 >>CCDS7120.1 VIM gene_id:7431|Hs108|chr10 (466 aa) initn: 849 init1: 539 opt: 964 Z-score: 376.9 bits: 80.2 E(32554): 1.1e-14 Smith-Waterman score: 973; 41.1% identity (72.3% similar) in 455 aa overlap (10-455:14-455) 10 20 30 40 50 pF1KSD MMSFGGADALLGAPFAPLHGGGSLHYAL-ARKGGAGGTRSAAGSSSGFHSWTRTSV ..:.: . . ..: :. . . . :. ..: .... . .: CCDS71 MSTRSVSSSSYRRMFGGPGTASRPSSSRSYVTTSTRTYSLGSALRPSTSRSLYASSPGGV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD SSVSASPSRFRGA--GAASSTDSLD-TLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYI .. .: :.:.. :. ::.: .:... . . : .:: .:: ::::::.:: CCDS71 YATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKN--TRTNEKVELQELNDRFANYI 70 80 90 100 110 120 130 140 150 160 170 pF1KSD DKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQE :::: :: .:. : .: :. : :.: .:.:::.:.::.: : .: ......:.. CCDS71 DKVRFLEQQNKILLAELEQLKGQ--GKSRLGDLYEEEMRELRRQVDQLTNDKARVEVERD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD HLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRR .: ::: ..:..:..: :::::: . ... . ...: ::.::..:...:::: ..:.. CCDS71 NLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLKK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD HHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEW :.::. :: .::: . ..: .. :. : :.:.:::..: : :. :... ..::: CCDS71 LHEEEIQELQAQIQ-----EQHVQIDV-DVSKPDLTAALRDVRQQYESVAAKNLQEAEEW 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD FRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDR .. .. :::::. :.::.:.:..: ::::::.:. : :..:::.:..::::: :.:. CCDS71 YKSKFADLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEEN 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD HQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECR .. :.::..: .:. :..: : ::: .:::::::::::::::::::.::::::::: : CCDS71 FAVEAANYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESR 360 370 380 390 400 410 420 430 440 450 460 pF1KSD IGFGPIP-FS---LPE-GLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVT :.. :.: :: : : .: ..: :.:: : ::.:: . ... CCDS71 ISL-PLPNFSSLNLRETNLDSLPLVDTH--SKRTLLIKTVETRDGQVINETSQHHDDLE 420 430 440 450 460 470 480 490 500 510 520 pF1KSD EEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSP >>CCDS33383.1 DES gene_id:1674|Hs108|chr2 (470 aa) initn: 959 init1: 520 opt: 938 Z-score: 367.5 bits: 78.5 E(32554): 3.8e-14 Smith-Waterman score: 953; 39.2% identity (69.4% similar) in 477 aa overlap (3-470:17-469) 10 20 30 40 pF1KSD MMSFGGADAL-LGAPFA----PLHGGGSLHYALARKGGAGGTRSAA .:::: .. ::.:.. : : :: . . . . . .. CCDS33 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KSD GSSSGFHSWTRTSVSSVSASPSRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQL :...:. : :.: ... .:: . ::: . . :.... ..: .:: .: CCDS33 GGAGGLGS-LRASRLGTTRTPSSY-GAGELLDFSLADAVNQE------FLTTRTNEKVEL 70 80 90 100 110 110 120 130 140 150 160 pF1KSD QALNDRFAGYIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLG : ::::::.::.::: :: .: .: .:. :. .. : : ::::.:.::.: : : CCDS33 QELNDRFANYIEKVRFLEQQNAALAAEVNRLKGREPTRVA--ELYEEELRELRRQVEVLT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KSD AARGQLRLEQEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQ :... .:...::.:. ... .:..: . .:::: :. .. : ::.::... . CCDS33 NQRARVDVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIE 180 190 200 210 220 230 230 240 250 260 270 280 pF1KSD ALQEECGYLRRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGH .:.:: ..:.. :.::. :: .:.: . :.:.: : : :.:.:::.:::: : CCDS33 SLNEEIAFLKKVHEEEIRELQAQLQ-----EQQVQVEM-DMSKPDLTAALRDIRAQYETI 240 250 260 270 280 290 300 310 320 330 340 pF1KSD AVQSTLQSEEWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDS :... ..:::.. ... :..::. :.::.:.:..:. :::.:.:. : :..:::.:.:: CCDS33 AAKNISEAEEWYKSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDS 290 300 310 320 330 340 350 360 370 380 390 400 pF1KSD LERQRSELEDRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAA : :: ::::: .. ..::. : .:. :.:. : ::: .:::::::::::::::.:::. CCDS33 LMRQMRELEDRFASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIAT 350 360 370 380 390 400 410 420 430 440 450 pF1KSD YRKLLEGEECRIGFGPIP----FSLPEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIV ::::::::: ::.. :: ... : :. . ......:. ::..: . :.: CCDS33 YRKLLEGEESRINL-PIQTYSALNFRETSPE--QRGSEVHTKKTVMIKTIETRDGEVV-- 410 420 430 440 450 460 470 480 490 500 510 pF1KSD EEQTEETQVTEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAK .: :: .:: CCDS33 ---SEATQQQHEVL 460 470 >>CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 (432 aa) initn: 831 init1: 513 opt: 881 Z-score: 347.5 bits: 74.6 E(32554): 4.9e-13 Smith-Waterman score: 881; 43.7% identity (71.7% similar) in 375 aa overlap (93-463:65-427) 70 80 90 100 110 120 pF1KSD SRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEAHN : ::. ... ::::::.::.::: :: .: CCDS11 TRLSLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQN 40 50 60 70 80 90 130 140 150 160 170 180 pF1KSD RSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVR ..: .: :: .. . ....:. :.::.: . .: : ..:..:...: .:.: :: CCDS11 KALAAELNQLRAKEPTK--LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVR 100 110 120 130 140 150 190 200 210 220 230 240 pF1KSD QRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELL :.:.::. : ::: : . :.:: ::.::..: ..:.:: .::. :.::: :: CCDS11 QKLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQ 160 170 180 190 200 210 250 260 270 280 290 300 pF1KSD GQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSE :. :. :...: :. : :.:.::.:::.: :. : .. ..:::.: .. :.. CCDS11 EQL-----ARQQVHVEL-DVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTD 220 230 240 250 260 310 320 330 340 350 360 pF1KSD AAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQE :: :.. .:.:..: ..::::::. : .::.:..:..::::: : :.:: . ::::: CCDS11 AAARNAELLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQE 270 280 290 300 310 320 370 380 390 400 410 420 pF1KSD AIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSL :. .:. : .. : ::: .:.:::::::::.:::::::.::::::::: :: :: . CCDS11 ALARLEEEGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRI---TIPVQT 330 340 350 360 370 380 430 440 450 460 470 pF1KSD PEGLPKIPSVSTHIKVKSEEKIK---VVEKSE-KETVIVEEQTEETQVTEEVTEEEEKEA .: .: .: : :: ..: ::. : .. ...:. .: CCDS11 FSNL-QIRETSLDTKSVSEGHLKRNIVVKTVEMRDGEVIKESKQEHKDVM 390 400 410 420 430 480 490 500 510 520 530 pF1KSD KEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAKSPAEAKSPEKEEA >>CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 (431 aa) initn: 831 init1: 513 opt: 869 Z-score: 343.2 bits: 73.8 E(32554): 8.5e-13 Smith-Waterman score: 869; 46.2% identity (74.2% similar) in 329 aa overlap (93-421:65-385) 70 80 90 100 110 120 pF1KSD SRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEAHN : ::. ... ::::::.::.::: :: .: CCDS45 TRLSLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQN 40 50 60 70 80 90 130 140 150 160 170 180 pF1KSD RSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVR ..: .: :: .. . ....:. :.::.: . .: : ..:..:...: .:.: :: CCDS45 KALAAELNQLRAKEPTK--LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVR 100 110 120 130 140 150 190 200 210 220 230 240 pF1KSD QRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELL :.:.::. : ::: : . :.:: ::.::..: ..:.:: .::. :.::: :: CCDS45 QKLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQ 160 170 180 190 200 210 250 260 270 280 290 300 pF1KSD GQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSE :. :. :...: :. : :.:.::.:::.: :. : .. ..:::.: .. :.. CCDS45 EQL-----ARQQVHVEL-DVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTD 220 230 240 250 260 310 320 330 340 350 360 pF1KSD AAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQE :: :.. .:.:..: ..::::::. : .::.:..:..::::: : :.:: . ::::: CCDS45 AAARNAELLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQE 270 280 290 300 310 320 370 380 390 400 410 420 pF1KSD AIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSL :. .:. : .. : ::: .:.:::::::::.:::::::.::::::::: :: . :: CCDS45 ALARLEEEGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSN 330 340 350 360 370 380 430 440 450 460 470 480 pF1KSD PEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKEEE CCDS45 LQIRGGKSTKDGENHKVTRYLKSLTIRVIPIQAHQIVNGTPPARG 390 400 410 420 430 >>CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 (438 aa) initn: 831 init1: 513 opt: 869 Z-score: 343.1 bits: 73.8 E(32554): 8.6e-13 Smith-Waterman score: 869; 46.2% identity (74.2% similar) in 329 aa overlap (93-421:65-385) 70 80 90 100 110 120 pF1KSD SRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAGYIDKVRQLEAHN : ::. ... ::::::.::.::: :: .: CCDS59 TRLSLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQN 40 50 60 70 80 90 130 140 150 160 170 180 pF1KSD RSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLEQEHLLEDIAHVR ..: .: :: .. . ....:. :.::.: . .: : ..:..:...: .:.: :: CCDS59 KALAAELNQLRAKEPTK--LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVR 100 110 120 130 140 150 190 200 210 220 230 240 pF1KSD QRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYLRRHHQEEVGELL :.:.::. : ::: : . :.:: ::.::..: ..:.:: .::. :.::: :: CCDS59 QKLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQ 160 170 180 190 200 210 250 260 270 280 290 300 pF1KSD GQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSEEWFRVRLDRLSE :. :. :...: :. : :.:.::.:::.: :. : .. ..:::.: .. :.. CCDS59 EQL-----ARQQVHVEL-DVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTD 220 230 240 250 260 310 320 330 340 350 360 pF1KSD AAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELEDRHQADIASYQE :: :.. .:.:..: ..::::::. : .::.:..:..::::: : :.:: . ::::: CCDS59 AAARNAELLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQE 270 280 290 300 310 320 370 380 390 400 410 420 pF1KSD AIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEECRIGFGPIPFSL :. .:. : .. : ::: .:.:::::::::.:::::::.::::::::: :: . :: CCDS59 ALARLEEEGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSN 330 340 350 360 370 380 430 440 450 460 470 480 pF1KSD PEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQVTEEVTEEEEKEAKEEE CCDS59 LQIRGQYSRASWEGHWSPAPSSRACRLLQTGTEDQGKGIQLSLGAFVTLQRS 390 400 410 420 430 >>CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 (470 aa) initn: 816 init1: 490 opt: 863 Z-score: 340.5 bits: 73.5 E(32554): 1.2e-12 Smith-Waterman score: 863; 38.6% identity (68.3% similar) in 448 aa overlap (35-463:22-458) 10 20 30 40 50 60 pF1KSD GGADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGFHSWTRTSVSSV--SASP : : . .. .. : .: : : . :::: CCDS87 MSHHPSGLRAGFSSTSYRRTFGPPPSLSPGAFSYSSSSRFSSSRLLGSASP 10 20 30 40 50 70 80 90 100 110 pF1KSD SR------FR----GAGAASSTDS--LDTLSNGPEGCMVAVATSRSEKEQLQALNDRFAG : :: :::: : :: .: . . .:: .::..:: ::::::. CCDS87 SSSVRLGSFRSPRAGAGALLRLPSERLD-FSMAEALNQEFLATRSNEKQELQELNDRFAN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD YIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLE .:.::: :: .: .:.:: . : :. .:. .: ..:.::.: . :: : ....: CCDS87 FIEKVRFLEQQNAALRGELSQARGQEPARA--DQLCQQELRELRRELELLGRERDRVQVE 120 130 140 150 160 180 190 200 210 220 230 pF1KSD QEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYL .. : ::.: ..:::..:.:.::.:: . . ...: .:..:..: ..:..: .: CCDS87 RDGLAEDLAALKQRLEEETRKREDAEHNLVLFRKDVDDATLSRLELERKIESLMDEIEFL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD RRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSE .. :.::. .: : : .: .:.:.. ..: ..:.:::.:::: :. :... ..: CCDS87 KKLHEEELRDL----QVSVESQQVQQVEVEATVKPELTAALRDIRAQYESIAAKNLQEAE 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD EWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELE ::.. . ::.::. : .:.:.:..:..: :::.:. : :...:..:...: :: ::: CCDS87 EWYKSKYADLSDAANRNHEALRQAKQEMNESRRQIQSLTCEVDGLRGTNEALLRQLRELE 290 300 310 320 330 340 360 370 380 390 400 410 pF1KSD DRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEE .. . ..:: . .:. :::. : ::: .:::::.:::::::::::::.::::::::: CCDS87 EQFALEAGGYQAGAARLEEELRQLKEEMARHLREYQELLNVKMALDIEIATYRKLLEGEE 350 360 370 380 390 400 420 430 440 450 460 pF1KSD CRIGFGPI----PFSLPEGLPKI-PSVSTHIKVKSEEKIKVVEKSEKETVIVEEQTEETQ ::. :. ... .:.. : ..: .. ::..: . : :..: : :. CCDS87 SRISV-PVHSFASLNIKTTVPEVEPPQDSH--SRKTVLIKTIETRNGE-VVTESQKEQRS 410 420 430 440 450 460 470 480 490 500 510 520 pF1KSD VTEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAK CCDS87 ELDKSSAHSY 470 1026 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 03:42:43 2016 done: Thu Nov 3 03:42:44 2016 Total Scan time: 5.430 Total Display time: 0.150 Function used was FASTA [36.3.4 Apr, 2011]