FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8481, 916 aa 1>>>pF1KB8481 916 - 916 aa - 916 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 15.7439+/-0.00151; mu= -25.9268+/- 0.092 mean_var=653.7012+/-132.614, 0's: 0 Z-trim(111.9): 129 B-trim: 0 in 0/55 Lambda= 0.050163 statistics sampled from 12638 (12752) to 12638 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.675), E-opt: 0.2 (0.392), width: 16 Scan time: 5.570 The best scores are: opt bits E(32554) CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 5713 429.4 1.5e-119 CCDS47831.1 NEFM gene_id:4741|Hs108|chr8 ( 540) 3338 257.4 5.3e-68 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 1709 139.7 2.7e-32 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 1365 114.6 4.8e-25 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 1316 111.0 6e-24 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 1142 98.4 3.3e-20 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 1074 93.5 1e-18 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 1060 92.5 2e-18 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 1024 89.8 1.2e-17 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 1019 89.5 1.5e-17 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 1019 89.5 1.5e-17 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 760 70.8 7.4e-12 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 753 70.3 1e-11 >>CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 (916 aa) initn: 5713 init1: 5713 opt: 5713 Z-score: 2259.9 bits: 429.4 E(32554): 1.5e-119 Smith-Waterman score: 5713; 99.9% identity (99.9% similar) in 916 aa overlap (1-916:1-916) 10 20 30 40 50 60 pF1KB8 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSPSSGFRSQSWSRGSPSTVSSSYKRSMLAPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSPSSGFRSQSWSRGSPSTVSSSYKRSMLAPR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 LAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAGYIEKVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 LAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAGYIEKVH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 YLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLDSDHLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 YLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLDSDHLEE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 DIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFLRSNHEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 DIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFLRSNHEE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 EVADLLAQIQASHITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAEEWFKCRYAKLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EVADLLAQIQASHITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAEEWFKCRYAKLT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 EAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIEERHNHDLSSYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIEERHNHDLSSYQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 DTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFSTFAGSIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 DTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFSTFAGSIT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 GPLYTHRPPITISSKIQKTKVEAPKLKVQHKFVEEIIEETKVEDEKSEMEEALTAITEEL :::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::: CCDS60 GPLYTHRPPITISSKIQKPKVEAPKLKVQHKFVEEIIEETKVEDEKSEMEEALTAITEEL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 AVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGEKEEEEGQEEEEEED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 AVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGEKEEEEGQEEEEEED 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 EGAKSDQAEEGGSEKEGSSEKEEGEQEEGETEAEAEGEEAEAKEEKKVEEKSEEVATKEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EGAKSDQAEEGGSEKEGSSEKEEGEQEEGETEAEAEGEEAEAKEEKKVEEKSEEVATKEE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 LVADAKVEKPEKAKSPVPKSPVEEKGKSPVPKSPVEEKGKSPVPKSPVEEKGKSPVPKSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 LVADAKVEKPEKAKSPVPKSPVEEKGKSPVPKSPVEEKGKSPVPKSPVEEKGKSPVPKSP 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 VEEKGKSPVSKSPVEEKAKSPVPKSPVEEAKSKAEVGKGEQKEEEEKEVKEAPKEEKVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 VEEKGKSPVSKSPVEEKAKSPVPKSPVEEAKSKAEVGKGEQKEEEEKEVKEAPKEEKVEK 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 KEEKPKDVPEKKKAESPVKEEAVAEVVTITKSVKVHLEKETKEEGKPLQQEKEKEKAGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 KEEKPKDVPEKKKAESPVKEEAVAEVVTITKSVKVHLEKETKEEGKPLQQEKEKEKAGGE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB8 GGSEEEGSDKGAKGSRKEDIAVNGEVEGKEEVEQETKEKGSGREEEKGVVTNGLDLSPAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 GGSEEEGSDKGAKGSRKEDIAVNGEVEGKEEVEQETKEKGSGREEEKGVVTNGLDLSPAD 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB8 EKKGGDKSEEKVVVTKTVEKITSEGGDGATKYITKSVTVTQKVEEHEETFEEKLVSTKKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EKKGGDKSEEKVVVTKTVEKITSEGGDGATKYITKSVTVTQKVEEHEETFEEKLVSTKKV 850 860 870 880 890 900 910 pF1KB8 EKVTSHAIVKEVTQSD :::::::::::::::: CCDS60 EKVTSHAIVKEVTQSD 910 >>CCDS47831.1 NEFM gene_id:4741|Hs108|chr8 (540 aa) initn: 3338 init1: 3338 opt: 3338 Z-score: 1334.3 bits: 257.4 E(32554): 5.3e-68 Smith-Waterman score: 3338; 99.8% identity (99.8% similar) in 540 aa overlap (377-916:1-540) 350 360 370 380 390 400 pF1KB8 DIEERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLE :::::::::::::::::::::::::::::: CCDS47 MARHLREYQDLLNVKMALDIEIAAYRKLLE 10 20 30 410 420 430 440 450 460 pF1KB8 GEETRFSTFAGSITGPLYTHRPPITISSKIQKTKVEAPKLKVQHKFVEEIIEETKVEDEK :::::::::::::::::::::::::::::::: ::::::::::::::::::::::::::: CCDS47 GEETRFSTFAGSITGPLYTHRPPITISSKIQKPKVEAPKLKVQHKFVEEIIEETKVEDEK 40 50 60 70 80 90 470 480 490 500 510 520 pF1KB8 SEMEEALTAITEELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SEMEEALTAITEELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGE 100 110 120 130 140 150 530 540 550 560 570 580 pF1KB8 KEEEEGQEEEEEEDEGAKSDQAEEGGSEKEGSSEKEEGEQEEGETEAEAEGEEAEAKEEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KEEEEGQEEEEEEDEGAKSDQAEEGGSEKEGSSEKEEGEQEEGETEAEAEGEEAEAKEEK 160 170 180 190 200 210 590 600 610 620 630 640 pF1KB8 KVEEKSEEVATKEELVADAKVEKPEKAKSPVPKSPVEEKGKSPVPKSPVEEKGKSPVPKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KVEEKSEEVATKEELVADAKVEKPEKAKSPVPKSPVEEKGKSPVPKSPVEEKGKSPVPKS 220 230 240 250 260 270 650 660 670 680 690 700 pF1KB8 PVEEKGKSPVPKSPVEEKGKSPVSKSPVEEKAKSPVPKSPVEEAKSKAEVGKGEQKEEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PVEEKGKSPVPKSPVEEKGKSPVSKSPVEEKAKSPVPKSPVEEAKSKAEVGKGEQKEEEE 280 290 300 310 320 330 710 720 730 740 750 760 pF1KB8 KEVKEAPKEEKVEKKEEKPKDVPEKKKAESPVKEEAVAEVVTITKSVKVHLEKETKEEGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KEVKEAPKEEKVEKKEEKPKDVPEKKKAESPVKEEAVAEVVTITKSVKVHLEKETKEEGK 340 350 360 370 380 390 770 780 790 800 810 820 pF1KB8 PLQQEKEKEKAGGEGGSEEEGSDKGAKGSRKEDIAVNGEVEGKEEVEQETKEKGSGREEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PLQQEKEKEKAGGEGGSEEEGSDKGAKGSRKEDIAVNGEVEGKEEVEQETKEKGSGREEE 400 410 420 430 440 450 830 840 850 860 870 880 pF1KB8 KGVVTNGLDLSPADEKKGGDKSEEKVVVTKTVEKITSEGGDGATKYITKSVTVTQKVEEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KGVVTNGLDLSPADEKKGGDKSEEKVVVTKTVEKITSEGGDGATKYITKSVTVTQKVEEH 460 470 480 490 500 510 890 900 910 pF1KB8 EETFEEKLVSTKKVEKVTSHAIVKEVTQSD :::::::::::::::::::::::::::::: CCDS47 EETFEEKLVSTKKVEKVTSHAIVKEVTQSD 520 530 540 >>CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020 aa) initn: 799 init1: 799 opt: 1709 Z-score: 693.2 bits: 139.7 E(32554): 2.7e-32 Smith-Waterman score: 1779; 42.7% identity (66.4% similar) in 920 aa overlap (25-856:37-930) 10 20 30 40 50 pF1KB8 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSPSSGFRSQSWSRGSPSTVSSSYKR .: ... :::: .::.: : :.::.: .: CCDS13 ADALLGAPFAPLHGGGSLHYALARKGGAGGTRSAAGSSSGF--HSWTRTSVSSVSASPSR 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB8 SMLAPRLAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAG . .: .:. .::: .: :: : ::: ::::::.::::::: CCDS13 --------FRGAGAASSTDSLD-----TLSNGPEGCMVAVATSRS-EKEQLQALNDRFAG 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 YIEKVHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLD ::.::. :: .:. .:.: ::::.::... .:. :..:.::.:... .. ..:..:. CCDS13 YIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLGAARGQLRLE 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 SDHLEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFL ..:: ::: ....:...::: :...::: ::: . .:: ..:.:.::.:.::.: ..: CCDS13 QEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQALQEECGYL 180 190 200 210 220 230 240 250 260 270 280 pF1KB8 RSNHEEEVADLLAQIQAS-----HITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAE : .:.:::..::.:::.: .. .: .: :: :...::.:::.:::.:. :. :.: CCDS13 RRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGHAVQSTLQSE 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 EWFKCRYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIE :::. : .:.:::. : .:.:::.:::.:::::::... :::....::.::::: :..: CCDS13 EWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDSLERQRSELE 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 ERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEE .::. :..:::..::::. :::.:::::: .::::::::::::::::::::::::::::: CCDS13 DRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAAYRKLLEGEE 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB8 TRFSTFAGSITGPLYTHRPPI-TISSKIQKTKVEAPKLKVQHK------FVEEIIEETKV :.. : : : : : ..:..: :.: : :.:: .: .::: :::.: CCDS13 CRIGF--GPIPFSLPEGLPKIPSVSTHI-KVKSEE-KIKVVEKSEKETVIVEEQTEETQV 420 430 440 450 460 470 480 490 500 510 pF1KB8 EDEKSEMEEALTAITEE--LAVSMKEEKKEAAEEKEEEPEAEEEEVAAK--KSPVKATAP .: .: :: : :: . .::. :..::. . : ::: : ::::: : CCDS13 TEEVTEEEEK-EAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAKSPVKEEAK 470 480 490 500 510 520 520 530 540 550 560 pF1KB8 EVKEEEGEKEEEEGQEEEEEEDEGAKSDQAEEGGSEKEGSS-EKEEGE------------ : .. ..:: . : . : ::: ::. : :..: ::::.. CCDS13 SPAEAKSPEKEEAKSPAEVKSPEKAKSPAKEEAKSPPEAKSPEKEEAKSPAEVKSPEKAK 530 540 550 560 570 580 570 580 590 600 610 pF1KB8 ---QEEGETEAEAEGEEAEAKEEKKVEEKSEEVA---TKEELVADAKVEKPEKAKSPV-- .::... :::.. : .:: : : :: : .::: . :.:..:::::::. CCDS13 SPAKEEAKSPAEAKSPE-KAKSPVKEEAKSPAEAKSPVKEEAKSPAEVKSPEKAKSPTKE 590 600 610 620 630 640 620 630 640 650 pF1KB8 ----P---KSPVEEKGKSPVP-KSPVE------EKGKSPV------P---KSPVEEKGKS : ::: .:..::: ::::. ::.:::: : ::::.:..:: CCDS13 EAKSPEKAKSPEKEEAKSPEKAKSPVKAEAKSPEKAKSPVKAEAKSPEKAKSPVKEEAKS 650 660 670 680 690 700 660 670 680 690 700 pF1KB8 PVP-KSPVEEKGKSPV-SKSPVEEKAKSPVP-KSPVEEAKSKAEVGKGEQKEE----EEK : ::::.:..::: .::::.:.::.: ::::.: .. : .:. .: . . CCDS13 PEKAKSPVKEEAKSPEKAKSPVKEEAKTPEKAKSPVKEEAKSPEKAKSPEKAKTLDVKSP 710 720 730 740 750 760 710 720 730 740 750 pF1KB8 EVKEAPKEE------KVEKKEEKP--KDVPEKKKAESPVKEEAVAEVVTITKSVKVHLEK :.: ::: : .: ..: ..: .::.::.::.: : : : : .... CCDS13 EAKTPAKEEARSPADKFPEKAKSPVKEEVKSPEKAKSPLKEDAKAPEKEIPK--KEEVKS 770 780 790 800 810 820 760 770 780 790 800 810 pF1KB8 ETKEEGKPLQ-------QEKEKEKAGGEGGSEEEGSDKGAKGSRKEDIAVNGEVEGKEE- .::: :: . .. :.::: . .::. ..: .. .:: : . .:: :.: CCDS13 PVKEEEKPQEVKVKEPPKKAEEEKAPATPKTEEKKDSKKEEAPKKE--APKPKVEEKKEP 830 840 850 860 870 880 820 830 840 850 860 pF1KB8 -VEQETKEKGSGREEE---KGVVTNGLDLSPAD-EKKGGDKSEEKVVVTKTVEKITSEGG ::. . : ...:: : : . .:: : : : .::. :.: CCDS13 AVEKPKESKVEAKKEEAEDKKKVPTPEKEAPAKVEVKEDAKPKEKTEVAKKEPDDAKAKE 890 900 910 920 930 940 870 880 890 900 910 pF1KB8 DGATKYITKSVTVTQKVEEHEETFEEKLVSTKKVEKVTSHAIVKEVTQSD CCDS13 PSKPAEKKEAAPEKKDTKEEKAKKPEEKPKTEAKAKEDDKTLSKEPSKPKAEKAEKSSST 950 960 970 980 990 1000 >>CCDS7545.1 INA gene_id:9118|Hs108|chr10 (499 aa) initn: 1358 init1: 676 opt: 1365 Z-score: 563.1 bits: 114.6 E(32554): 4.8e-25 Smith-Waterman score: 1365; 48.3% identity (75.9% similar) in 497 aa overlap (8-494:9-491) 10 20 30 40 50 pF1KB8 MSYTLDSLGNPSAYRRVTETRSSFS-RVSGSPSSG-FRSQSWSRGSPSTVSSSYKRSML : . :.::.: : .: :.::. ..: ::::: ::.. .. .. . : : CCDS75 MSFGSEHYLCSSSSYRKVFGDGSRLSARLSGAGGAGGFRSQSLSRSNVASSAACSSASSL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB8 APRLAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAGYIE . ::: : ..::.::... : .::. :.:::::::::::::: .:: CCDS75 GLGLAYRRP---PASDGLDLSQAAARTN-------EYKIIRTNEKEQLQGLNDRFAVFIE 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 KVHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLDSDH ::: :: ::. .:::. ::::..: ...:. ...:.:.::: :: .. ..:. :. : CCDS75 KVHQLETQNRALEAELAALRQRHAEPSRVGELFQRELRDLRAQLEEASSARSQALLERDG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 LEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFLRSN : :...::. : :::.: :. .: :..: ..:.. :.:....:.:::.:: ::.::.:. CCDS75 LAEEVQRLRARCEEESRGREGAERALKAQQRDVDGATLARLDLEKKVESLLDELAFVRQV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 HEEEVADLLAQIQASHITVERKDYL--KTDISTALKEIRSQLESHSDQNMHQAEEWFKCR :.::::.::: .::: .. . : : :...::.:::.: :: . .:...::::.: . CCDS75 HDEEVAELLATLQASSQAAAEVDVTVAKPDLTSALREIRAQYESLAAKNLQSAEEWYKSK 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 YAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIEERHNHD .:.:.: : .. ::::...::: :::::::...::.:..::..::::::. ..::::. . CCDS75 FANLNEQAARSTEAIRASREEIHEYRRQLQARTIEIEGLRGANESLERQILELEERHSAE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 LSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFSTF ...:::.: ::::.::.:: ::::::::::::::::::::::::::::::::::::::: CCDS75 VAGYQDSIGQLENDLRNTKSEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFSTS 360 370 380 390 400 410 420 430 440 450 460 pF1KB8 AGSITG--PLYTHR---PPITISSKIQKTKVEAPKLKVQHKFVEEIIEETKVEDEK-SEM . ::.: :: . :: .:. .:: . :..... :: : .:: ..: :.. CCDS75 GLSISGLNPLPNPSYLLPPRILSATT--SKVSSTGLSLKKEEEEE--EASKVASKKTSQI 420 430 440 450 460 470 480 490 500 510 520 pF1KB8 EEALTAITEELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGEKEE :.. : :: ..: :. .: :: CCDS75 GESFEEILEETVISTKKTEKSNIEETTISSQKI 470 480 490 >>CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 (543 aa) initn: 1509 init1: 659 opt: 1316 Z-score: 543.4 bits: 111.0 E(32554): 6e-24 Smith-Waterman score: 1341; 44.0% identity (72.3% similar) in 563 aa overlap (2-562:3-543) 10 20 30 40 50 pF1KB8 MSYTLDSLGNPSAYRRVTET-RSSFSRVSGSPSSGFRSQSWSRGSPSTVSSSYKRSMLA :.. . . : :: .:: : .: : .. :.. :: : ..: . : : .::. . CCDS75 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTA-RSAYSSYSAPVSSSLSVRRSYSS 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 PRLAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAGYIEK :.... : :. ::.:: ... : : : :..:: ::: ::::::..::. CCDS75 S----SGSLMPSLEN-LDLSQVAAISN-------DLKSIRTQEKAQLQDLNDRFASFIER 60 70 80 90 100 120 130 140 150 160 170 pF1KB8 VHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLDSDHL :: :::::: .:::. .::::.. ... :.::::.:: . : ...:: .: . . : CCDS75 VHELEQQNKVLEAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGL 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB8 EEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFLRSNH :: .. :. :.:::. :.:.:. . :: .::.:...::.:...::.::..::.. : CCDS75 EETLRNLQARYEEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVH 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB8 EEEVADLLAQIQASHITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAEEWFKCRYAK :::.:.: :::: ..:.:: : : :.:.:::.::.: :. . .::..:::::: :.. CCDS75 EEEIAELQAQIQYAQISVEM-DVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTV 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB8 LTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIEERHNHDLSS :::.: .: .:.:.::.:..: :: :..:..:.:. :: .:.::.::...:...: :.:. CCDS75 LTESAAKNTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB8 YQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFS-TFAG .::::..:::::: :: ::::.:.:::::::::::::::::::::::::::::.: : .: CCDS75 MQDTINKLENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVG 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB8 SITGPLYTHRPPITISSKIQKTKVEAPKLKVQHKFVEEIIEETKVEDEKSEMEEALTAIT :::. :.. . : .. . : ..: ..:..:. :.::.. : CCDS75 SITSG-YSQSSQVFGRSAYGGLQT-SSYLMSTRSFPSYY--TSHVQEEQIEVEETIEAAK 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB8 EELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGEKEEEEGQEEEE : : . . :: ::.... ::::::.: .. .: . :.:::: : :::.: .: CCDS75 AEEAKDEPPSEGEAEEEEKDKEEAEEEEAAEEEEAAKEESEEAKEEEEGGEGEEGEETKE 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB8 EEDEGAKSDQAEEGGSEKEGSSEKEEGEQEEGETEAEAEGEEAEAKEEKKVEEKSEEVAT :.: : ::..:......:. CCDS75 AEEEEKKV----EGAGEEQAAKKKD 530 540 >>CCDS7120.1 VIM gene_id:7431|Hs108|chr10 (466 aa) initn: 1053 init1: 562 opt: 1142 Z-score: 476.3 bits: 98.4 E(32554): 3.3e-20 Smith-Waterman score: 1142; 46.4% identity (78.9% similar) in 407 aa overlap (12-413:9-412) 10 20 30 40 50 pF1KB8 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSPSSGFRS-QSWSRGS---PSTVSSSYKRSM :.:::. .. :: :.: : : ...: :: ::: : : : CCDS71 MSTRSVSSSSYRRMFGGPGTASRPSSSRSYVTTSTRTYSLGSALRPSTSRSLYASSP 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 LAPRLAYSSAM-LSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAGY . . :::. : :. .. . :.: .. ... . ..: .:.::: .:: ::::::.: CCDS71 GGVYATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKNTRTNEKVELQELNDRFANY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 IEKVHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLDS :.::..:::::: . ::.. :. . : .::: :..:.:::: .......::.:... CCDS71 IDKVRFLEQQNKILLAELEQLKGQGKS--RLGDLYEEEMRELRRQVDQLTNDKARVEVER 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 DHLEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFLR :.: ::: ::.:...:: :...: .....:.:...:::....:..::.:::.:.:::. CCDS71 DNLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 SNHEEEVADLLAQIQASHITVERKDYLKTDISTALKEIRSQLESHSDQNMHQAEEWFKCR . ::::. .: :::: .:. .. : : :...::...:.: :: . .:...::::.: . CCDS71 KLHEEEIQELQAQIQEQHVQIDV-DVSKPDLTAALRDVRQQYESVAAKNLQEAEEWYKSK 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 YAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIEERHNHD .: :.:::..:..:.:.::.: .:::::.:: . :.....::.::::::. ..:: . CCDS71 FADLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEENFAVE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 LSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFSTF ..::::: .:..:... : ::::::::::::::::::::::::.:::::::::.:.: CCDS71 AANYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESRISLP 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 AGSITGPLYTHRPPITISSKIQKTKVEAPKLKVQHKFVEEIIEETKVEDEKSEMEEALTA CCDS71 LPNFSSLNLRETNLDSLPLVDTHSKRTLLIKTVETRDGQVINETSQHHDDLE 420 430 440 450 460 >>CCDS33383.1 DES gene_id:1674|Hs108|chr2 (470 aa) initn: 1065 init1: 542 opt: 1074 Z-score: 449.6 bits: 93.5 E(32554): 1e-18 Smith-Waterman score: 1075; 38.8% identity (73.1% similar) in 469 aa overlap (12-465:6-468) 10 20 30 40 50 pF1KB8 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSP-SSGFRSQSWSR---GSPSTVSSSYKRSM :. .::. : .:. . : : .: . : . : :: .. :: .: . CCDS33 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVY 10 20 30 40 50 60 70 80 90 100 pF1KB8 LAPRLAYSSAMLSSAESS-LDFSQSSSLLNGGSGPGGDYKL----------SRSNEKEQL . : . ... :.: ..: : ... : . :.: :..: .:.::: .: CCDS33 QVSRTSGGAGGLGSLRASRLGTTRTPS--SYGAGELLDFSLADAVNQEFLTTRTNEKVEL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB8 QGLNDRFAGYIEKVHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVN : ::::::.:::::..::::: . ::.. :. .. . .... :..:.:::: .:... CCDS33 QELNDRFANYIEKVRFLEQQNAALAAEVNRLKGREPT--RVAELYEEELRELRRQVEVLT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB8 HEKAQVQLDSDHLEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQ ...:.:... :.: .:..::: ...:: .:....: . :.: :.. :.:....:..... CCDS33 NQRARVDVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIE 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB8 SLQDEVAFLRSNHEEEVADLLAQIQASHITVERKDYLKTDISTALKEIRSQLESHSDQNM ::..:.:::.. ::::. .: ::.: ... :: :. : :...::..::.: :. . .:. CCDS33 SLNEEIAFLKKVHEEEIRELQAQLQEQQVQVEM-DMSKPDLTAALRDIRAQYETIAAKNI 240 250 260 270 280 290 300 310 320 330 340 pF1KB8 HQAEEWFKCRYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQL .::::.: . . ::.::..:..:.:.::.:. :::.:.:: . :.....::..:: ::. CCDS33 SEAEEWYKSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQM 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB8 SDIEERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLL ..:.: . :.:::.: .::.:.: : ::::::::::::::::::::.:::.::::: CCDS33 RELEDRFASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLL 350 360 370 380 390 400 410 420 430 440 450 460 pF1KB8 EGEETRFSTFAGSITGPLYTHRPPITISSKIQKTKVEAPKLKVQHKFVEEIIEETKVEDE ::::.:.. . .. . . : .:... :. : .. . : . : :. . : CCDS33 EGEESRINLPIQTYSALNFRETSPEQRGSEVHTKKTVMIKT-IETRDGEVVSEATQQQHE 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB8 KSEMEEALTAITEELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEG CCDS33 VL 470 >>CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 (470 aa) initn: 1121 init1: 554 opt: 1060 Z-score: 444.1 bits: 92.5 E(32554): 2e-18 Smith-Waterman score: 1076; 43.1% identity (72.1% similar) in 469 aa overlap (12-472:15-465) 10 20 30 40 50 pF1KB8 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSPSSGFR-SQSWSRGSPSTVSSSYKRSM ..:::. :.: . : ::. : :.: :: : :: :. CCDS87 MSHHPSGLRAGFSSTSYRRTFGPPPSLSPGAFSYSSSSRFSSSRLLGSASPSSSVRLGSF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB8 LAPRLAYSSAMLSSAESSLDFSQSSSLLNGGSGPGGDYKLSRSNEKEQLQGLNDRFAGYI .:: : ..:.: ::::.. .: . .. .:::::..:: ::::::..: CCDS87 RSPR-AGAGALLRLPSERLDFSMAEAL-------NQEFLATRSNEKQELQELNDRFANFI 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 EKVHYLEQQNKEIEAEI-QALRQKQASHAQLGDAYDQEIRELRATLEMVNHEKAQVQLDS :::..::::: ...:. :: :. : :: .::.:::: ::....:. .::.. CCDS87 EKVRFLEQQNAALRGELSQARGQEPARADQLC---QQELRELRRELELLGRERDRVQVER 120 130 140 150 160 180 190 200 210 220 230 pF1KB8 DHLEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQSLQDEVAFLR : : ::. ::.:.:::.: :.:.: . .:::...:.: ..::..:..::.::. ::. CCDS87 DGLAEDLAALKQRLEEETRKREDAEHNLVLFRKDVDDATLSRLELERKIESLMDEIEFLK 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB8 SNHEEEVADLLAQIQASHIT-VERKDYLKTDISTALKEIRSQLESHSDQNMHQAEEWFKC . ::::. :: ........ :: . .: ....::..::.: :: . .:...::::.: CCDS87 KLHEEELRDLQVSVESQQVQQVEVEATVKPELTAALRDIRAQYESIAAKNLQEAEEWYKS 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB8 RYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQLSDIEERHNH .:: :..::..:.::.:.::.:. : :::.:: . :....:::.:.: ::: ..::. CCDS87 KYADLSDAANRNHEALRQAKQEMNESRRQIQSLTCEVDGLRGTNEALLRQLRELEEQFAL 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB8 DLSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEETRFS- . ..:: .::.::: : ::::::::::.:::::::::::::.:::::::::.:.: CCDS87 EAGGYQAGAARLEEELRQLKEEMARHLREYQELLNVKMALDIEIATYRKLLEGEESRISV 350 360 370 380 390 400 420 430 440 450 460 pF1KB8 ---TFAG-SITGPLYTHRPPITISSKIQKTKVEAPKLKVQHKFVEEIIEETKVEDEKSEM .::. .: . .:: :. :: . .:. . :.. :.. : ..::. CCDS87 PVHSFASLNIKTTVPEVEPPQDSHSR--KTVL----IKTIETRNGEVVTESQKE-QRSEL 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB8 EEALTAITEELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEGEKEE ... CCDS87 DKSSAHSY 470 >>CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 (432 aa) initn: 875 init1: 572 opt: 1024 Z-score: 430.6 bits: 89.8 E(32554): 1.2e-17 Smith-Waterman score: 1032; 43.7% identity (73.7% similar) in 414 aa overlap (57-463:31-427) 30 40 50 60 70 80 pF1KB8 VSGSPSSGFRSQSWSRGSPSTVSSSYKRSMLAPRLAYSSA-MLSSAESSLDFSQSSSLLN :.: : : : . .::: ...: : CCDS11 MERRRITSAARRSYVSSGEMMVGGLAPGRRLGPGTRLSLARMPPPLPTRVDFSLAGAL-N 10 20 30 40 50 90 100 110 120 130 140 pF1KB8 GGSGPGGDYKLSRSNEKEQLQGLNDRFAGYIEKVHYLEQQNKEIEAEIQALRQKQASHAQ .: .: .:..:. ... ::::::.:::::..:::::: . ::.. :: :. . . CCDS11 AG------FKETRASERAEMMELNDRFASYIEKVRFLEQQNKALAAELNQLRAKEPT--K 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB8 LGDAYDQEIRELRATLEMVNHEKAQVQLDSDHLEEDIHRLKERFEEEARLRDDTEAAIRA :.:.:. :.:::: :.... ..:..... :.: .:. .......:. :: ..: . : CCDS11 LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQKLQDETNLRLEAENNLAA 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB8 LRKDIEEASLVKVELDKKVQSLQDEVAFLRSNHEEEVADLLAQIQASHITVERKDYLKTD :.. .::.:....:..:..::..:. :::. ::::: .: :. ... :: : : : CCDS11 YRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQEQLARQQVHVEL-DVAKPD 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB8 ISTALKEIRSQLESHSDQNMHQAEEWFKCRYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQ ...::::::.: :. ...:::.::::.. ..: ::.:: .: : .:.::.: .:::::: CCDS11 LTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAELLRQAKHEANDYRRQLQ 240 250 260 270 280 290 330 340 350 360 370 380 pF1KB8 SKSIELESVRGTKESLERQLSDIEERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQ : . .:::.:::.::::::. . :::: .. .:::... .::.: .. : ::::::.::: CCDS11 SLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEEEGQSLKDEMARHLQEYQ 300 310 320 330 340 350 390 400 410 420 430 440 pF1KB8 DLLNVKMALDIEIAAYRKLLEGEETRFSTFAGSITGPLYTHRPPITISSKIQKTKVEAPK ::::::.:::::::.:::::::::.: :: :. : .... .: . CCDS11 DLLNVKLALDIEIATYRKLLEGEENR-------ITIPVQTFSNLQIRETSLDTKSVSEGH 360 370 380 390 400 450 460 470 480 490 pF1KB8 LK--VQHKFVE----EIIEETKVEDEKSEMEEALTAITEELAVSMKEEKKEAAEEKEEEP :: . : :: :.:.:.: : CCDS11 LKRNIVVKTVEMRDGEVIKESKQEHKDVM 410 420 430 >>CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 (431 aa) initn: 875 init1: 572 opt: 1019 Z-score: 428.6 bits: 89.5 E(32554): 1.5e-17 Smith-Waterman score: 1027; 46.4% identity (78.5% similar) in 358 aa overlap (57-413:31-378) 30 40 50 60 70 80 pF1KB8 VSGSPSSGFRSQSWSRGSPSTVSSSYKRSMLAPRLAYSSA-MLSSAESSLDFSQSSSLLN :.: : : : . .::: ...: : CCDS45 MERRRITSAARRSYVSSGEMMVGGLAPGRRLGPGTRLSLARMPPPLPTRVDFSLAGAL-N 10 20 30 40 50 90 100 110 120 130 140 pF1KB8 GGSGPGGDYKLSRSNEKEQLQGLNDRFAGYIEKVHYLEQQNKEIEAEIQALRQKQASHAQ .: .: .:..:. ... ::::::.:::::..:::::: . ::.. :: :. . . CCDS45 AG------FKETRASERAEMMELNDRFASYIEKVRFLEQQNKALAAELNQLRAKEPT--K 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB8 LGDAYDQEIRELRATLEMVNHEKAQVQLDSDHLEEDIHRLKERFEEEARLRDDTEAAIRA :.:.:. :.:::: :.... ..:..... :.: .:. .......:. :: ..: . : CCDS45 LADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQKLQDETNLRLEAENNLAA 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB8 LRKDIEEASLVKVELDKKVQSLQDEVAFLRSNHEEEVADLLAQIQASHITVERKDYLKTD :.. .::.:....:..:..::..:. :::. ::::: .: :. ... :: : : : CCDS45 YRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQEQLARQQVHVEL-DVAKPD 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB8 ISTALKEIRSQLESHSDQNMHQAEEWFKCRYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQ ...::::::.: :. ...:::.::::.. ..: ::.:: .: : .:.::.: .:::::: CCDS45 LTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAELLRQAKHEANDYRRQLQ 240 250 260 270 280 290 330 340 350 360 370 380 pF1KB8 SKSIELESVRGTKESLERQLSDIEERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQ : . .:::.:::.::::::. . :::: .. .:::... .::.: .. : ::::::.::: CCDS45 SLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEEEGQSLKDEMARHLQEYQ 300 310 320 330 340 350 390 400 410 420 430 440 pF1KB8 DLLNVKMALDIEIAAYRKLLEGEETRFSTFAGSITGPLYTHRPPITISSKIQKTKVEAPK ::::::.:::::::.:::::::::.:.. CCDS45 DLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNLQIRGGKSTKDGENHKVTRYLKSL 360 370 380 390 400 410 916 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:26:28 2016 done: Sat Nov 5 16:26:29 2016 Total Scan time: 5.570 Total Display time: 0.190 Function used was FASTA [36.3.4 Apr, 2011]