FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KF0156, 1858 aa
1>>>pF1KF0156 1858 - 1858 aa - 1858 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3907+/-0.00113; mu= 19.4413+/- 0.068
mean_var=104.3892+/-21.161, 0's: 0 Z-trim(104.8): 102 B-trim: 19 in 2/49
Lambda= 0.125530
statistics sampled from 7962 (8069) to 7962 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.593), E-opt: 0.2 (0.248), width: 16
Scan time: 6.330
The best scores are: opt bits E(32554)
CCDS44385.1 WDFY4 gene_id:57705|Hs108|chr10 (3184) 12047 2194.2 0
CCDS3609.1 WDFY3 gene_id:23001|Hs108|chr4 (3526) 1386 263.5 1e-68
CCDS46817.1 NBEAL2 gene_id:23218|Hs108|chr3 (2754) 1149 220.5 6.9e-56
CCDS55894.1 NBEA gene_id:26960|Hs108|chr13 ( 739) 1140 218.5 7.4e-56
CCDS45026.1 NBEA gene_id:26960|Hs108|chr13 (2946) 1140 218.9 2.2e-55
CCDS58928.1 LRBA gene_id:987|Hs108|chr4 (2851) 1100 211.7 3.3e-53
CCDS3773.1 LRBA gene_id:987|Hs108|chr4 (2863) 1100 211.7 3.3e-53
CCDS46495.1 NBEAL1 gene_id:65065|Hs108|chr2 (2694) 1092 210.2 8.6e-53
CCDS31062.1 LYST gene_id:1130|Hs108|chr1 (3801) 778 153.4 1.5e-35
CCDS6173.1 NSMAF gene_id:8439|Hs108|chr8 ( 917) 576 116.4 4.9e-25
CCDS47864.1 NSMAF gene_id:8439|Hs108|chr8 ( 948) 576 116.5 5e-25
>>CCDS44385.1 WDFY4 gene_id:57705|Hs108|chr10 (3184 aa)
initn: 12041 init1: 12041 opt: 12047 Z-score: 11782.4 bits: 2194.2 E(32554): 0
Smith-Waterman score: 12047; 97.5% identity (98.2% similar) in 1848 aa overlap (1-1845:1319-3166)
10 20 30
pF1KF0 MNISSRDNAMPVFLLRNCAGHLSGSLRTIG
::::::::::::::::::::::::::::::
CCDS44 GLHIASSSITSVADIRNAYNEVDSRLIAKEMNISSRDNAMPVFLLRNCAGHLSGSLRTIG
1290 1300 1310 1320 1330 1340
40 50 60 70 80 90
pF1KF0 AVAVGQLGVRVFHSSPAASSLDFIGGPAILLGLISLATDDHTMYAAVKVLHSVLTSNAMC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AVAVGQLGVRVFHSSPAASSLDFIGGPAILLGLISLATDDHTMYAAVKVLHSVLTSNAMC
1350 1360 1370 1380 1390 1400
100 110 120 130 140 150
pF1KF0 DFLMQHICGYQIMAFLLRKKASLLNHRIFQLILSVAGTVELGFRSSAITNTGVFQHILCN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DFLMQHICGYQIMAFLLRKKASLLNHRIFQLILSVAGTVELGFRSSAITNTGVFQHILCN
1410 1420 1430 1440 1450 1460
160 170 180 190 200 210
pF1KF0 FELWMNTADNLELSLFSHLLEILQSPREGPRNAEAAHQAQLIPKLIFLFNEPSLIPSKIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FELWMNTADNLELSLFSHLLEILQSPREGPRNAEAAHQAQLIPKLIFLFNEPSLIPSKIS
1470 1480 1490 1500 1510 1520
220 230 240 250 260 270
pF1KF0 TIIGILACQLRGHFSTQDLLRIGLFVVYTLKPSSVNERQICMDGALDPSLPAGSQTSGKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TIIGILACQLRGHFSTQDLLRIGLFVVYTLKPSSVNERQICMDGALDPSLPAGSQTSGKT
1530 1540 1550 1560 1570 1580
280 290 300 310 320 330
pF1KF0 IWLRNQLLEMLLSVISSPQLHLSSESKEEMFLKLGPDWFLLLLQGHLHASTTVLALKLLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 IWLRNQLLEMLLSVISSPQLHLSSESKEEMFLKLGPDWFLLLLQGHLHASTTVLALKLLL
1590 1600 1610 1620 1630 1640
340 350 360 370 380 390
pF1KF0 YFLASPSLRTRFRDGLCAGSWVERSTEGVDIVMDNLKSQSPLPEQSPCLLPGFRVLNDFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YFLASPSLRTRFRDGLCAGSWVERSTEGVDIVMDNLKSQSPLPEQSPCLLPGFRVLNDFL
1650 1660 1670 1680 1690 1700
400 410 420 430 440 450
pF1KF0 AHHVHIPEVYLIVSTFFLQTPLTELMDGPKDSLDAMLQWLLQRHHQEEVLQAGLCTEGAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AHHVHIPEVYLIVSTFFLQTPLTELMDGPKDSLDAMLQWLLQRHHQEEVLQAGLCTEGAL
1710 1720 1730 1740 1750 1760
460 470 480 490 500 510
pF1KF0 LLLEMLKATMSQPLAGSEDGAWAQTFPASVLQFLSLVHRTYPQDPAWRAPEFLQTLAIAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LLLEMLKATMSQPLAGSEDGAWAQTFPASVLQFLSLVHRTYPQDPAWRAPEFLQTLAIAA
1770 1780 1790 1800 1810 1820
520 530 540 550 560 570
pF1KF0 FPLGAQKGVGAESTRNTSSPEAAAEGDSTVEGLQAPTKAHPARRKLREFTQLLLRELLLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FPLGAQKGVGAESTRNTSSPEAAAEGDSTVEGLQAPTKAHPARRKLREFTQLLLRELLLG
1830 1840 1850 1860 1870 1880
580 590 600 610 620 630
pF1KF0 ASSPKQWLPLEVLLEASPDHATSQQKRDFQSEVLLSAMELFHMTSGGDAAMFRDGKEPQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ASSPKQWLPLEVLLEASPDHATSQQKRDFQSEVLLSAMELFHMTSGGDAAMFRDGKEPQP
1890 1900 1910 1920 1930 1940
640 650 660 670 680 690
pF1KF0 SAEAAAAPSLANISCFTQKLVEKLYSGMFSADPRHILLFILEHIMVVIETASSQRDTVLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SAEAAAAPSLANISCFTQKLVEKLYSGMFSADPRHILLFILEHIMVVIETASSQRDTVLS
1950 1960 1970 1980 1990 2000
700 710 720 730 740 750
pF1KF0 TLYSSLNKVILYCLSKPQQSLSECLGLLSILGFLQEHWDVVFATYNSNISFLLCLMHCLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TLYSSLNKVILYCLSKPQQSLSECLGLLSILGFLQEHWDVVFATYNSNISFLLCLMHCLL
2010 2020 2030 2040 2050 2060
760 770 780 790 800 810
pF1KF0 LLNERSYPEGFGLEPKPRMSTYHQVFLSPNEDVKEKREDLPSLSDVQHNIQKTVQTLWQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LLNERSYPEGFGLEPKPRMSTYHQVFLSPNEDVKEKREDLPSLSDVQHNIQKTVQTLWQQ
2070 2080 2090 2100 2110 2120
820 830 840 850 860 870
pF1KF0 LVAQRQQTLEDAFKIDLSVKPGEREVKIEEVTPLWEETMLKAWQHYLASEKKSLASRSNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LVAQRQQTLEDAFKIDLSVKPGEREVKIEEVTPLWEETMLKAWQHYLASEKKSLASRSNV
2130 2140 2150 2160 2170 2180
880 890 900 910 920 930
pF1KF0 AHHSKVTLWSGSLSSAMKLMPGRQAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AHHSKVTLWSGSLSSAMKLMPGRQAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQR
2190 2200 2210 2220 2230 2240
940 950 960 970 980 990
pF1KF0 RKCGNIKAANAWARIQEQLFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RKCGNIKAANAWARIQEQLFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLE
2250 2260 2270 2280 2290 2300
1000 1010 1020 1030 1040 1050
pF1KF0 ALSSGRHKESQDKNDHISQTNAENQDELTLREAEGEPDEVGVDCTQLTFFPALHESLHSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ALSSGRHKESQDKNDHISQTNAENQDELTLREAEGEPDEVGVDCTQLTFFPALHESLHSE
2310 2320 2330 2340 2350 2360
1060 1070 1080 1090 1100 1110
pF1KF0 DFLELCRERQVILQELLDKEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DFLELCRERQVILQELLDKEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPTG
2370 2380 2390 2400 2410 2420
1120 1130 1140 1150 1160 1170
pF1KF0 DVYCTRHCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFFH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DVYCTRHCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFFH
2430 2440 2450 2460 2470 2480
1180 1190 1200 1210 1220 1230
pF1KF0 NGYSKFLVFYNNDRSKAFKSFCSFQPSLKGKATSEDTLNLRRYPGSDRIMLQKWQKRDIS
::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::::
CCDS44 NGYSKFLVFYNNDRSKAFKSFCSFQPSLKGKATSEDTLSLRRYPGSDRIMLQKWQKRDIS
2490 2500 2510 2520 2530 2540
1240 1250 1260 1270 1280 1290
pF1KF0 NFEYLMYLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NFEYLMYLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERK
2550 2560 2570 2580 2590 2600
1300 1310 1320 1330 1340 1350
pF1KF0 LKFIQRFKEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDVADR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LKFIQRFKEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDVADR
2610 2620 2630 2640 2650 2660
1360 1370 1380 1390 1400 1410
pF1KF0 MFHSVKSTWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLGDVQLPPWA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MFHSVKSTWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLGDVQLPPWA
2670 2680 2690 2700 2710 2720
1420 1430 1440 1450 1460 1470
pF1KF0 DGDPRKFISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRMDLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DGDPRKFISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRMDLS
2730 2740 2750 2760 2770 2780
1480 1490 1500 1510 1520 1530
pF1KF0 SITDPLIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKPLPGKDVSTPVSLPGHPQPFFY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SITDPLIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKPLPGKDVSTPVSLPGHPQPFFY
2790 2800 2810 2820 2830 2840
1540 1550 1560 1570 1580 1590
pF1KF0 SLQSLRPSQVTVKDMYLFSLGSESPKGAIGHIVSTEKTILAVERNKVLLPPLWNRTFSWG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SLQSLRPSQVTVKDMYLFSLGSESPKGAIGHIVSTEKTILAVERNKVLLPPLWNRTFSWG
2850 2860 2870 2880 2890 2900
1600 1610 1620 1630 1640 1650
pF1KF0 FDDFSCCLGSYGSDKVLMTFENLAAWGRCLCAVCPSPTTIVTSGTSTVVCVWELSMTKGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FDDFSCCLGSYGSDKVLMTFENLAAWGRCLCAVCPSPTTIVTSGTSTVVCVWELSMTKGR
2910 2920 2930 2940 2950 2960
1660 1670 1680 1690 1700 1710
pF1KF0 PRGLRLRQALYGHTQAVTCLAASVTFSLLVSGSQDCTCILWDLDHLTHVTRLPAHREGIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PRGLRLRQALYGHTQAVTCLAASVTFSLLVSGSQDCTCILWDLDHLTHVTRLPAHREGIS
2970 2980 2990 3000 3010 3020
1720 1730 1740 1750 1760 1770
pF1KF0 AITISDVSGTIVSCAGAHLSLWNVNGQPLASITTAWGPEGAITCCCLMEGPAWDTSQIII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AITISDVSGTIVSCAGAHLSLWNVNGQPLASITTAWGPEGAITCCCLMEGPAWDTSQIII
3030 3040 3050 3060 3070 3080
1780 1790 1800 1810 1820
pF1KF0 TGSQDGMVRVWKTEDVKMSVPGLQMGRKREAAEALAQQCQAEGGRG---DWGLSSAYRRN
:::::::::::::::::::::: :.. : . . : . . . .: : .
CCDS44 TGSQDGMVRVWKTEDVKMSVPGRPAGEEPPAQPPSPRGHKWEKNLALSRELDVSIALTGK
3090 3100 3110 3120 3130 3140
1830 1840 1850
pF1KF0 PQGLLPHSSQGRASGNHSSAAQPSPWPMGLL
:. : . .: ::.
CCDS44 PSKTSPAVTALAVSRNHTKLLVGDERGRIFCWSADG
3150 3160 3170 3180
>>CCDS3609.1 WDFY3 gene_id:23001|Hs108|chr4 (3526 aa)
initn: 3449 init1: 992 opt: 1386 Z-score: 1347.3 bits: 263.5 E(32554): 1e-68
Smith-Waterman score: 3872; 35.9% identity (65.3% similar) in 1895 aa overlap (94-1850:1448-3311)
70 80 90 100 110 120
pF1KF0 ISLATDDHTMYAAVKVLHSVLTSNAMCDFLMQHICGYQIMAFLLRKKASLLNHRIFQLIL
:..: :::..:.::.:: :::: .:..: .
CCDS36 VAMASDVEGLYAAVKALVCVVKSNPLASKEMERIKGYQLLAMLLKKKRSLLNSHILHLTF
1420 1430 1440 1450 1460 1470
130 140 150 160 170 180
pF1KF0 SVAGTVELGFRSSAITNTGVFQHILCNFELWMNTADNLELSLFSHLLEILQSPREGPRNA
:..:::. : ..: : :. .:: .::.::.:... .:.:::: :..:.: :. .::
CCDS36 SLVGTVDSGHETSIIPNSTAFQDLLCDFEVWLHAPYELHLSLFEHFIELLTESSEASKNA
1480 1490 1500 1510 1520 1530
190 200 210 220 230 240
pF1KF0 EAAHQAQLIPKLIFLFNEPSLIPSKISTIIGILACQLRGHFSTQDLLRIGLFVVYTLKPS
. .. ::::::.. . . :: :..: ..:. :.: :..::::.: :. ::
CCDS36 KLMREFQLIPKLLLTLRDMSLSQPTIAAISNVLSFLLQGFPSSNDLLRFGQFISSTLPTF
1540 1550 1560 1570 1580 1590
250 260 270 280 290
pF1KF0 SVNERQICMDGALDPSLPAGSQ------TSGKTIWLRNQLLEMLLSVI--SSPQLHLSSE
.: :. . :. . .: .:.. .:.. : :::.::..::..: :. . .. .
CCDS36 AVCEKFVVMEINNEEKLDTGTEEEFGGLVSANLILLRNRLLDILLKLIYTSKEKTSINLQ
1600 1610 1620 1630 1640 1650
300 310 320 330 340 350
pF1KF0 SKEEMFLKLGPDWFLLLLQGHLHASTTVLALKLLLYFLASPSLRTRFRDGLCAGSWVERS
. ::. :: ::...... :::..:.. :...:. .:.. :. .:..:: .:.:.:..
CCDS36 ACEELVKTLGFDWIMMFMEEHLHSTTVTAAMRILVVLLSNQSILIKFKEGLSGGGWLEQT
1660 1670 1680 1690 1700 1710
360 370 380 390 400
pF1KF0 ----TEGVDIVMD-----NLKSQSPLPE--QSPCLLPGFRVLNDFLAHHVHIPEVYLIVS
:. . :. . ..: . : .. : .::: ::..:: .:...: .:...
CCDS36 DSVLTNKIGTVLGFNVGRSAGGRSTVREINRDACHFPGFPVLQSFLPKHTNVPALYFLLM
1720 1730 1740 1750 1760 1770
410 420 430 440
pF1KF0 TFFLQTPLTELMD---------------GPKDSLDAMLQWLLQRHHQEEVLQAGL---CT
..::: :..:: . : . .::.. ... . .. ... ::
CCDS36 ALFLQQPVSELPENLQVSVPVISCRSKQGCQFDLDSIWTFIFGVPASSGTVVSSIHNVCT
1780 1790 1800 1810 1820 1830
450 460 470 480 490 500
pF1KF0 EGALLLLEMLKATMSQPLAGSEDGAWAQTFPASVLQFLSLVHRTYPQDPA-WRAPEFLQT
:...::: ::.. ...: . :.:.: . .:....::. .... :. . : .:.:: .
CCDS36 EAVFLLLGMLRSMLTSPWQSEEEGSWLREYPVTLMQFFRYLYHNVPDLASMWMSPDFLCA
1840 1850 1860 1870 1880 1890
510 520 530 540 550
pF1KF0 LAIAAFP------------LGAQKGVGAESTRNTSSPEAAAEGDSTVE--GLQAPTKAHP
:: ..:: : . : :: . .. . ...: : .. ::
CCDS36 LAATVFPFNIRPYSEMVTDLDDEVGSPAEEFKAFAADTGMNRSQSEYCNVGTKTYLTNHP
1900 1910 1920 1930 1940 1950
560 570 580 590 600 610
pF1KF0 ARRKLREFTQLLLRELLLGASSPKQWLPLEVLLEASPDHATSQQKRDFQSEVLLSAMELF
:.. . .: ..:. . : . . :: ...::::::...: :...::. .: :.:.
CCDS36 AKKFVFDFMRVLIIDNLCLTPASKQTPLIDLLLEASPERSTRTQQKEFQTYILDSVMD--
1960 1970 1980 1990 2000 2010
620 630 640 650 660 670
pF1KF0 HMTSGGDAAMFRDGKEPQPSAEAAAAPSLANISCFTQKLVEKLYSGMFSADPRHILLFIL
:. .. :. . .:.. : :. .. . :. :::..:.::..:::. . . .. ::
CCDS36 HLLAA-DVLLGEDASLPITSG-GSYQVLVNNVFYFTQRVVDKLWQGMFNKESKLLIDFI-
2020 2030 2040 2050 2060 2070
680 690 700 710 720 730
pF1KF0 EHIMVVIETASSQRDTVLSTLYSSLNKVILYCLSKPQQSLSECLGLLSILGFLQEHWDVV
:... .. .. :...: ::..::: .:. .... . ..::. : : . ...
CCDS36 --IQLIAQSKRRSQGLSLDAVYHCLNRTILYQFSRAHKTVPQQVALLDSLRVLTVNRNLI
2080 2090 2100 2110 2120 2130
740 750 760 770 780 790
pF1KF0 FATYNSNISFLLCLMHCLLLLNERSYPEGFGLEPKPRMSTYHQVFLSPNEDVKEKREDLP
.. : . :. :: :::. :. : .::::: . ::.:.: .. :. :..
CCDS36 LGPGNHDQEFISCLAHCLINLHVGSNVDGFGLEAEARMTTWH--IMIPS-DIEPDGSYSQ
2140 2150 2160 2170 2180
800 810 820 830 840 850
pF1KF0 SLSDVQHNIQKTVQTLWQQLVAQRQQTLEDAFKIDLSVKPGER-EVKIEEVTPLWEETML
..:. .. . :.:. .: .:. ...:.::. ::. : : .:: .: : . :: ::. :
CCDS36 DISEGRQLLIKAVNRVWTELIHSKKQVLEELFKVTLPV--NERGHVDIATARPLIEEAAL
2190 2200 2210 2220 2230 2240
860 870 880 890 900
pF1KF0 KAWQHYLASEKKSLASRSNVAHHSKVTLWSGSLSSAMKLMPGRQAKDPEC-------KTE
: ::..:: ::: .. .: .. : : . ... . : . . : .:.
CCDS36 KCWQNHLAHEKKCISRGEALAPTTQSKLSRVSSGFGLSKLTGSRRNRKESGLNKHSLSTQ
2250 2260 2270 2280 2290 2300
910 920 930 940 950 960
pF1KF0 DFVSCIENYRRRGQELYASLYKDHVQRRKCGNIKAANAWARIQEQLFGELGLWSQGEETK
.. . . .. ..: . ::.. .:.. . ... : .:. .:. : :::. ..
CCDS36 EISQWMFTHIAVVRDLVDTQYKEYQERQQNALKYVTEEWCQIECELLRERGLWGPPIGSH
2310 2320 2330 2340 2350 2360
970 980 990 1000 1010
pF1KF0 PCSPWELDWREGPARMRKRIKR---------LSPLEALSSGRHKESQDKN----DHISQT
. : :. ::: ::::.. : : .. .: .:. : : :
CCDS36 -LDKWMLEMTEGPCRMRKKMVRNDMFYNHYPYVPETEQETNVASEIPSKQPETPDDIPQK
2370 2380 2390 2400 2410 2420
1020 1030 1040 1050
pF1KF0 N------AENQD--ELTLREAEGEP---DEVGVDCTQLTFFPALHESLHSEDFLE-----
. : . : : .: : :.: ... :. .. : .: :.:: .
CCDS36 KPARYRRAVSYDSKEYYMRLASGNPAIVQDAIVESSEGE--AAQQEPEHGEDTIAKVKGL
2430 2440 2450 2460 2470 2480
1060 1070
pF1KF0 ----LCRER----------QVILQE---------------------LLDK-EKVTQKFSL
: : : : ::. ::.. ::. . .
CCDS36 VKPPLKRSRSAPDGGDEENQEQLQDQIAEGSSIEEEEKTDNATLLRLLEEGEKIQHMYRC
2490 2500 2510 2520 2530 2540
1080 1090 1100 1110 1120 1130
pF1KF0 VIVQGHLVSEGVLLFGHQHFYICENFTLSPTGDVYCTRHCLSNISDPFIFNLCSKDRSTD
. ::: .:::.::::..:::. ..::.. : .. . :. .:.: . :
CCDS36 ARVQGLDTSEGLLLFGKEHFYVIDGFTMTATREIRDIETLPPNMHEPIIPRGARQGPSQL
2550 2560 2570 2580 2590 2600
1140 1150 1160 1170 1180 1190
pF1KF0 HYSCQCHSYADMRELRQARFLLQDIALEIFFHNGYSKFLVFYNNDRSKAFKSFCSFQPSL
. .:. .: :..:... :.::: ::.:.: .: . .:.: .. :.:... : . :::
CCDS36 KRTCSIFAYEDIKEVHKRRYLLQPIAVEVFSGDGRNYLLAFQKGIRNKVYQRFLAVVPSL
2610 2620 2630 2640 2650 2660
1200 1210 1220 1230 1240
pF1KF0 --KGKATSEDTLNLRRYPGS--------DRIMLQKWQKRDISNFEYLMYLNTAAGRTCND
.....: . : :: .. . :.:.. .::::.:::.::: :::. ::
CCDS36 TDSSESVSGQRPNTSVEQGSGLLSTLVGEKSVTQRWERGEISNFQYLMHLNTLAGRSYND
2670 2680 2690 2700 2710 2720
1250 1260 1270 1280 1290 1300
pF1KF0 YMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERKLKFIQRFKEVEKTEGDMT
::::::::.:::: :: ..:.::: ::.:.::::::: :: .. .:.:. : .:. :
CCDS36 LMQYPVFPWILADYDSEEVDLTNPKTFRNLAKPMGAQTDERLAQYKKRYKDWEDPNGE-T
2730 2740 2750 2760 2770 2780
1310 1320 1330 1340 1350 1360
pF1KF0 VQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDVADRMFHSVKSTWESASRENMS
:: ::::::.::::::::: :::: : :::: ::.::::::::. .: :::..::.
CCDS36 PAYHYGTHYSSAMIVASYLVRMEPFTQIFLRLQGGHFDLADRMFHSVREAWYSASKHNMA
2790 2800 2810 2820 2830 2840
1370 1380 1390 1400 1410 1420
pF1KF0 DVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLGDVQLPPWADGDPRKFISLHRKALESD
::.:: :::::::::: : :. ..:: :.:: :::: ::::: ::::.:: .::.::: :
CCDS36 DVKELIPEFFYLPEFLFNSNNFDLGCKQNGTKLGDVILPPWAKGDPREFIRVHREALECD
2850 2860 2870 2880 2890 2900
1430 1440 1450 1460 1470 1480
pF1KF0 FVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRMDLSSITDPLIKSTILGFVSNF
.:::.::.::::::::::::::::.:::.:: :: ..:. .:.::: ... .::..::
CCDS36 YVSAHLHEWIDLIFGYKQQGPAAVEAVNVFHHLFYEGQVDIYNINDPLKETATIGFINNF
2910 2920 2930 2940 2950 2960
1490 1500 1510 1520 1530 1540
pF1KF0 GQVPKQLFTKPHPARTAAGKPLPGKDVSTPVSLPGHPQP--FFYSLQSLRPSQVTVKDMY
::.::::: :::: . . .. : : ... : ::: . ::. :..:::: . ::..
CCDS36 GQIPKQLFKKPHPPKRVRSR-LNGDNAGISV-LPGSTSDKIFFHHLDNLRPSLTPVKEL-
2970 2980 2990 3000 3010
1550 1560 1570 1580 1590 1600
pF1KF0 LFSLGSESPKGAIGHIVSTEKTILAVERNKVLLPPLWNRTFSWGFDDFSCCLGSYGSDKV
: .:.:: :.: :::::.::::.:: ::.::.::. :.:: ::.: :::.
CCDS36 ---------KEPVGQIVCTDKGILAVEQNKVLIPPTWNKTFAWGYADLSCRLGTYESDKA
3020 3030 3040 3050 3060
1610 1620 1630 1640 1650 1660
pF1KF0 LMTFENLAAWGRCLCAVCPSPTTIVTSGTSTVVCVWELSMTKGRPRGLRLRQALYGHTQA
. ..: :. ::. :::.::.: ..:.::::::::::.. .: . . . :.::: :::..
CCDS36 MTVYECLSEWGQILCAICPNPKLVITGGTSTVVCVWEMGTSKEKAKTVTLKQALLGHTDT
3070 3080 3090 3100 3110 3120
1670 1680 1690 1700 1710 1720
pF1KF0 VTCLAASVTFSLLVSGSQDCTCILWDLDHLTHVTRLPAHREGISAITISDVSGTIVSCAG
::: .::... ..::::.: :::.:::..:. .:.: .:: .::. :....: ::::::
CCDS36 VTCATASLAYHIIVSGSRDRTCIIWDLNKLSFLTQLRGHRAPVSALCINELTGDIVSCAG
3130 3140 3150 3160 3170 3180
1730 1740 1750 1760 1770 1780
pF1KF0 AHLSLWNVNGQPLASITTAWGPEGAITCCCLMEGPAWDTSQIIITGSQDGMVRVWKTEDV
... .:..::.:..:..: : : :::. : :::...:.:: .::.:: :. :
CCDS36 TYIHVWSINGNPIVSVNTFTGRSQQIICCCMSEMNEWDTQNVIVTGHSDGVVRFWRME--
3190 3200 3210 3220 3230 3240
1790 1800 1810 1820 1830 1840
pF1KF0 KMSVPGLQMGRKREAAEALAQQC-QAEGGRGDWGLSSAYRRNPQGLLPHSSQGRASGNHS
..:: . :. : . ..: .:. :. .:. . . . .. . : :
CCDS36 FLQVPETPAPEPAEVLE-MQEDCPEAQIGQEAQDEDSSDSEADEQSISQDPKDTPSQPSS
3250 3260 3270 3280 3290 3300
1850
pF1KF0 SAAQPSPWPMGLL
.. .:
CCDS36 TSHRPRAASCRATAAWCTDSGSDDSRRWSDQLSLDEKDGFIFVNYSEGQTRAHLQGPLSH
3310 3320 3330 3340 3350 3360
>>CCDS46817.1 NBEAL2 gene_id:23218|Hs108|chr3 (2754 aa)
initn: 1260 init1: 471 opt: 1149 Z-score: 1116.9 bits: 220.5 E(32554): 6.9e-56
Smith-Waterman score: 1188; 31.1% identity (55.6% similar) in 946 aa overlap (842-1742:1707-2577)
820 830 840 850 860 870
pF1KF0 VAQRQQTLEDAFKIDLSVKPGEREVKIEEVTPLWEETMLKAWQHYLASEKKSLASRSNVA
:: :.. . : : ... . . ..:
CCDS46 EPLGLQWGLPSLPPTNGSPTFFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKS---
1680 1690 1700 1710 1720 1730
880 890 900 910 920 930
pF1KF0 HHSKVTLWSGSLSSAMKLMPGRQAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQRR
: .:.. . :. :: . . . .: .::.. : . : ....
CCDS46 HDLMSGFWNACYDMLMSSGQRRQWERAQSRRAFQELVLEPAQRRAR-LEGLRYTAVLKQQ
1740 1750 1760 1770 1780 1790
940 950 960 970 980 990
pF1KF0 KCGNIKAANAWARIQEQLFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLEA
. : :. . .:: . : :. . : :.:. : .::: .: : .
CCDS46 ATQHSMALLHWGALWRQLASPCGAWALRDT--PIPRWKLSSAETYSRMRL---KLVPNHH
1800 1810 1820 1830 1840
1000 1010 1020 1030 1040 1050
pF1KF0 LSSGRHKESQDKNDHISQTNAENQDELTLREAEGEPDEVGVDCTQLTFFPALHESLHSED
.. : :.. :..... .: .: : . .:.. .: :.:. .::
CCDS46 FDP--HLEASALRDNLGEVPLTPTEEASLPLAVTKEAKVSTP-PEL-----LQEDQLGED
1850 1860 1870 1880 1890
1060 1070 1080 1090 1100
pF1KF0 FL-ELCRERQVI-LQELLDKEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPT
: :: .. :.: .: .. . .:: : . : :.: :. : : . :
CCDS46 ELAELETPMEAAELDEQREKLVLSAECQLVTVVA--VVPGLLEVTTQNVY----FYDGST
1900 1910 1920 1930 1940 1950
1110 1120 1130 1140 1150 1160
pF1KF0 GDVYCTRHCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFF
: . .. :. :..::.. :: :. :::.::
CCDS46 ERVETEEGIGYDFRRPL---------------------AQLREVHLRRFNLRRSALELFF
1960 1970 1980 1990
1170 1180 1190 1200
pF1KF0 HNGYSKFLVF-------------------------YNNDRSKAFKSFCSFQPSLKGKATS
. . :: : ... :..... . ..: .: .:
CCDS46 IDQANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQVYSWLLRLRPPSQGYLSS
2000 2010 2020 2030 2040 2050
1210 1220 1230 1240 1250 1260
pF1KF0 EDTLNLRRYPGSDRIMLQKWQKRDISNFEYLMYLNTAAGRTCNDYMQYPVFPWVLADYTS
.. .. : : . ::: .:.:::::::: ::: :::: :: ::::::::: ::.:
CCDS46 RSPQEMLRASG----LTQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFPWVLQDYVS
2060 2070 2080 2090 2100
1270 1280 1290 1300 1310 1320
pF1KF0 ETLNLANPKIFRDLSKPMGAQTKERKLKFIQRFKEVEKTEGDMTVQCHYYTHYSSAIIVA
::.:.:: .:::::::.:. . .. .... : : . . :: ::::.: :
CCDS46 PTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTID-KFHYGTHYSNAAGVM
2110 2120 2130 2140 2150 2160
1330 1340 1350 1360 1370 1380
pF1KF0 SYLVRMPPFTQAFCALQGGSFDVADRMFHSVKSTWESASRENMSDVRELTPEFFYLPEFL
::.:. :::. ::.: :: .::.:::: ..:. : :. .::.:: :::::.:.::
CCDS46 HYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQ-ARLESPADVKELIPEFFYFPDFL
2170 2180 2190 2200 2210 2220
1390 1400 1410 1420 1430 1440
pF1KF0 TNCNGVEFGCMQ-DGTVLGDVQLPPWADGDPRKFISLHRKALESDFVSANLHHWIDLIFG
: :: ..::.: . .::: :::::.. :. ::. ::.::::..:::.::.:::::::
CCDS46 ENQNGFDLGCLQLTNEKVGDVVLPPWASS-PEDFIQQHRQALESEYVSAHLHEWIDLIFG
2230 2240 2250 2260 2270 2280
1450 1460 1470 1480 1490 1500
pF1KF0 YKQQGPAAVDAVNIFHPYFYGDRMDLSSITDPLIKSTILGFVSNFGQVPKQLFTKPHPAR
:::.:::: .:.:.:. : .::. .:: .... :..:::::.: ::. .:::.:
CCDS46 YKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKEPHPTR
2290 2300 2310 2320 2330 2340
1510 1520 1530 1540 1550
pF1KF0 TAAGKP---LPGKDVSTPVSLPGHPQPFFYSLQSLRP--SQVTVKD---MYLFSLGSESP
.: . : :...: .: :. :. ..: :.: . : . ..:
CCDS46 LSAEEAAHRLARLDTNSP--------SIFQHLDELKAFFAEV-VSDGVPLVLALVPHRQP
2350 2360 2370 2380 2390
1560 1570 1580 1590 1600
pF1KF0 KGAIGHIVSTEKTILAVERNKVLLPPLW---NRTFSWGFDDFSC--CLGSYGSDKVLMT-
.. : . .. ...: . .: : .:..: :. :: .::. ....:
CCDS46 HSFITQ--GSPDLLVTVSASGLLGTHSWLPYDRNISNYFS-FSKDPTMGSHKTQRLLSGP
2400 2410 2420 2430 2440 2450
1610 1620 1630 1640 1650 1660
pF1KF0 -FENLAAWGRCLCAVCPSPTTIVTSGTSTVVCVWELSM-TKGRPRGLRLRQALYGHTQAV
. .. :. : :: :. . ..: :. :. . . ::: : : : : ..:
CCDS46 WVPGSGVSGQAL-AVAPDGKLLFSGGH------WDGSLRVTALPRGKLLSQ-LSCHLDVV
2460 2470 2480 2490 2500
1670 1680 1690 1700 1710 1720
pF1KF0 TCLAASVTFSLLVSGSQDCTCILWDLDHLTHVTRLPAHREGISAITISDVSGTIVSCAGA
:::: .. :.:::.: ::..: : : .. : . . . :. :::..
CCDS46 TCLALDTCGIYLISGSRDTTCMVWRLLHQGGLSVGLAPKP----VQVLYGHGAAVSCVAI
2510 2520 2530 2540 2550 2560
1730 1740 1750 1760 1770 1780
pF1KF0 HLSL-WNVNGQPLASITTAWGPEGAITCCCLMEGPAWDTSQIIITGSQDGMVRVWKTEDV
: :.:. ...
CCDS46 STELDMAVSGSEDGTVIIHTVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQSSAWE
2570 2580 2590 2600 2610 2620
>>CCDS55894.1 NBEA gene_id:26960|Hs108|chr13 (739 aa)
initn: 910 init1: 359 opt: 1140 Z-score: 1116.3 bits: 218.5 E(32554): 7.4e-56
Smith-Waterman score: 1140; 38.3% identity (63.1% similar) in 577 aa overlap (1147-1699:2-552)
1120 1130 1140 1150 1160 1170
pF1KF0 HCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFFHNGYSKF
....: . . :.:::. :::.:. : :
CCDS55 MFSEIRAVFSRRYLLQNTALEVFMANRTS--
10 20
1180 1190 1200 1210 1220
pF1KF0 LVFYNNDRSKAFKSFCSFQPSLKGKATSEDTLNLRR---------YPGSDRIMLQKWQKR
:..: . . :. : . : .:: . :: : .:. : :.::.:
CCDS55 -VMFNFPDQATVKKVVYSLPRV-GVGTSYGLPQARRISLATPRQLYKSSN--MTQRWQRR
30 40 50 60 70 80
1230 1240 1250 1260 1270 1280
pF1KF0 DISNFEYLMYLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTK
.::::::::.::: :::: :: :::::::::..: :: :.:. : :::::::.:: .
CCDS55 EISNFEYLMFLNTIAGRTYNDLNQYPVFPWVLTNYESEELDLTLPGNFRDLSKPIGALNP
90 100 110 120 130 140
1290 1300 1310 1320 1330 1340
pF1KF0 ERKLKFIQRFKEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDV
.: . . .:. : : :.. :: ::::.: . :.:::. ::: : . :.::
CCDS55 KRAVFYAERY---ETWEDDQSPPYHYNTHYSTATSTLSWLVRIEPFTTFFLNANDGKFDH
150 160 170 180 190 200
1350 1360 1370 1380 1390 1400
pF1KF0 ADRMFHSVKSTWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLGDVQLP
:: : :: .:....:.. :::.:: :::.::::...: :: ..: .: .:..::.::
CCDS55 PDRTFSSVARSWRTSQRDT-SDVKELIPEFYYLPEMFVNSNGYNLGVREDEVVVNDVDLP
210 220 230 240 250 260
1410 1420 1430 1440 1450 1460
pF1KF0 PWADGDPRKFISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRM
::: :. :. ..: ::::.::: .::.::::::::::.:: :: :.:.:: : .
CCDS55 PWAK-KPEDFVRINRMALESEFVSCQLHQWIDLIFGYKQRGPEAVRALNVFHYLTYEGSV
270 280 290 300 310 320
1470 1480 1490 1500 1510 1520
pF1KF0 DLSSITDPLIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKP--LPGKDVSTPVSLPGHP
.:.:::::... .. . ..::::.:.::. .::: :..: . :: ..:. . .
CCDS55 NLDSITDPVLREAMEAQIQNFGQTPSQLLIEPHPPRSSAMHLCFLP----QSPLMFKDQM
330 340 350 360 370
1530 1540 1550 1560 1570 1580
pF1KF0 QPFFYSLQSLRPSQVTVKDMYLFSLGSESPKGAIGHIVS-TEKTILAVER--NKVLL--P
: . .. ::. : . .: :. .: .:. : . ..::.: : : :
CCDS55 QQDVIMVLKF-PSNSPVTHVAANTL----PHLTIPAVVTVTCSRLFAVNRWHNTVGLRGA
380 390 400 410 420 430
1590 1600 1610 1620 1630
pF1KF0 PLW--NRTFSWGFDDFSCCLGSYGSDKVLMTFENLAAWGRCLCAVCPSPTTIVTSGTSTV
: . ... .. .. : .: .: .:. . . : : .::. . .
CCDS55 PGYSLDQAHHLPIEMDPLIANNSGVNKRQIT--DLVDQSIQINAHC----FVVTADNRYI
440 450 460 470 480
1640 1650 1660 1670 1680 1690
pF1KF0 -VC-VWELSMTKGRPRGLRLRQALYGHTQAVTCLAASVTF----SLLVSGSQDCTCILWD
.: :. :. . .: : ..:: ..::::: : .. .::::.: : .::
CCDS55 LICGFWDKSFRVYSTETGKLTQIVFGHWDVVTCLARSESYIGGDCYIVSGSRDATLLLWY
490 500 510 520 530 540
1700 1710 1720 1730 1740 1750
pF1KF0 LDHLTHVTRLPAHREGISAITISDVSGTIVSCAGAHLSLWNVNGQPLASITTAWGPEGAI
. :.
CCDS55 WSGRHHIIGDNPNSSDYPAPRAVLTGHDHEVVCVSVCAELGLVISGAKEGPCLVHTITGD
550 560 570 580 590 600
>>CCDS45026.1 NBEA gene_id:26960|Hs108|chr13 (2946 aa)
initn: 910 init1: 359 opt: 1140 Z-score: 1107.7 bits: 218.9 E(32554): 2.2e-55
Smith-Waterman score: 1140; 38.3% identity (63.1% similar) in 577 aa overlap (1147-1699:2209-2759)
1120 1130 1140 1150 1160 1170
pF1KF0 HCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFFHNGYSKF
....: . . :.:::. :::.:. : :
CCDS45 YFEVDEDDSAFKKIDTKVLAYTEGLHGKWMFSEIRAVFSRRYLLQNTALEVFMANRTS--
2180 2190 2200 2210 2220 2230
1180 1190 1200 1210 1220
pF1KF0 LVFYNNDRSKAFKSFCSFQPSLKGKATSEDTLNLRR---------YPGSDRIMLQKWQKR
:..: . . :. : . : .:: . :: : .:. : :.::.:
CCDS45 -VMFNFPDQATVKKVVYSLPRV-GVGTSYGLPQARRISLATPRQLYKSSN--MTQRWQRR
2240 2250 2260 2270 2280 2290
1230 1240 1250 1260 1270 1280
pF1KF0 DISNFEYLMYLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTK
.::::::::.::: :::: :: :::::::::..: :: :.:. : :::::::.:: .
CCDS45 EISNFEYLMFLNTIAGRTYNDLNQYPVFPWVLTNYESEELDLTLPGNFRDLSKPIGALNP
2300 2310 2320 2330 2340 2350
1290 1300 1310 1320 1330 1340
pF1KF0 ERKLKFIQRFKEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDV
.: . . .:. : : :.. :: ::::.: . :.:::. ::: : . :.::
CCDS45 KRAVFYAERY---ETWEDDQSPPYHYNTHYSTATSTLSWLVRIEPFTTFFLNANDGKFDH
2360 2370 2380 2390 2400
1350 1360 1370 1380 1390 1400
pF1KF0 ADRMFHSVKSTWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLGDVQLP
:: : :: .:....:.. :::.:: :::.::::...: :: ..: .: .:..::.::
CCDS45 PDRTFSSVARSWRTSQRDT-SDVKELIPEFYYLPEMFVNSNGYNLGVREDEVVVNDVDLP
2410 2420 2430 2440 2450 2460
1410 1420 1430 1440 1450 1460
pF1KF0 PWADGDPRKFISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRM
::: :. :. ..: ::::.::: .::.::::::::::.:: :: :.:.:: : .
CCDS45 PWAK-KPEDFVRINRMALESEFVSCQLHQWIDLIFGYKQRGPEAVRALNVFHYLTYEGSV
2470 2480 2490 2500 2510 2520
1470 1480 1490 1500 1510 1520
pF1KF0 DLSSITDPLIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKP--LPGKDVSTPVSLPGHP
.:.:::::... .. . ..::::.:.::. .::: :..: . :: ..:. . .
CCDS45 NLDSITDPVLREAMEAQIQNFGQTPSQLLIEPHPPRSSAMHLCFLP----QSPLMFKDQM
2530 2540 2550 2560 2570 2580
1530 1540 1550 1560 1570 1580
pF1KF0 QPFFYSLQSLRPSQVTVKDMYLFSLGSESPKGAIGHIVS-TEKTILAVER--NKVLL--P
: . .. ::. : . .: :. .: .:. : . ..::.: : : :
CCDS45 QQDVIMVLKF-PSNSPVTHVAANTL----PHLTIPAVVTVTCSRLFAVNRWHNTVGLRGA
2590 2600 2610 2620 2630
1590 1600 1610 1620 1630
pF1KF0 PLW--NRTFSWGFDDFSCCLGSYGSDKVLMTFENLAAWGRCLCAVCPSPTTIVTSGTSTV
: . ... .. .. : .: .: .:. . . : : .::. . .
CCDS45 PGYSLDQAHHLPIEMDPLIANNSGVNKRQIT--DLVDQSIQINAHC----FVVTADNRYI
2640 2650 2660 2670 2680 2690
1640 1650 1660 1670 1680 1690
pF1KF0 -VC-VWELSMTKGRPRGLRLRQALYGHTQAVTCLAASVTF----SLLVSGSQDCTCILWD
.: :. :. . .: : ..:: ..::::: : .. .::::.: : .::
CCDS45 LICGFWDKSFRVYSTETGKLTQIVFGHWDVVTCLARSESYIGGDCYIVSGSRDATLLLWY
2700 2710 2720 2730 2740 2750
1700 1710 1720 1730 1740 1750
pF1KF0 LDHLTHVTRLPAHREGISAITISDVSGTIVSCAGAHLSLWNVNGQPLASITTAWGPEGAI
. :.
CCDS45 WSGRHHIIGDNPNSSDYPAPRAVLTGHDHEVVCVSVCAELGLVISGAKEGPCLVHTITGD
2760 2770 2780 2790 2800 2810
>>CCDS58928.1 LRBA gene_id:987|Hs108|chr4 (2851 aa)
initn: 1032 init1: 337 opt: 1100 Z-score: 1068.7 bits: 211.7 E(32554): 3.3e-53
Smith-Waterman score: 1198; 33.4% identity (58.5% similar) in 802 aa overlap (919-1691:1939-2658)
890 900 910 920 930 940
pF1KF0 LMPGRQAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQRRKCGNIKAANAWARIQEQ
. :. :.::: :.. .: .
CCDS58 EDIHRHAEFESLCAQYSADKREDEKMCDHLIRAAKYRDHVT--------ATQLIQKIINI
1910 1920 1930 1940 1950 1960
950 960 970 980 990 1000
pF1KF0 LFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLEALSSGRHKESQDKNDHIS
: . : :... ..: :.::. : : :.:. : .:: .. : :. :. .
CCDS58 LTDKHGAWGNSAVSRPLEFWRLDYWEDDLRRRRRFVR-NPL----GSTHPEATLKT---A
1970 1980 1990 2000 2010
1010 1020 1030 1040 1050 1060
pF1KF0 QTNAENQDELTLREAEGEPDEVGVDCTQLTFFPALHESLHSEDFLELCRERQVILQELLD
.: ..: :. . . . .: .: . : :. ..: : :. :
CCDS58 VEHATDEDILAKGKQSIRSQALG---NQNSENEILLEG--DDDTLSSVDEK--------D
2020 2030 2040 2050
1070 1080 1090 1100 1110 1120
pF1KF0 KEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPTG-DVYCTRHCLSNISDPFI
:... :: . ..::. .:.. : ::: :. ..: . ::
CCDS58 LENLAGPVSLS-TPAQLVAPSVVVKG----------TLSVTSSELYFE----VDEEDP--
2060 2070 2080 2090 2100
1130 1140 1150 1160 1170 1180
pF1KF0 FNLCSKDRSTDHYSCQCHS---YADMRELRQARFLLQDIALEIFFHNGYSKFLVFYNNDR
:. . : . :. :. ....: . . :.:::. :::::. : . :..:
CCDS58 -NFKKIDPKILAYTEGLHGKWLFTEIRSIFSRRYLLQNTALEIFMAN---RVAVMFNFPD
2110 2120 2130 2140 2150
1190 1200 1210 1220 1230
pF1KF0 SKAFKSFCSFQPSLKGKATSEDTLNLRRYP-GSDRI------MLQKWQKRDISNFEYLMY
. :. .. : . : .:: . :: .: : : :.::.:.::::::::.
CCDS58 PATVKKVVNYLPRV-GVGTSFGLPQTRRISLASPRQLFKASNMTQRWQHREISNFEYLMF
2160 2170 2180 2190 2200 2210
1240 1250 1260 1270 1280 1290
pF1KF0 LNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERKLKFIQRF
::: :::. :: ::::::::...: :: :.:. : :::::::.:: . .: : .:.
CCDS58 LNTIAGRSYNDLNQYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAAFFAERY
2220 2230 2240 2250 2260 2270
1300 1310 1320 1330 1340 1350
pF1KF0 KEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDVADRMFHSVKS
:. : :.. . :: ::::.: .: ..:.:. ::: : ::::.:: ::: : :..
CCDS58 ---ESWEDDQVPKFHYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSSISR
2280 2290 2300 2310 2320 2330
1360 1370 1380 1390 1400 1410
pF1KF0 TWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLGDVQLPPWADGDPRKF
.:....:.. ::..:: :::.::::...: :. ..: :.::::..::.::::: ..:
CCDS58 AWRNSQRDT-SDIKELIPEFYYLPEMFVNFNNYNLGVMDDGTVVSDVELPPWAK-TSEEF
2340 2350 2360 2370 2380 2390
1420 1430 1440 1450 1460 1470
pF1KF0 ISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRMDLSSITDPLI
. ..: ::::.::: .::.::::::::::::: :: :.:.:. : ..:.:::::..
CCDS58 VHINRLALESEFVSCQLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDPVL
2400 2410 2420 2430 2440 2450
1480 1490 1500 1510 1520 1530
pF1KF0 KSTILGFVSNFGQVPKQLFTKPHPARTAAGKPLP-------GKDVSTPVSLPGHPQPFFY
. .. . . .:::.:.::. .::: : .: . : .:: ...:.. .: .
CCDS58 REAVEAQIRSFGQTPSQLLIEPHPPRGSAMQVSPLMFTDKAQQDVIMVLKFPSN-SPVTH
2460 2470 2480 2490 2500 2510
1540 1550 1560 1570 1580
pF1KF0 SLQSLRPSQ-----VTVKDMYLFSLGSESPKGAIGHIVSTEKTILAVERNKVLLPPLWNR
. .:. .:: ::.... : :. . : :: . ::
CCDS58 VAANTQPGLATPAVITVTANRLFAVNKWHNLPAHQGAVQDQPYQLPVE-----IDPL---
2520 2530 2540 2550 2560
1590 1600 1610 1620 1630 1640
pF1KF0 TFSWGFDDFSCCLGSYGSDKVLMTFENLAAWGRCLCAVCPSPTTIVTSGTSTV-VC-VWE
.. : . . . . ... . ..:. ..:: . . :: :.
CCDS58 --------IASNTGMHRRQITDLLDQSIQVHSQCF---------VITSDNRYILVCGFWD
2570 2580 2590 2600
1650 1660 1670 1680 1690
pF1KF0 LSMTKGRPRGLRLRQALYGHTQAVTCLAASVTF----SLLVSGSQDCTCILWDLDHLTHV
:. :: :...:: ..::::: : .. ..:::.: : .::
CCDS58 KSFRVYSTDTGRLIQVVFGHWDVVTCLARSESYIGGNCYILSGSRDATLLLWYWNGKCSG
2610 2620 2630 2640 2650 2660
1700 1710 1720 1730 1740 1750
pF1KF0 TRLPAHREGISAITISDVSGTIVSCAGAHLSLWNVNGQPLASITTAWGPEGAITCCCLME
CCDS58 IGDNPGETAAPRAILTGHDYEVTCAAVCAELGLVLSGSQEGPCLIHSMNGDLLRTLEGPE
2670 2680 2690 2700 2710 2720
>>CCDS3773.1 LRBA gene_id:987|Hs108|chr4 (2863 aa)
initn: 1054 init1: 342 opt: 1100 Z-score: 1068.7 bits: 211.7 E(32554): 3.3e-53
Smith-Waterman score: 1213; 33.8% identity (58.6% similar) in 804 aa overlap (919-1691:1939-2669)
890 900 910 920 930 940
pF1KF0 LMPGRQAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQRRKCGNIKAANAWARIQEQ
. :. :.::: :.. .: .
CCDS37 EDIHRHAEFESLCAQYSADKREDEKMCDHLIRAAKYRDHVT--------ATQLIQKIINI
1910 1920 1930 1940 1950 1960
950 960 970 980 990 1000
pF1KF0 LFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLEALSSGRHKESQDKNDHIS
: . : :... ..: :.::. : : :.:. : .:: .. : :. :
CCDS37 LTDKHGAWGNSAVSRPLEFWRLDYWEDDLRRRRRFVR-NPL----GSTHPEATLK-----
1970 1980 1990 2000 2010
1010 1020 1030 1040 1050 1060
pF1KF0 QTNAENQDELTLREAEGEPDE-VGVDCTQLTFFPAL-HESLHSEDFLELCRERQVILQEL
: .:. . ::: :: . . : :: ... ..: .:: . ..:
CCDS37 -TAVEHVCIFKLRENSKATDEDILAKGKQSIRSQALGNQNSENEILLEGDDDTLSSVDEK
2020 2030 2040 2050 2060
1070 1080 1090 1100 1110 1120
pF1KF0 LDKEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPTG-DVYCTRHCLSNISDP
: :... :: . ..::. .:.. : ::: :. ..: . ::
CCDS37 -DLENLAGPVSLS-TPAQLVAPSVVVKG----------TLSVTSSELYFE----VDEEDP
2070 2080 2090 2100 2110
1130 1140 1150 1160 1170 1180
pF1KF0 FIFNLCSKDRSTDHYSCQCHS---YADMRELRQARFLLQDIALEIFFHNGYSKFLVFYNN
:. . : . :. :. ....: . . :.:::. :::::. : . :..:
CCDS37 ---NFKKIDPKILAYTEGLHGKWLFTEIRSIFSRRYLLQNTALEIFMAN---RVAVMFNF
2120 2130 2140 2150 2160
1190 1200 1210 1220 1230
pF1KF0 DRSKAFKSFCSFQPSLKGKATSEDTLNLRRYP-GSDRI------MLQKWQKRDISNFEYL
. :. .. : . : .:: . :: .: : : :.::.:.:::::::
CCDS37 PDPATVKKVVNYLPRV-GVGTSFGLPQTRRISLASPRQLFKASNMTQRWQHREISNFEYL
2170 2180 2190 2200 2210 2220
1240 1250 1260 1270 1280 1290
pF1KF0 MYLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERKLKFIQ
:.::: :::. :: ::::::::...: :: :.:. : :::::::.:: . .: : .
CCDS37 MFLNTIAGRSYNDLNQYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAAFFAE
2230 2240 2250 2260 2270 2280
1300 1310 1320 1330 1340 1350
pF1KF0 RFKEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDVADRMFHSV
:. :. : :.. . :: ::::.: .: ..:.:. ::: : ::::.:: ::: : :.
CCDS37 RY---ESWEDDQVPKFHYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSSI
2290 2300 2310 2320 2330 2340
1360 1370 1380 1390 1400 1410
pF1KF0 KSTWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLGDVQLPPWADGDPR
. .:....:.. ::..:: :::.::::...: :. ..: :.::::..::.::::: .
CCDS37 SRAWRNSQRDT-SDIKELIPEFYYLPEMFVNFNNYNLGVMDDGTVVSDVELPPWAK-TSE
2350 2360 2370 2380 2390 2400
1420 1430 1440 1450 1460 1470
pF1KF0 KFISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRMDLSSITDP
.:. ..: ::::.::: .::.::::::::::::: :: :.:.:. : ..:.:::::
CCDS37 EFVHINRLALESEFVSCQLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDP
2410 2420 2430 2440 2450 2460
1480 1490 1500 1510 1520
pF1KF0 LIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKPLP-------GKDVSTPVSLPGHPQPF
... .. . . .:::.:.::. .::: : .: . : .:: ...:.. .:
CCDS37 VLREAVEAQIRSFGQTPSQLLIEPHPPRGSAMQVSPLMFTDKAQQDVIMVLKFPSN-SPV
2470 2480 2490 2500 2510 2520
1530 1540 1550 1560 1570 1580
pF1KF0 FYSLQSLRPSQ-----VTVKDMYLFSLGSESPKGAIGHIVSTEKTILAVERNKVLLPPLW
. . .:. .:: ::.... : :. . : :: . ::
CCDS37 THVAANTQPGLATPAVITVTANRLFAVNKWHNLPAHQGAVQDQPYQLPVE-----IDPL-
2530 2540 2550 2560 2570
1590 1600 1610 1620 1630 1640
pF1KF0 NRTFSWGFDDFSCCLGSYGSDKVLMTFENLAAWGRCLCAVCPSPTTIVTSGTSTV-VC-V
.. : . . . . ... . ..:. ..:: . . ::
CCDS37 ----------IASNTGMHRRQITDLLDQSIQVHSQCF---------VITSDNRYILVCGF
2580 2590 2600 2610
1650 1660 1670 1680 1690
pF1KF0 WELSMTKGRPRGLRLRQALYGHTQAVTCLAASVTF----SLLVSGSQDCTCILWDLDHLT
:. :. :: :...:: ..::::: : .. ..:::.: : .::
CCDS37 WDKSFRVYSTDTGRLIQVVFGHWDVVTCLARSESYIGGNCYILSGSRDATLLLWYWNGKC
2620 2630 2640 2650 2660 2670
1700 1710 1720 1730 1740 1750
pF1KF0 HVTRLPAHREGISAITISDVSGTIVSCAGAHLSLWNVNGQPLASITTAWGPEGAITCCCL
CCDS37 SGIGDNPGSETAAPRAILTGHDYEVTCAAVCAELGLVLSGSQEGPCLIHSMNGDLLRTLE
2680 2690 2700 2710 2720 2730
>>CCDS46495.1 NBEAL1 gene_id:65065|Hs108|chr2 (2694 aa)
initn: 887 init1: 450 opt: 1092 Z-score: 1061.2 bits: 210.2 E(32554): 8.6e-53
Smith-Waterman score: 1154; 29.8% identity (55.7% similar) in 1010 aa overlap (853-1795:1682-2626)
830 840 850 860 870
pF1KF0 FKIDLSVKPGEREVKIEEVTPLWEETMLKAWQ----HYLASEKKSLASRSNVAHHSKVTL
:: .:.. :. ... : ...:
CCDS46 FMNLHLPSLPFTNGSSSFFEDFQEYCNSNEWQVYIEKYIVPYMKQYEAHTFYDGHENMAL
1660 1670 1680 1690 1700 1710
880 890 900 910 920 930
pF1KF0 -WSGSLSSAMKLMPGRQAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQRRKCGNIK
:. . : : :. . : : . .: . :.... :.. ... . ..
CCDS46 YWKDCYEALMVNMHKRDREGGESKLKFQELFVEPFNRKARQENLR-YNNMLKQLSSQQLA
1720 1730 1740 1750 1760 1770
940 950 960 970 980 990
pF1KF0 AANAWARIQEQLFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLEALSSGRH
. : :: : : : :.. ... : :.: :. .::: .: : ... :
CCDS46 TLRRWKAIQLYLTCERGPWAKRKQN-PIH-WKLANVENYSRMR---LKLVPNYNFKT--H
1780 1790 1800 1810 1820
1000 1010 1020 1030 1040 1050
pF1KF0 KESQDKNDHIS-QTNAENQDELTLREAEGEPDEVGVDCTQLTFFPALHESLHSEDFLELC
.:.. :... : . ..: : :. .. .: : : :: :.:
CCDS46 EEASALRDNLGIQHSQPSSDTLLLEVVK----QVKV-------------SDMVEDKLDLP
1830 1840 1850 1860
1060 1070 1080 1090 1100 1110
pF1KF0 RERQVILQELLDKEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPTGDVYCTR
.: . .. .::. :: .::... :: .:. :: :
CCDS46 EEDITARVNVDEKEEQDQKEKLVLMED-----------------CELITII---DVIPGR
1870 1880 1890 1900
1120 1130 1140 1150 1160 1170
pF1KF0 HCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFFHNGYSKF
... : . :. .. :: ..::.. :. :. ::::: . . :
CCDS46 LEITTQHIYFYDGSIEKEDGVGFDFKWPHS--QIREIHLRRYNLRRSALEIFHVDQSNYF
1910 1920 1930 1940 1950 1960
1180 1190 1200 1210 1220 1230
pF1KF0 LVFYNNDRSKAFKSFCSFQPSLKGKATSEDTLNLRRYPGSDRIMLQKWQKRDISNFEYLM
: : .. :.: .. . :.. : .. :.. .: . : . ::: .:.::::.::.
CCDS46 LNFKKEVRNKIYSRLLSLH-SPNSYYGSRSPQELFKASG----LTQKWVNREISNFDYLI
1970 1980 1990 2000 2010
1240 1250 1260 1270 1280 1290
pF1KF0 YLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERKLKFIQR
.:: :::: :: :::::::.: ::::: :.: :: .:::::::.:. ... . ..
CCDS46 QINTMAGRTYNDLAQYPVFPWILQDYTSEELDLNNPAVFRDLSKPIGVVNEKNAKAMREK
2020 2030 2040 2050 2060 2070
1300 1310 1320 1330 1340 1350
pF1KF0 FKEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDVADRMFHSVK
... : : . . :: ::::.. : ::.:. ::: ::.: :: :::.:::.
CCDS46 YENFEDPMGTID-KFHYGTHYSNSAGVMHYLIRVEPFTTLHIQLQSGRFDCADRQFHSIP
2080 2090 2100 2110 2120 2130
1360 1370 1380 1390 1400 1410
pF1KF0 STWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQ-DGTVLGDVQLPPWADGDPR
.::. : .: ::.:: :::::.:::: : : ..: .: . ...:: :: :: . .
CCDS46 ATWQ-ALMDNPYDVKELIPEFFYFPEFLENQNQFNLGRLQISKELVNDVILPKWAKS-AE
2140 2150 2160 2170 2180 2190
1420 1430 1440 1450 1460 1470
pF1KF0 KFISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRMDLSSITDP
:: :::::::..:::.::.::::::::::.:::::.:.:.:. : .::...::
CCDS46 DFIYKHRKALESEYVSAHLHEWIDLIFGYKQRGPAAVEALNVFYYCSYEGAVDLDALTDE
2200 2210 2220 2230 2240 2250
1480 1490 1500 1510 1520 1530
pF1KF0 LIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKPL--PGKDVSTPVSLPGH-PQ--PFFY
.... :...::::.: ::. .::: : .: . . : : .. ..: : :. ::
CCDS46 KERKALEGMINNFGQTPCQLLKEPHPPRLSAEEAVQKPTKIDTSTLNLFQHLPELKSFFI
2260 2270 2280 2290 2300 2310
1540 1550 1560 1570
pF1KF0 -SLQSLRPS-QVTV-KDMYLFSLGSESPKGAI----GHIVST------EKTI---LAVER
.... : ..:. :..: ... ::. : .....: ...: .. .
CCDS46 EGISDGIPLLKATIPKNQYRSFMSQGSPELLITISMNYVIGTHGWLPYDRNISNYFTFIK
2320 2330 2340 2350 2360 2370
1580 1590 1600
pF1KF0 NKVLLPPLWNRT-------------------------FSWGFDDFSCCLGSYGSDKVLMT
.... : .:. :: :. : : . : . :..
CCDS46 DQTVTNPKTQRSINGSFAPGLEITSKLFVVSHDAKLLFSAGYWDNSIQVMSLTKGKIISH
2380 2390 2400 2410 2420 2430
1610 1620 1630 1640 1650 1660
pF1KF0 FENLAAWGRCLCA-VCPSPTTIVTSGTSTVVC-VWELSMTKGRPRGLRLR--QALYGHTQ
. :: . : . ::. ..: .:.... : : :: . : :::::.
CCDS46 IIRHMDIVTCLATDYCG---IHLISGSRDTTCMIWQITQQGGVPVGLASKPFQILYGHTN
2440 2450 2460 2470 2480 2490
1670 1680 1690 1700 1710 1720
pF1KF0 AVTCLAASVTFSLLVSGSQDCTCILWDLDHLTHVTRLPAHREGISAITISDVS----GTI
: .. :. ... ::::.: : :. ... .. : :. .:: ... : :
CCDS46 EVLSVGISTELDMAVSGSRDGTVIIHTIQKGQYMRTLRPPCESSLFLTIPNLAISWEGHI
2500 2510 2520 2530 2540 2550
1730 1740 1750 1760 1770
pF1KF0 V--SCAGAHLSLWNVNGQPLASITTAW-GPE---GAITCCCLMEGPAWDTSQIIITGSQD
: : . . .: . :. : ::. . : . .. :.. .. :.::: .
CCDS46 VVYSSTEEKTTLKDKNALHLFSINGKYLGSQILKEQVSDICII-------GEHIVTGSIQ
2560 2570 2580 2590 2600
1780 1790 1800 1810 1820 1830
pF1KF0 GMVRVWKTEDVKMSVPGLQMGRKREAAEALAQQCQAEGGRGDWGLSSAYRRNPQGLLPHS
:.. . .....:. : :
CCDS46 GFLSIRDLHSLNLSINPLAMRLPIHCVCVTKEYSHILVGLEDGKLIVVGVGKPAEMRSGQ
2610 2620 2630 2640 2650 2660
>>CCDS31062.1 LYST gene_id:1130|Hs108|chr1 (3801 aa)
initn: 1178 init1: 648 opt: 778 Z-score: 751.8 bits: 153.4 E(32554): 1.5e-35
Smith-Waterman score: 1345; 27.6% identity (54.6% similar) in 1298 aa overlap (584-1787:2533-3740)
560 570 580 590 600 610
pF1KF0 RKLREFTQLLLRELLLGASSPKQWLPLEVLLEASPDHATSQQKRDFQSEVLLSAMELFHM
:. : .. :... .: .:: .:::...
CCDS31 LFIAVTIHACSSSGSQYFRVIEDLIVMLGYLQNSKNKRTQNMAVALQLRVLQAAMEFIRT
2510 2520 2530 2540 2550 2560
620 630 640 650 660
pF1KF0 TSGGDAAMFRDGKEPQPSAEAAAA----PSLANISCFTQKLVEKLYSGMFSA--DPRHIL
:.. :. . :. . .::: :. :.:. : .:.: : :. : :..
CCDS31 TANHDSENLTDSLQ-SPSAPHHAVVQKRKSIAGPRKFPLAQTESLLMKMRSVANDELHVM
2570 2580 2590 2600 2610 2620
670 680 690 700 710
pF1KF0 L---FILEHIMVVIETASSQRDTVLSTL------YSSLNKVILYCLSKPQ---QSLSECL
. . :. . :: .:: :..: :. .:. :. : :. :: . .
CCDS31 MQRRMSQENPSQATETELAQRLQRLTVLAVNRIIYQEFNSDIIDILRTPENVTQSKTSVF
2630 2640 2650 2660 2670 2680
720 730 740 750 760
pF1KF0 GLLSILGFLQEHWDVVFATYNSNI-SFLLCLMHCLLLLNERSYPEG------FGLEPKPR
.... . :: ....: ..:. .. . .. : . .. . :
CCDS31 QTEISEENIHHEQSSVFNPFQKEIFTYLVEGFKVSIGSSKASGSKQQWTKILWSCKETFR
2690 2700 2710 2720 2730 2740
770 780 790 800 810 820
pF1KF0 MSTYHQV--FLSPNEDVKEKREDLPSLSDVQHNIQKTVQTLWQQLVAQRQQTLEDAFKID
:. . . .::: . ..:... . . . .:. . : . : . :. . .. ..
CCDS31 MQLGRLLVHILSPAHAAQERKQIFEIVHEPNHQ-----EILRDCLSPSLQHGAKLVLYLS
2750 2760 2770 2780 2790
830 840 850 860 870
pF1KF0 LSVKPGEREVKIEEV-TPLWEETMLKAWQHYL----ASEKKSLAS-------RSNVAHHS
.. . :. ::. : . :: : :: : .: . . .. .
CCDS31 ELIHNHQGELTEEELGTAELLMNALKLCGHKCIPPSASTKADLIKMIKEEQKKYETEEGV
2800 2810 2820 2830 2840 2850
880 890 900 910 920 930
pF1KF0 KVTLWSGSLSSAMKLMPGR---QAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQRR
. . :. .... .. . : ..:: . :... . .:.: . .:..
CCDS31 NKAAWQKTVNNNQQSLFQRLDSKSKDISKIAADITQAVS--LSQGNERKKVI--QHIRGM
2860 2870 2880 2890 2900 2910
940 950 960 970 980 990
pF1KF0 KCGNIKAANAWARIQEQLFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLEA
...:. : .. .:: . ..: : : :.:: ::: : :.:..:
CCDS31 YKVDLSASRHWQELIQQLTHDRAVW-YDPIYYPTS-WQLDPTEGPNRERRRLQRC-----
2920 2930 2940 2950 2960
1000 1010 1020 1030 1040 1050
pF1KF0 LSSGRHKESQDKNDHISQTNAENQDELTLREAEGEPDEVGVDCTQLTFFPALHESLHSED
... : . ::. . : : . : : : :. :
CCDS31 --------------YLTIPN-----KYLLRDRQKSEDVVKPPLSYL-FEDKTHSSFSST-
2970 2980 2990 3000
1060 1070 1080 1090 1100 1110
pF1KF0 FLELCRERQVILQELLDKEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPTGD
... .:.. . . : . : ::.:. .:. :. . .
CCDS31 -----------VKDKAASESIRVNRRCISVAPSRETAGELLLGKCGMYFVED---NASDT
3010 3020 3030 3040 3050
1120 1130 1140 1150 1160 1170
pF1KF0 VYCTRHCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFFHN
: . :.. .: :. .: ...:... . :.: :.:::. :
CCDS31 VESSS--LQGELEPASFSW---------------TYEEIKEVHKRWWQLRDNAVEIFLTN
3060 3070 3080 3090
1180 1190 1200 1210 1220 1230
pF1KF0 GYSKFLVFYNNDRSKAFKSFCSFQPSLKGKATSEDTLNLRRYPGSDRIMLQKWQKRDISN
: . .:.: : .:. . .. . ... :: .: :. . . : .:.:
CCDS31 GRTLLLAF---DNTKV-------RDDVYHNILTNNLPNLLEY-GNITALTNLWYTGQITN
3100 3110 3120 3130 3140
1240 1250 1260 1270 1280 1290
pF1KF0 FEYLMYLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERKL
:::: .:: :::. :: :::::::..::::.::::.: . :.:.::::...: ::..
CCDS31 FEYLTHLNKHAGRSFNDLMQYPVFPFILADYVSETLDLNDLLIYRNLSKPIAVQYKEKED
3150 3160 3170 3180 3190 3200
1300 1310 1320 1330 1340
pF1KF0 KFIQRFKEVEKT------EGDMT--VQ-CHYYTHYSSAIIVASYLVRMPPFTQAFCALQG
.... .: .:. : : :: :: .:::.. : .::::::::. : : :
CCDS31 RYVDTYKYLEEEYRKGAREDDPMPPVQPYHYGSHYSNSGTVLHFLVRMPPFTKMFLAYQD
3210 3220 3230 3240 3250 3260
1350 1360 1370 1380 1390 1400
pF1KF0 GSFDVADRMFHSVKSTWESASRENMSDVRELTPEFFYLPEFLTNCNGVEFGCMQDGTVLG
:::. :: :::...::. .: :.:.::.:: ::::::::::.: .: .:: :.: ..
CCDS31 QSFDIPDRTFHSTNTTWRLSSFESMTDVKELIPEFFYLPEFLVNREGFDFGVRQNGERVN
3270 3280 3290 3300 3310 3320
1410 1420 1430 1440 1450 1460
pF1KF0 DVQLPPWADGDPRKFISLHRKALESDFVSANLHHWIDLIFGYKQQGPAAVDAVNIFHPY-
:.::::: .::: :: .::.:::::.:: :. .::::.:::::.: :.:.:.:.:::
CCDS31 HVNLPPWARNDPRLFILIHRQALESDYVSQNICQWIDLVFGYKQKGKASVQAINVFHPAT
3330 3340 3350 3360 3370 3380
1470 1480 1490 1500 1510 1520
pF1KF0 FYGDRMDLSSITDPLIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKPLPGKDVSTPVSL
..: ::.:.. ::. . .. .....::.:.::: : .: .: . :. :...
CCDS31 YFG--MDVSAVEDPVQRRALETMIKTYGQTPRQLFHMAHVSRPGAKLNIEGE---LPAAV
3390 3400 3410 3420 3430
1530 1540 1550 1560
pF1KF0 PGHPQ-PFFYSLQSLR----PSQVT-VKDM-YLFSLGSES----------PKGA-IGHIV
: : . .... :: .. .: . . .:: : :.: .: .
CCDS31 GLLVQFAFRETREQVKEITYPSPLSWIKGLKWGEYVGSPSAPVPVVCFSQPHGERFGSLQ
3440 3450 3460 3470 3480 3490
1570 1580 1590 1600
pF1KF0 STE-KTILAVERNKVLLPPL---------------WNRTFSWGFDDFSCCLGSYGSDKVL
. ..: .. :: :: :. .:::. : : : :. .
CCDS31 ALPTRAICGLSRNFCLLMTYSKEQGVRSMNSTDIQWSAILSWGYADNILRLKSKQSEPPV
3500 3510 3520 3530 3540 3550
1610 1620 1630 1640 1650 1660
pF1KF0 MTFENLAAWGRCLCAVCPSPTTIVTSGTSTVVCVWELSMTKGRPRGLRLRQA--LYGHTQ
... . :: :. . :.. :. .. .:.. : .... :::::.
CCDS31 NFIQSSQQYQVTSCAWVPDSCQLFTGSKCGVITAYTNRFTSSTPSEIEMETQIHLYGHTE
3560 3570 3580 3590 3600 3610
1670 1680 1690 1700 1710 1720
pF1KF0 AVTCLAASVTFSLLVSGSQDCTCILWDLDHLTHVTRLPAHREGISAITISDVSGTIVS-C
.: : . .:.:.: :.: :::.:::..: .: : .:. ..:.. :..:: :.. :
CCDS31 EITSLFVCKPYSILISVSRDGTCIIWDLNRLCYVQSLAGHKSPVTAVSASETSGDIATVC
3620 3630 3640 3650 3660 3670
1730 1740 1750 1760 1770
pF1KF0 ----AGAHLSLWNVNGQPLASITTAWGPEGAITCCCLMEG-PAWDTSQIIITGSQDGMVR
.:. : ::.:::. .. . : : . . : . ..: : ..:.::
CCDS31 DSAGGGSDLRLWTVNGDLVGHVHCR-----EIICSVAFSNQPEGVSINVIAGGLENGIVR
3680 3690 3700 3710 3720 3730
1780 1790 1800 1810 1820 1830
pF1KF0 VWKTEDVKMSVPGLQMGRKREAAEALAQQCQAEGGRGDWGLSSAYRRNPQGLLPHSSQGR
.:.: :.:
CCDS31 LWSTWDLKPVREITFPKSNKPIISLTFSCDGHHLYTANSDGTVIAWCRKDQQRLKQPMFY
3740 3750 3760 3770 3780 3790
>>CCDS6173.1 NSMAF gene_id:8439|Hs108|chr8 (917 aa)
initn: 782 init1: 332 opt: 576 Z-score: 562.9 bits: 116.4 E(32554): 4.9e-25
Smith-Waterman score: 997; 31.3% identity (56.8% similar) in 718 aa overlap (1118-1789:198-879)
1090 1100 1110 1120 1130 1140
pF1KF0 EGVLLFGHQHFYICENFTLSPTGDVYCTRHCLSNISDPFIFN---LCSKDRSTDHYSCQC
: ... :.. : .: : :. :
CCDS61 MITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITD--TNLYFQPL
170 180 190 200 210 220
1150 1160 1170 1180 1190
pF1KF0 HSYA---------DMRELRQARFLLQDIALEIFFHNG---YSKFLVFYN-NDRSKAFKSF
..: :.:.. . : :. ..::.: . . .: ::. .::. . .
CCDS61 NGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFYEPQDRDDLYFYI
230 240 250 260 270 280
1200 1210 1220 1230 1240 1250
pF1KF0 CSFQPSLKGKATSEDTLNLRRYPGSDRIMLQKWQKRDISNFEYLMYLNTAAGRTCNDYMQ
.. .. :.:. ::: ::. .::..::..::. : :.::: :
CCDS61 ATYLEHHVAEHTAES------------YMLQ-WQRGHLSNYQYLLHLNNLADRSCNDLSQ
290 300 310 320 330
1260 1270 1280 1290 1300 1310
pF1KF0 YPVFPWVLADYTSETLNLANPKIFRDLSKPMGAQTKERKLKFIQRFKEVEKTEGDMTVQC
::::::.. ::.: :.:.:: :::::::.:: .::: ... :..:. . .
CCDS61 YPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEP------KF
340 350 360 370 380
1320 1330 1340 1350 1360 1370
pF1KF0 HYYTHYSSAIIVASYLVRMPPFTQAFCALQGGSFDVADRMFHSVKSTWESASRENMSDVR
: .:::: : ::::. : .: ::.: :: :::::.:. ::.. .. .: .
CCDS61 MYGSHYSSPGYVLFYLVRIAP-EYMLC-LQNGRFDNADRMFNSIAETWKNCL-DGATDFK
390 400 410 420 430 440
1380 1390 1400 1410 1420 1430
pF1KF0 ELTPEFFYLP-EFLTNCNGVEFGCMQDGTVLGDVQLPPWADGDPRKFISLHRKALESDFV
:: :::. ::.: ...: : : .. ::.:::::.. :. :.. . ::::..:
CCDS61 ELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASS-PEDFLQKSKDALESNYV
450 460 470 480 490 500
1440 1450 1460 1470 1480 1490
pF1KF0 SANLHHWIDLIFGYKQQGPAAVDAVNIFHPYFYGDRMDLSSITDPLIKSTILGFVSNFGQ
: .::.::::::::::.: :: : :.::: : .::.:: :: : ..: . .:::
CCDS61 SEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQ
510 520 530 540 550 560
1500 1510 1520 1530 1540
pF1KF0 VPKQLFTKPHPAR-TAAGKPLPGKDVSTPVSLPGHP-QPFFYSL--QSLRPSQVTVKDMY
.:::::. ::: : : : : .. : .:. : . : .: .: . .. .
CCDS61 TPKQLFVTPHPRRITPKFKSL-SQTSSYNASMADSPGEESFEDLTEESKTLAWNNITKLQ
570 580 590 600 610 620
1550 1560 1570 1580 1590 1600
pF1KF0 LFSLGSESPKGAIGHIVSTE-KTILAVERNKVLL-----PPLWNRTFSWGFDDFSCCLGS
: . ... : :: . ...... ....: . .:..:.. .: ::
CCDS61 LHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTLKMFSKESKMLQRSISFSNMALSSCLLL
630 640 650 660 670 680
1610 1620 1630 1640
pF1KF0 YGSDKVLMT-FENLA-----AWGR----------CLCAVCPSPTTIVTSGTSTVVCVWEL
:. :. . ..: . :.:: . .: . . ... ...: ::
CCDS61 PGDATVITSSWDNNVYFYSIAFGRRQDTLMGHDDAVSKICWHDNRLYSASWDSTVKVWSG
690 700 710 720 730 740
1650 1660 1670 1680 1690 1700
pF1KF0 --SMTKGRPRGLRLRQALYGHTQAVTCLAASVTFSLLVSGSQDCTCILWDLDHLTHVTRL
. : : : : .: .. ... .:::::... : .::: : . ..
CCDS61 VPAEMPGTKRHHFDLLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQI
750 760 770 780 790 800
1710 1720 1730 1740 1750 1760
pF1KF0 PAHREGISAITISDVSGTIVSCA-GAHLSLWNVNGQPLASITTAWGPEGAITCCCLMEGP
: : . ..: : ..: . . :.. .:. : : :. :. :..
CCDS61 PCHSGIVCDTAFSPDSRHVLSTGTDGCLNVIDVQTGMLISSMTSDEPQR-----CFV---
810 820 830 840 850
1770 1780 1790 1800 1810 1820
pF1KF0 AWDTSQIIITGSQDGMVRVWKTEDVKMSVPGLQMGRKREAAEALAQQCQAEGGRGDWGLS
:: .... .:::.: . :: .:.:
CCDS61 -WDGNSVL-SGSQSGELLVWDLLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQII
860 870 880 890 900 910
1858 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 01:12:12 2016 done: Sat Nov 5 01:12:14 2016
Total Scan time: 6.330 Total Display time: 0.870
Function used was FASTA [36.3.4 Apr, 2011]