FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2267, 948 aa 1>>>pF1KE2267 948 - 948 aa - 948 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9081+/-0.00117; mu= 13.3369+/- 0.069 mean_var=129.3732+/-27.017, 0's: 0 Z-trim(104.2): 151 B-trim: 54 in 1/50 Lambda= 0.112759 statistics sampled from 7708 (7883) to 7708 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.596), E-opt: 0.2 (0.236), width: 16 Scan time: 2.110 The best scores are: opt bits E(33420) CCDS47864.1 NSMAF gene_id:8439|Hs109|chr8 ( 948) 6429 1058.7 0 CCDS6173.1 NSMAF gene_id:8439|Hs109|chr8 ( 917) 6064 999.3 0 CCDS58928.1 LRBA gene_id:987|Hs109|chr4 (2851) 982 172.9 8e-42 CCDS3773.1 LRBA gene_id:987|Hs109|chr4 (2863) 982 172.9 8e-42 CCDS3609.1 WDFY3 gene_id:23001|Hs109|chr4 (3526) 979 172.5 1.3e-41 CCDS55894.1 NBEA gene_id:26960|Hs109|chr13 ( 739) 965 169.7 1.9e-41 CCDS45026.1 NBEA gene_id:26960|Hs109|chr13 (2946) 965 170.2 5.6e-41 CCDS46817.1 NBEAL2 gene_id:23218|Hs109|chr3 (2754) 955 168.5 1.6e-40 CCDS46495.1 NBEAL1 gene_id:65065|Hs109|chr2 (2694) 945 166.9 4.9e-40 CCDS31062.1 LYST gene_id:1130|Hs109|chr1 (3801) 620 114.1 5.3e-24 CCDS44385.1 WDFY4 gene_id:57705|Hs109|chr10 (3184) 576 106.9 6.6e-22 >>CCDS47864.1 NSMAF gene_id:8439|Hs109|chr8 (948 aa) initn: 6429 init1: 6429 opt: 6429 Z-score: 5660.2 bits: 1058.7 E(33420): 0 Smith-Waterman score: 6429; 100.0% identity (100.0% similar) in 948 aa overlap (1-948:1-948) 10 20 30 40 50 60 pF1KE2 MTGQARFHRGAEACRAIRQCRSRRPRAAHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MTGQARFHRGAEACRAIRQCRSRRPRAAHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 EYYFEQHRANHILHKGSHHERKIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EYYFEQHRANHILHKGSHHERKIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 ENGANRHFTKAKSGGISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ENGANRHFTKAKSGGISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVET 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 LLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LKFYEPQDRDDLYFYIATYLEHHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LKFYEPQDRDDLYFYIATYLEHHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCND 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 SHYSSPGYVLFYLVRIAPEYMLCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SHYSSPGYVLFYLVRIAPEYMLCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 YGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 YGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEW 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 IDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 IDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 TPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIH 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 KEAVTGITVSRNGSSVFTTSQDSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KEAVTGITVSRNGSSVFTTSQDSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVIT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 SSWDNNVYFYSIAFGRRQDTLMGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SSWDNNVYFYSIAFGRRQDTLMGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGT 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 KRHHFDLLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KRHHFDLLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVC 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 DTAFSPDSRHVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DTAFSPDSRHVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELL 850 860 870 880 890 900 910 920 930 940 pF1KE2 VWDLLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY :::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VWDLLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY 910 920 930 940 >>CCDS6173.1 NSMAF gene_id:8439|Hs109|chr8 (917 aa) initn: 6064 init1: 6064 opt: 6064 Z-score: 5339.5 bits: 999.3 E(33420): 0 Smith-Waterman score: 6064; 100.0% identity (100.0% similar) in 897 aa overlap (52-948:21-917) 30 40 50 60 70 80 pF1KE2 SRRPRAAHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLEEYYFEQHRANHILHKGSHHER :::::::::::::::::::::::::::::: CCDS61 MAFIRKKQQEQQLQLYSKERFSLLLLNLEEYYFEQHRANHILHKGSHHER 10 20 30 40 50 90 100 110 120 130 140 pF1KE2 KIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHGENGANRHFTKAKSGGISLIFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHGENGANRHFTKAKSGGISLIFS 60 70 80 90 100 110 150 160 170 180 190 200 pF1KE2 QVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 QVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMIT 120 130 140 150 160 170 210 220 230 240 250 260 pF1KE2 AILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLNGYPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 AILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLNGYPK 180 190 200 210 220 230 270 280 290 300 310 320 pF1KE2 PVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFYEPQDRDDLYFYIATYLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFYEPQDRDDLYFYIATYLE 240 250 260 270 280 290 330 340 350 360 370 380 pF1KE2 HHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDL 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE2 SNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYGSHYSSPGYVLFYLVRIAPEYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 SNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYGSHYSSPGYVLFYLVRIAPEYM 360 370 380 390 400 410 450 460 470 480 490 500 pF1KE2 LCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQG 420 430 440 450 460 470 510 520 530 540 550 560 pF1KE2 GQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 GQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVF 480 490 500 510 520 530 570 580 590 600 610 620 pF1KE2 HPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYN 540 550 560 570 580 590 630 640 650 660 670 680 pF1KE2 ASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQ 600 610 620 630 640 650 690 700 710 720 730 740 pF1KE2 DSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSSWDNNVYFYSIAFGRRQDTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSSWDNNVYFYSIAFGRRQDTL 660 670 680 690 700 710 750 760 770 780 790 800 pF1KE2 MGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVDTIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVDTIS 720 730 740 750 760 770 810 820 830 840 850 860 pF1KE2 LNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDGCLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDGCLN 780 790 800 810 820 830 870 880 890 900 910 920 pF1KE2 VIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELLVWDLLGAKISERIQGHTGAVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELLVWDLLGAKISERIQGHTGAVT 840 850 860 870 880 890 930 940 pF1KE2 CIWMNEQCSSIITGGEDRQIIFWKLQY ::::::::::::::::::::::::::: CCDS61 CIWMNEQCSSIITGGEDRQIIFWKLQY 900 910 >>CCDS58928.1 LRBA gene_id:987|Hs109|chr4 (2851 aa) initn: 1033 init1: 441 opt: 982 Z-score: 864.6 bits: 172.9 E(33420): 8e-42 Smith-Waterman score: 1134; 30.6% identity (58.2% similar) in 834 aa overlap (175-944:2019-2836) 150 160 170 180 190 200 pF1KE2 FIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMITAIL ::.. : :.. ::.:.. .: CCDS58 LRRRRRFVRNPLGSTHPEATLKTAVEHATDEDILAKGKQSIRSQA---LGNQNSENEILL 1990 2000 2010 2020 2030 2040 210 220 230 240 250 260 pF1KE2 QSRLAR-TSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLNGYPK-- .. .: :.. ..:.. . . :..:.: :. : . .:...:::. . :. CCDS58 EGDDDTLSSVDEKDLENLAGPVSLSTPAQLVAPSVVVKGTLSVTSSELYFEVDEEDPNFK 2050 2060 2070 2080 2090 2100 270 280 290 300 pF1KE2 ---PVV---------QITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFYEPQDR : . . . ..: :..::. :. .::.: .. ....: .: CCDS58 KIDPKILAYTEGLHGKWLFTEIRSIFSRRYLLQNTALEIFMANR---VAVMFNFPDPATV 2110 2120 2130 2140 2150 2160 310 320 330 340 350 pF1KE2 DDLYFYIATY---------------LEHHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLA . :. : : .. .::. ..::..::. ::..: CCDS58 KKVVNYLPRVGVGTSFGLPQTRRISLASPRQLFKASNMTQRWQHREISNFEYLMFLNTIA 2170 2180 2190 2200 2210 2220 360 370 380 390 400 410 pF1KE2 DRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPE :: :::.:::::::.: .: : ::::. : .:::::::.:::: .: . ::. . CCDS58 GRSYNDLNQYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAAFFAERYESWED 2230 2240 2250 2260 2270 2280 420 430 440 450 460 pF1KE2 ---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNSIAETWKNCLDG ::: ::.:::. ..:: .:.:: : :.: ::.:.::.::: :.::...:.: CCDS58 DQVPKFHYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSSISRAWRNSQRD 2290 2300 2310 2320 2330 2340 470 480 490 500 510 520 pF1KE2 ATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPEDFLQKSKDALE ..:.:::::::: : :: . .:: . : .:.::::::::.. :.:.. .. ::: CCDS58 TSDIKELIPEFYYLPEMF-VNFNNYNLGVMDDGTVVSDVELPPWAKTSEEFVHINRLALE 2350 2360 2370 2380 2390 2400 530 540 550 560 570 580 pF1KE2 SNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLTQIL :..:: .::.::::::::::.: .:: : :::. :::::.:.:::: :: . :. .:: CCDS58 SEFVSCQLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDPVLREAVEAQIR 2410 2420 2430 2440 2450 2460 590 600 610 620 630 640 pF1KE2 EFGQTPKQLFVTPHPRR-----ITP-KFKSLSQTSSYNASM--ADSPGEESFEDLTEESK :::::.::.. ::: : ..: : . .: . . ..:: . . CCDS58 SFGQTPSQLLIEPHPPRGSAMQVSPLMFTDKAQQDVIMVLKFPSNSPVTHVAANTQPGLA 2470 2480 2490 2500 2510 2520 650 660 670 680 690 700 pF1KE2 TLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTLKMFSKESKMLQRSIS- : : ..: .: : :. . .: .. . . : ...... : .:.:. CCDS58 TPAVITVTANRLFAVNKWHNLPAHQGAV-QDQPYQLPVEID---PLIASNTGMHRRQITD 2530 2540 2550 2560 2570 710 720 730 740 750 pF1KE2 ---FSNMALSSCLLLPGDAT--VITSSWDNNVYFYSIAFGRRQDTLMGHDDAVSKICWHD : .. :.:... .: .. . ::.. :: :: ....:: :.:. . . CCDS58 LLDQSIQVHSQCFVITSDNRYILVCGFWDKSFRVYSTDTGRLIQVVFGHWDVVTCLARSE 2580 2590 2600 2610 2620 2630 760 770 780 790 800 pF1KE2 NRL------YSASWDSTVKVW------SGVPAEMPGTKRHHFDLLAELEHDVSVDTISLN . . :.: :.:. .: ::. .. :: .:. :: : .. CCDS58 SYIGGNCYILSGSRDATLLLWYWNGKCSGI-GDNPGETAAPRAILTG--HDYEVTCAAVC 2640 2650 2660 2670 2680 2690 810 820 830 840 850 860 pF1KE2 AASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSR-HVLSTGTDGCLNV : :..::..:: : ... . :.. . . . .. . . : . .: . . CCDS58 AELGLVLSGSQEGPCLIHSMN-GDLLRTLEGPENCLKPKLIQASREGHCVIFYENGLFCT 2700 2710 2720 2730 2740 2750 870 880 890 900 910 920 pF1KE2 IDVQTGMLISSMTSDEPQRC--FVWDGNSVLSGSQSGELLVWDLLGAKISERIQGHTGAV ..:. : : ..: .:. : . ::. .:.:.. : ..: .. : : ... CCDS58 FSVN-GKLQATMETDDNIRAIQLSRDGQYLLTGGDRGVVVVRQVSDLKQLFAYPGCDAGI 2760 2770 2780 2790 2800 2810 930 940 pF1KE2 TCIWMNEQCSSIITGGEDRQIIFWKLQY . .. . ::.: . .:... CCDS58 RAMALSYDQRCIISGMASGSIVLFYNDFNRWHHEYQTRY 2820 2830 2840 2850 >>CCDS3773.1 LRBA gene_id:987|Hs109|chr4 (2863 aa) initn: 1033 init1: 441 opt: 982 Z-score: 864.5 bits: 172.9 E(33420): 8e-42 Smith-Waterman score: 1138; 30.7% identity (59.1% similar) in 845 aa overlap (165-944:2018-2848) 140 150 160 170 180 190 pF1KE2 GISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDK-L .:.: .:. : : .: . : .. : CCDS37 DLRRRRRFVRNPLGSTHPEATLKTAVEHVCIFKLRENSKATD--EDILAKGKQSIRSQAL 1990 2000 2010 2020 2030 2040 200 210 220 230 240 250 pF1KE2 GDQTAMITAILQSRLAR-TSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLY :.:.. .:.. .: :.. ..:.. . . :..:.: :. : . .:...:: CCDS37 GNQNSENEILLEGDDDTLSSVDEKDLENLAGPVSLSTPAQLVAPSVVVKGTLSVTSSELY 2050 2060 2070 2080 2090 2100 260 270 280 290 pF1KE2 FQPLNGYPK-----PVV---------QITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSD :. . :. : . . . ..: :..::. :. .::.: .. CCDS37 FEVDEEDPNFKKIDPKILAYTEGLHGKWLFTEIRSIFSRRYLLQNTALEIFMANR---VA 2110 2120 2130 2140 2150 2160 300 310 320 330 340 pF1KE2 IYLKFYEPQDRDDLYFY-----IATYL----EHHVAEHTAE-----SYMLQ-WQRGHLSN ....: .: . : ..: . .... . . : : : ::. ..:: CCDS37 VMFNFPDPATVKKVVNYLPRVGVGTSFGLPQTRRISLASPRQLFKASNMTQRWQHREISN 2170 2180 2190 2200 2210 2220 350 360 370 380 390 400 pF1KE2 YQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLE ..::. ::..: :: :::.:::::::.: .: : ::::. : .:::::::.:::: .: CCDS37 FEYLMFLNTIAGRSYNDLNQYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAA 2230 2240 2250 2260 2270 2280 410 420 430 440 450 pF1KE2 RLLTRYQEMPE---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNS . ::. . ::: ::.:::. ..:: .:.:: : :.: ::.:.::.::: :.: CCDS37 FFAERYESWEDDQVPKFHYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSS 2290 2300 2310 2320 2330 2340 460 470 480 490 500 510 pF1KE2 IAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPE :...:.: ..:.:::::::: : :: . .:: . : .:.::::::::.. : CCDS37 ISRAWRNSQRDTSDIKELIPEFYYLPEMF-VNFNNYNLGVMDDGTVVSDVELPPWAKTSE 2350 2360 2370 2380 2390 2400 520 530 540 550 560 570 pF1KE2 DFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDP .:.. .. ::::..:: .::.::::::::::.: .:: : :::. :::::.:.:::: :: CCDS37 EFVHINRLALESEFVSCQLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDP 2410 2420 2430 2440 2450 2460 580 590 600 610 620 630 pF1KE2 DEKVAMLTQILEFGQTPKQLFVTPHPRR-----ITP-KFKSLSQTSSYNASM--ADSPGE . :. .:: :::::.::.. ::: : ..: : . .: . . ..:: CCDS37 VLREAVEAQIRSFGQTPSQLLIEPHPPRGSAMQVSPLMFTDKAQQDVIMVLKFPSNSPVT 2470 2480 2490 2500 2510 2520 640 650 660 670 680 690 pF1KE2 ESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTLKMFSK . . : : ..: .: : :. . .: .. . . : .... CCDS37 HVAANTQPGLATPAVITVTANRLFAVNKWHNLPAHQGAV-QDQPYQLPVEIDP---LIAS 2530 2540 2550 2560 2570 700 710 720 730 740 pF1KE2 ESKMLQRSIS----FSNMALSSCLLLPGDAT--VITSSWDNNVYFYSIAFGRRQDTLMGH .. : .:.:. : .. :.:... .: .. . ::.. :: :: ....:: CCDS37 NTGMHRRQITDLLDQSIQVHSQCFVITSDNRYILVCGFWDKSFRVYSTDTGRLIQVVFGH 2580 2590 2600 2610 2620 2630 750 760 770 780 790 pF1KE2 DDAVSKICWHDNRL------YSASWDSTVKVW------SGVPAEMPGTKRHHFDLLAELE :.:. . .. . :.: :.:. .: ::. .. ::.. . CCDS37 WDVVTCLARSESYIGGNCYILSGSRDATLLLWYWNGKCSGI-GDNPGSETAAPRAILT-G 2640 2650 2660 2670 2680 2690 800 810 820 830 840 850 pF1KE2 HDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSR-HV :: : .. : :..::..:: : ... . :.. . . . .. . . : CCDS37 HDYEVTCAAVCAELGLVLSGSQEGPCLIHSMN-GDLLRTLEGPENCLKPKLIQASREGHC 2700 2710 2720 2730 2740 2750 860 870 880 890 900 pF1KE2 LSTGTDGCLNVIDVQTGMLISSMTSDEPQRC--FVWDGNSVLSGSQSGELLVWDLLGAKI . .: . ...:. : : ..: .:. : . ::. .:.:.. : ..: .. : CCDS37 VIFYENGLFCTFSVN-GKLQATMETDDNIRAIQLSRDGQYLLTGGDRGVVVVRQVSDLKQ 2760 2770 2780 2790 2800 2810 910 920 930 940 pF1KE2 SERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY : ... . .. . ::.: . .:... CCDS37 LFAYPGCDAGIRAMALSYDQRCIISGMASGSIVLFYNDFNRWHHEYQTRY 2820 2830 2840 2850 2860 >>CCDS3609.1 WDFY3 gene_id:23001|Hs109|chr4 (3526 aa) initn: 912 init1: 388 opt: 979 Z-score: 860.6 bits: 172.5 E(33420): 1.3e-41 Smith-Waterman score: 1060; 33.7% identity (58.5% similar) in 709 aa overlap (269-937:2612-3277) 240 250 260 270 280 290 pF1KE2 TNPGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTED----- .:.....:::. :.:...::: . CCDS36 LPPNMHEPIIPRGARQGPSQLKRTCSIFAYEDIKEVHKRRYLLQPIAVEVFSGDGRNYLL 2590 2600 2610 2620 2630 2640 300 310 320 330 pF1KE2 ----DLCSDIYLKFYE--PQDRDDLYFYIATYLEHHVAEHTA--------ESYMLQWQRG . . .: .: :. :. . . : . .. .: .:.:: CCDS36 AFQKGIRNKVYQRFLAVVPSLTDSSESVSGQRPNTSVEQGSGLLSTLVGEKSVTQRWERG 2650 2660 2670 2680 2690 2700 340 350 360 370 380 390 pF1KE2 HLSNYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNK ..::.:::.:::.:: :: ::: ::::::::. ::.: :.::.:: :::.:.::.:: . CCDS36 EISNFQYLMHLNTLAGRSYNDLMQYPVFPWILADYDSEEVDLTNPKTFRNLAKPMGAQTD 2710 2720 2730 2740 2750 2760 400 410 420 430 440 450 pF1KE2 ERLERLLTRYQEMPEPK-----FMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNA ::: . ::.. .:. . ::.:::: : ::::. : . .: ::.:.:: : CCDS36 ERLAQYKKRYKDWEDPNGETPAYHYGTHYSSAMIVASYLVRMEPFTQIFLRLQGGHFDLA 2770 2780 2790 2800 2810 2820 460 470 480 490 500 510 pF1KE2 DRMFNSIAETWKNCLD-GATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELP ::::.:. :.: . . .: :::::::. :: :: ..::: .:.: . :: :: CCDS36 DRMFHSVREAWYSASKHNMADVKELIPEFFYLP-EFLFNSNNFDLGCKQNGTKLGDVILP 2830 2840 2850 2860 2870 2880 520 530 540 550 560 570 pF1KE2 PWASS-PEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGV :::.. :..:.. ..::: .::: ::::::::::::::.: :: : :::: : ::: : CCDS36 PWAKGDPREFIRVHREALECDYVSAHLHEWIDLIFGYKQQGPAAVEAVNVFHHLFYEGQV 2890 2900 2910 2920 2930 2940 580 590 600 610 620 630 pF1KE2 DLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGE :. .:.:: ...: . : .::: ::::: ::: :: . :. .. ::... :: CCDS36 DIYNINDPLKETATIGFINNFGQIPKQLFKKPHP----PK-RVRSRLNGDNAGISVLPGS 2950 2960 2970 2980 2990 640 650 660 670 680 690 pF1KE2 ESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTLKMFSK : . . .. .: ..: . : :: : :. . .: .... :...: CCDS36 TSDKIFFHHLDNLR-PSLTPV------KELKEPVGQIVCTDKG--ILAVEQNKVLI---- 3000 3010 3020 3030 3040 700 710 720 730 740 750 pF1KE2 ESKMLQRSISFSNMALSSCLLLPGDATVITSSWDNNVYFYSIAFGRRQDTLMGHDDAVSK ....... :: : : : : :. . : . : . . CCDS36 -PPTWNKTFAWGYADLS-CRL--G-----TYESDKAMTVY--------ECLSEWGQILCA 3050 3060 3070 3080 760 770 780 790 800 pF1KE2 ICWHDNRLYSASWDSTVKVWS-GVPAEMPGTKRHHFDLLAELEHDVSVDTISLNAASTLL :: . . . ... ...: :: :. : : . ::.. . :. : :: : .. CCDS36 ICPNPKLVITGGTSTVVCVWEMGTSKEKAKTVTLKQALLGHTD-TVTCATASL--AYHII 3090 3100 3110 3120 3130 3140 810 820 830 840 850 860 pF1KE2 VSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLS-TGTDGCLNVIDVQTG :::... : ::::. ... :. : . : .. . ..: .:: ..: ... . CCDS36 VSGSRDRTCIIWDLNKLSFLTQLRGHRAPVSALCINELTGDIVSCAGT--YIHVWSINGN 3150 3160 3170 3180 3190 3200 870 880 890 900 910 pF1KE2 MLISSMT-SDEPQR---CFV-----WDG-NSVLSGSQSGELLVWDLLGAKISERIQGHTG ..: : . . :. : . :: : ...: ..: . : . .. : . . CCDS36 PIVSVNTFTGRSQQIICCCMSEMNEWDTQNVIVTGHSDGVVRFWRMEFLQVPETPAPEPA 3210 3220 3230 3240 3250 3260 920 930 940 pF1KE2 AVTCIWMNEQCSSIITGGEDRQIIFWKLQY : . :.:.: : : CCDS36 EV--LEMQEDCPEAQIGQEAQDEDSSDSEADEQSISQDPKDTPSQPSSTSHRPRAASCRA 3270 3280 3290 3300 3310 >>CCDS55894.1 NBEA gene_id:26960|Hs109|chr13 (739 aa) initn: 1084 init1: 470 opt: 965 Z-score: 857.8 bits: 169.7 E(33420): 1.9e-41 Smith-Waterman score: 1090; 30.9% identity (60.4% similar) in 735 aa overlap (268-948:2-728) 240 250 260 270 280 290 pF1KE2 VTNPGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCS ....: ...::. :. .:::: .. . CCDS55 MFSEIRAVFSRRYLLQNTALEVFMANR---T 10 20 300 310 320 330 340 pF1KE2 DIYLKFYEPQDRDDLYFYI------ATY---LEHHVAEHTAE-----SYMLQ-WQRGHLS .....: . . . . ..: .... : . : : : ::: ..: CCDS55 SVMFNFPDQATVKKVVYSLPRVGVGTSYGLPQARRISLATPRQLYKSSNMTQRWQRREIS 30 40 50 60 70 80 350 360 370 380 390 400 pF1KE2 NYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERL :..::. ::..: :. :::.:::::::.. .: : ::::. ::.:::::::.:::: .: CCDS55 NFEYLMFLNTIAGRTYNDLNQYPVFPWVLTNYESEELDLTLPGNFRDLSKPIGALNPKRA 90 100 110 120 130 140 410 420 430 440 450 pF1KE2 ERLLTRYQEMPE---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFN ::. . : . :..:::. .: .:::: : ..: ..:.::. :: :. CCDS55 VFYAERYETWEDDQSPPYHYNTHYSTATSTLSWLVRIEPFTTFFLNANDGKFDHPDRTFS 150 160 170 180 190 200 460 470 480 490 500 510 pF1KE2 SIAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSP :.:..:.. ..: :::::::: : ::: .:: :. .:.::.:::::..: CCDS55 SVARSWRTSQRDTSDVKELIPEFYYLPEMF-VNSNGYNLGVREDEVVVNDVDLPPWAKKP 210 220 230 240 250 260 520 530 540 550 560 570 pF1KE2 EDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQD :::.. .. ::::..:: .::.::::::::::.: .:: : :::: :::::.:.:.:: : CCDS55 EDFVRINRMALESEFVSCQLHQWIDLIFGYKQRGPEAVRALNVFHYLTYEGSVNLDSITD 270 280 290 300 310 320 580 590 600 610 620 630 pF1KE2 PDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLT : . :: .:: .:::::.::.. ::: : . . : . :. .. . : CCDS55 PVLREAMEAQIQNFGQTPSQLLIEPHPPRSSAMHLCFLPQSPL--MFKDQMQQDVIMVLK 330 340 350 360 370 380 640 650 660 670 680 pF1KE2 EESKT----LAWNNITKLQLHEHYKIHKEAVTGI-----TVSRNGSSVFTTSQDSTLK-- :.. .: :.. .: . . . .. ::. :. .. .: : CCDS55 FPSNSPVTHVAANTLPHLTIPAVVTVTCSRLFAVNRWHNTVGLRGAPGYSLDQAHHLPIE 390 400 410 420 430 440 690 700 710 720 730 pF1KE2 ---MFSKESKMLQRSIS-FSNMAL---SSCLLLPGDAT--VITSSWDNNVYFYSIAFGRR .....: . .:.:. . .... . :... .: .: . ::.. :: :. CCDS55 MDPLIANNSGVNKRQITDLVDQSIQINAHCFVVTADNRYILICGFWDKSFRVYSTETGKL 450 460 470 480 490 500 740 750 760 770 780 pF1KE2 QDTLMGHDDAVSKICWH------DNRLYSASWDSTVKVW--SG---VPAEMPGTKRHHFD . ..:: :.:. . : . :.: :.:. .: :: . .. :... . CCDS55 TQIVFGHWDVVTCLARSESYIGGDCYIVSGSRDATLLLWYWSGRHHIIGDNPNSSDYPAP 510 520 530 540 550 560 790 800 810 820 830 840 pF1KE2 LLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSP . :: : .:. : :..::.::: . .: . :.. . . . .: CCDS55 RAVLTGHDHEVVCVSVCAELGLVISGAKEGPCLVHTIT-GDLLRALEGPENCLFPRLISV 570 580 590 600 610 620 850 860 870 880 890 900 pF1KE2 DSR-HVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVW--DGNSVLSGSQSGELLVWD .:. : . : .. .... : :...: .. : .. ::.....:...: . ::. CCDS55 SSEGHCIIYYERGRFSNFSIN-GKLLAQMEINDSTRAILLSSDGQNLVTGGDNGVVEVWQ 630 640 650 660 670 680 910 920 930 940 pF1KE2 LLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY : : ... . .... ..::: . .:. ..... CCDS55 ACDFKQLYIYPGCDAGIRAMDLSHDQRTLITGMASGSIVAFNIDFNRWHYEHQNRY 690 700 710 720 730 >>CCDS45026.1 NBEA gene_id:26960|Hs109|chr13 (2946 aa) initn: 1040 init1: 470 opt: 965 Z-score: 849.4 bits: 170.2 E(33420): 5.6e-41 Smith-Waterman score: 1132; 27.6% identity (57.5% similar) in 973 aa overlap (58-948:1983-2935) 30 40 50 60 70 80 pF1KE2 AHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLEEYYFEQHRANHILHKGSHHERKI---- : :. ....::. . :: .. : . CCDS45 QKNAGLAFIELINEGRLLCHAMKDHIVRVANEAEFILNRQRAEDV-HKHAEFESQCAQYA 1960 1970 1980 1990 2000 2010 90 100 110 120 130 pF1KE2 ---RGSLKICSK--SVIFEPDSISQPIIKIPLRDCIKIGKHGENGANRH-----FTKAKS : :.:.. :. . : .. .: . . : .::: :: : : . CCDS45 ADRREEEKMCDHLISAAKHRDHVTANQLKQKILN-ILTNKHGAWGAVSHSQLHDFWRLDY 2020 2030 2040 2050 2060 2070 140 150 160 170 180 190 pF1KE2 GGISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKL .: . . . . . . .. .:: : ::::.. .. . ... CCDS45 WEDDLRRRRRFVRNAFGSTHAEALLKAAIEY-------GTEEDVVKSKKTFRSQAIVNQN 2080 2090 2100 2110 2120 200 210 220 230 240 250 pF1KE2 GDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYF .. :. . . : . .......:.. . . :....:.:. : . :: :..:: CCDS45 AETELMLEG---DDDAVSLLQEKEIDNLAGPVVLSTPAQLIAPVVVAKGTLSITTTEIYF 2130 2140 2150 2160 2170 2180 260 270 280 290 pF1KE2 Q---PLNGYPKPVVQIT-----------LQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDI . ... : ... ....: ...::. :. .:::: .. ... CCDS45 EVDEDDSAFKKIDTKVLAYTEGLHGKWMFSEIRAVFSRRYLLQNTALEVFMANR---TSV 2190 2200 2210 2220 2230 300 310 320 330 340 pF1KE2 YLKFYEPQDRDDLYFYI------ATY---LEHHVAEHTAE-----SYMLQ-WQRGHLSNY ...: . . . . ..: .... : . : : : ::: ..::. CCDS45 MFNFPDQATVKKVVYSLPRVGVGTSYGLPQARRISLATPRQLYKSSNMTQRWQRREISNF 2240 2250 2260 2270 2280 2290 350 360 370 380 390 400 pF1KE2 QYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLER .::. ::..: :. :::.:::::::.. .: : ::::. ::.:::::::.:::: .: CCDS45 EYLMFLNTIAGRTYNDLNQYPVFPWVLTNYESEELDLTLPGNFRDLSKPIGALNPKRAVF 2300 2310 2320 2330 2340 2350 410 420 430 440 450 pF1KE2 LLTRYQEMPE---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNSI ::. . : . :..:::. .: .:::: : ..: ..:.::. :: :.:. CCDS45 YAERYETWEDDQSPPYHYNTHYSTATSTLSWLVRIEPFTTFFLNANDGKFDHPDRTFSSV 2360 2370 2380 2390 2400 2410 460 470 480 490 500 510 pF1KE2 AETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPED :..:.. ..: :::::::: : ::: .:: :. .:.::.:::::..::: CCDS45 ARSWRTSQRDTSDVKELIPEFYYLPEMF-VNSNGYNLGVREDEVVVNDVDLPPWAKKPED 2420 2430 2440 2450 2460 2470 520 530 540 550 560 570 pF1KE2 FLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPD :.. .. ::::..:: .::.::::::::::.: .:: : :::: :::::.:.:.:: :: CCDS45 FVRINRMALESEFVSCQLHQWIDLIFGYKQRGPEAVRALNVFHYLTYEGSVNLDSITDPV 2480 2490 2500 2510 2520 2530 580 590 600 610 620 630 pF1KE2 EKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEE . :: .:: .:::::.::.. ::: : . . : . :. .. . : CCDS45 LREAMEAQIQNFGQTPSQLLIEPHPPRSSAMHLCFLPQSPLM--FKDQMQQDVIMVLKFP 2540 2550 2560 2570 2580 2590 640 650 660 670 680 pF1KE2 SKT----LAWNNITKLQLHEHYKIHKEAVTGI-----TVSRNGSSVFTTSQDSTLK---- :.. .: :.. .: . . . .. ::. :. .. .: : CCDS45 SNSPVTHVAANTLPHLTIPAVVTVTCSRLFAVNRWHNTVGLRGAPGYSLDQAHHLPIEMD 2600 2610 2620 2630 2640 2650 690 700 710 720 730 pF1KE2 -MFSKESKMLQRSIS-FSNMAL---SSCLLLPGDAT--VITSSWDNNVYFYSIAFGRRQD .....: . .:.:. . .... . :... .: .: . ::.. :: :. . CCDS45 PLIANNSGVNKRQITDLVDQSIQINAHCFVVTADNRYILICGFWDKSFRVYSTETGKLTQ 2660 2670 2680 2690 2700 2710 740 750 760 770 780 pF1KE2 TLMGHDDAVSKICWH------DNRLYSASWDSTVKVW--SG---VPAEMPGTKRHHFDLL ..:: :.:. . : . :.: :.:. .: :: . .. :... . CCDS45 IVFGHWDVVTCLARSESYIGGDCYIVSGSRDATLLLWYWSGRHHIIGDNPNSSDYPAPRA 2720 2730 2740 2750 2760 2770 790 800 810 820 830 840 pF1KE2 AELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDS . :: : .:. : :..::.::: . .: . :.. . . . .: .: CCDS45 VLTGHDHEVVCVSVCAELGLVISGAKEGPCLVHTIT-GDLLRALEGPENCLFPRLISVSS 2780 2790 2800 2810 2820 2830 850 860 870 880 890 900 pF1KE2 R-HVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVW--DGNSVLSGSQSGELLVWDLL . : . : .. .... : :...: .. : .. ::.....:...: . ::. CCDS45 EGHCIIYYERGRFSNFSIN-GKLLAQMEINDSTRAILLSSDGQNLVTGGDNGVVEVWQAC 2840 2850 2860 2870 2880 2890 910 920 930 940 pF1KE2 GAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY : : ... . .... ..::: . .:. ..... CCDS45 DFKQLYIYPGCDAGIRAMDLSHDQRTLITGMASGSIVAFNIDFNRWHYEHQNRY 2900 2910 2920 2930 2940 >>CCDS46817.1 NBEAL2 gene_id:23218|Hs109|chr3 (2754 aa) initn: 990 init1: 536 opt: 955 Z-score: 841.0 bits: 168.5 E(33420): 1.6e-40 Smith-Waterman score: 1048; 32.7% identity (57.6% similar) in 712 aa overlap (191-820:1894-2579) 170 180 190 200 210 220 pF1KE2 KMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQN :.::.. : :.. . . .:..: CCDS46 VPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLGEDE---LAELETPMEAAELDEQR--- 1870 1880 1890 1900 1910 230 240 250 260 pF1KE2 ISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLN----------GYP--KPVVQITL ::: . . ..:: ... :: . .: :.:: . :: .:..:. CCDS46 --EKLVLSAECQLVTVVAVVPGLLEVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQL-- 1920 1930 1940 1950 1960 1970 270 280 290 300 pF1KE2 QDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFY---------------EPQD----- :... :: .: .::.: .. .. .:.: .:: CCDS46 ---REVHLRRFNLRRSALELFFIDQ---ANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPP 1980 1990 2000 2010 2020 310 320 330 340 350 pF1KE2 ----RDDLYFYIAT-------YLEHHVAEHT--AESYMLQWQRGHLSNYQYLLHLNNLAD :...: .. :: . .. : . .: . ..::..::..::..: CCDS46 HTQVRNQVYSWLLRLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAG 2030 2040 2050 2060 2070 2080 360 370 380 390 400 410 pF1KE2 RSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEP :. :::::::::::...:: : ::::::..:::::::.:..: .. . . .:. . .: CCDS46 RTYNDLSQYPVFPWVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDP 2090 2100 2110 2120 2130 2140 420 430 440 450 460 pF1KE2 -----KFMYGSHYSSPGYVLFYLVRIAPEYMLC--LQNGRFDNADRMFNSIAETWKNCLD :: ::.:::. . :. ::.:. : : ::.:::: .::.:.:.: .:. :. CCDS46 AGTIDKFHYGTHYSNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLE 2150 2160 2170 2180 2190 2200 470 480 490 500 510 520 pF1KE2 GATDFKELIPEF-YGDDVSFLVNSLKLDLGKRQ-GGQMVDDVELPPWASSPEDFLQKSKD . .: ::::::: : : :: :. .::: : .. : :: :::::::::::.:. .. CCDS46 SPADVKELIPEFFYFPD--FLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQ 2210 2220 2230 2240 2250 2260 530 540 550 560 570 580 pF1KE2 ALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLT ::::.::: ::::::::::::::.: : : :::. ::::.:::. . : :. :. CCDS46 ALESEYVSAHLHEWIDLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEG 2270 2280 2290 2300 2310 2320 590 600 610 620 630 640 pF1KE2 QILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAWN : .::::: ::. ::: :.. .. ... . :. . :. : .: :.. . CCDS46 IISNFGQTPCQLLKEPHPTRLS------AEEAAHRLARLDTNSPSIFQHL-DELKAFFAE 2330 2340 2350 2360 2370 650 660 670 680 pF1KE2 NITK-----LQLHEHYKIHKEAVTG-----ITVS--------------RNGSSVFTTSQD .. : : : . :. . : .::: :: :. :. :.: CCDS46 VVSDGVPLVLALVPHRQPHSFITQGSPDLLVTVSASGLLGTHSWLPYDRNISNYFSFSKD 2380 2390 2400 2410 2420 2430 690 700 710 720 730 740 pF1KE2 STLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSS--WDNNVYFYSIAFGRRQDT :. : ...:. .. . .. : . :. .. :. ::... .. :. . CCDS46 PTMGSH-KTQRLLSGPWVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQ 2440 2450 2460 2470 2480 2490 750 760 770 780 790 pF1KE2 LMGHDDAVSKICWHDNRLY--SASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVD : : :.:. . .: :.: :.: :: . .. . . : ..:. CCDS46 LSCHLDVVTCLALDTCGIYLISGSRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVS 2500 2510 2520 2530 2540 2550 800 810 820 830 840 850 pF1KE2 TISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDG ..... . :::...::: : CCDS46 CVAISTELDMAVSGSEDGTVIIHTVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQS 2560 2570 2580 2590 2600 2610 >>CCDS46495.1 NBEAL1 gene_id:65065|Hs109|chr2 (2694 aa) initn: 968 init1: 527 opt: 945 Z-score: 832.4 bits: 166.9 E(33420): 4.9e-40 Smith-Waterman score: 1215; 32.6% identity (62.0% similar) in 800 aa overlap (209-942:1872-2652) 180 190 200 210 220 230 pF1KE2 ETLLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLV ::.. :... :. .::: . :..: . CCDS46 SDTLLLEVVKQVKVSDMVEDKLDLPEEDITARVNVDEKEEQDQKEKLVLMEDCELITIID 1850 1860 1870 1880 1890 1900 240 250 260 270 280 290 pF1KE2 TNPGHVCITDTNLYFQPLNGYPKPVVQITLQ----DVRRIYKRRHGLMPLGLEVFCTEDD . ::.. :: ..:: . . : . .. ..:.:. ::..: .::.: ... CCDS46 VIPGRLEITTQHIYFYDGSIEKEDGVGFDFKWPHSQIREIHLRRYNLRRSALEIFHVDQ- 1910 1920 1930 1940 1950 1960 300 310 320 330 340 pF1KE2 LCSDIYLKFYEPQDRDDLYFYIAT-------YLEHHVAEHTAESYMLQ-WQRGHLSNYQY :. .:.: . . :. .: . . : . : : . : : ..::..: CCDS46 --SNYFLNF-KKEVRNKIYSRLLSLHSPNSYYGSRSPQELFKASGLTQKWVNREISNFDY 1970 1980 1990 2000 2010 350 360 370 380 390 400 pF1KE2 LLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLL :...:..: :. :::.::::::::..::.: ::::.::..:::::::.:..:.. . . CCDS46 LIQINTMAGRTYNDLAQYPVFPWILQDYTSEELDLNNPAVFRDLSKPIGVVNEKNAKAMR 2020 2030 2040 2050 2060 2070 410 420 430 440 450 pF1KE2 TRYQEMPEP-----KFMYGSHYSSPGYVLFYLVRIAPEYMLC--LQNGRFDNADRMFNSI .:... .: :: ::.:::. . :. ::.:. : : ::.:::: :::.:.:: CCDS46 EKYENFEDPMGTIDKFHYGTHYSNSAGVMHYLIRVEPFTTLHIQLQSGRFDCADRQFHSI 2080 2090 2100 2110 2120 2130 460 470 480 490 500 510 pF1KE2 AETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQ-GGQMVDDVELPPWASSPE ::. .:. : :::::::. :: :. ...::. : . ..:.:: :: ::.: : CCDS46 PATWQALMDNPYDVKELIPEFFYFP-EFLENQNQFNLGRLQISKELVNDVILPKWAKSAE 2140 2150 2160 2170 2180 2190 520 530 540 550 560 570 pF1KE2 DFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDP ::. : . ::::.::: ::::::::::::::.: :: : :::. .:::.:::... : CCDS46 DFIYKHRKALESEYVSAHLHEWIDLIFGYKQRGPAAVEALNVFYYCSYEGAVDLDALTDE 2200 2210 2220 2230 2240 2250 580 590 600 610 620 630 pF1KE2 DEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADS----PGEESF- :. :. .: .::::: ::. ::: :.. . ..... .. ..: . : .:: CCDS46 KERKALEGMINNFGQTPCQLLKEPHPPRLSAE-EAVQKPTKIDTSTLNLFQHLPELKSFF 2260 2270 2280 2290 2300 2310 640 650 660 670 pF1KE2 -EDLTEESKTLAWNNITKLQLHEHYK---------IHKEAVTG----ITVSRNGSSVFTT : ... . : .: : : . .. : . : : . .:: :. :: CCDS46 IEGISD-GIPLLKATIPKNQYRSFMSQGSPELLITISMNYVIGTHGWLPYDRNISNYFTF 2320 2330 2340 2350 2360 2370 680 690 700 710 720 730 pF1KE2 SQDSTLKMFSKESKMLQRSI--SFS-NMALSSCLLLPG-DATVITSS--WDNNVYFYSIA .:.:. . :::: ::. .. ..: :.. . :: .. :. :::.. .:.. CCDS46 IKDQTVT-----NPKTQRSINGSFAPGLEITSKLFVVSHDAKLLFSAGYWDNSIQVMSLT 2380 2390 2400 2410 2420 740 750 760 770 780 pF1KE2 FGRRQDTLMGHDDAVSKIC--WHDNRLYSASWDSTVKVWS-----GVPAEMPGTKRHHFD :. . .. : : :. . . .: :.: :.: .:. :::. : . :. CCDS46 KGKIISHIIRHMDIVTCLATDYCGIHLISGSRDTTCMIWQITQQGGVPV---GLASKPFQ 2430 2440 2450 2460 2470 2480 790 800 810 820 830 840 pF1KE2 LLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQI--PCHSGI---VCD .: : : ...... . :::...::: : . . :. . ::.:.. . . CCDS46 IL--YGHTNEVLSVGISTELDMAVSGSRDGTVIIHTIQKGQYMRTLRPPCESSLFLTIPN 2490 2500 2510 2520 2530 2540 850 860 870 880 890 pF1KE2 TAFSPDSRHVLSTGTD--------GCLNVIDVQTGMLISSMTSDEPQR-CFVWDGNSVLS :.: ... :. ..:. . :...... .: :.. ... . :.. :. ... CCDS46 LAISWEGHIVVYSSTEEKTTLKDKNALHLFSINGKYLGSQILKEQVSDICII--GEHIVT 2550 2560 2570 2580 2590 2600 900 910 920 930 940 pF1KE2 GSQSGELLVWDLLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY :: .: : . :: . ..: . . :. .... : :..: :: ..: CCDS46 GSIQGFLSIRDLHSLNLSINPLAMRLPIHCVCVTKEYSHILVGLEDGKLIVVGVGKPAEM 2610 2620 2630 2640 2650 2660 CCDS46 RSGQLSRKFWGSSKRLSQISAGETEYNTQDSK 2670 2680 2690 >>CCDS31062.1 LYST gene_id:1130|Hs109|chr1 (3801 aa) initn: 552 init1: 220 opt: 620 Z-score: 544.6 bits: 114.1 E(33420): 5.3e-24 Smith-Waterman score: 925; 27.9% identity (56.5% similar) in 796 aa overlap (211-944:2999-3778) 190 200 210 220 230 pF1KE2 LLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKN-RFQNISEKLHMECKAEMVTPLVT .::... . . ::..... . :.: CCDS31 IPNKYLLRDRQKSEDVVKPPLSYLFEDKTHSSFSSTVKDKAASESIRVNRRCISVAPSRE 2970 2980 2990 3000 3010 3020 240 250 260 270 280 pF1KE2 NPGHVCITDTNLYF-----------QPLNGYPKPV-VQITLQDVRRIYKRRHGLMPLGLE . :.. . ..:: . :.: .:. . : .......:: : ..: CCDS31 TAGELLLGKCGMYFVEDNASDTVESSSLQGELEPASFSWTYEEIKEVHKRWWQLRDNAVE 3030 3040 3050 3060 3070 3080 290 300 310 320 330 340 pF1KE2 VFCTEDDLCSDIYLKFYEPQDRDDLYFYIATYLEHHVAEHTAESYMLQ-WQRGHLSNYQY .: :. . : : . . :::.: : : .. :. . . . : :...:..: CCDS31 IFLTNG---RTLLLAFDNTKVRDDVYHNILTNNLPNLLEYGNITALTNLWYTGQITNFEY 3090 3100 3110 3120 3130 3140 350 360 370 380 390 400 pF1KE2 LLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLL : :::. : :: ::: ::::::.:. :: : :::.. .:.::::... ::. .: . CCDS31 LTHLNKHAGRSFNDLMQYPVFPFILADYVSETLDLNDLLIYRNLSKPIAVQYKEKEDRYV 3150 3160 3170 3180 3190 3200 410 420 430 440 pF1KE2 TRYQEM------------PEPK---FMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRF :. . : : . ::::::. : :: .:::. : ...: :. : CCDS31 DTYKYLEEEYRKGAREDDPMPPVQPYHYGSHYSNSGTVLHFLVRMPPFTKMFLAYQDQSF 3210 3220 3230 3240 3250 3260 450 460 470 480 490 500 pF1KE2 DNADRMFNSIAETWK-NCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDV : :: :.: ::. . ... :: :::::::. :::: .:.: ::.:. :. : CCDS31 DIPDRTFHSTNTTWRLSSFESMTDVKELIPEFFYLP-EFLVNREGFDFGVRQNGERVNHV 3270 3280 3290 3300 3310 3320 510 520 530 540 550 560 pF1KE2 ELPPWA-SSPEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYE .::::: ..:. :. ..::::.:::... .::::.:::::::. .: : ::::: :: CCDS31 NLPPWARNDPRLFILIHRQALESDYVSQNICQWIDLVFGYKQKGKASVQAINVFHPATYF 3330 3340 3350 3360 3370 3380 570 580 590 600 610 620 pF1KE2 GGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADS : .:.....:: .. :. :.: .::::.::: : : :.. .. . . ... CCDS31 G-MDVSAVEDPVQRRALETMIKTYGQTPRQLFHMAHVSRPGAKLNIEGELPAAVGLLVQF 3390 3400 3410 3420 3430 3440 630 640 650 660 670 680 pF1KE2 PGEESFEDLTEES--KTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTL .:. :.. : . . :.: : :. :. . : . :. . : . : CCDS31 AFRETREQVKEITYPSPLSW--IKGLKWGEYVGSPSAPVPVVCFSQPHGERFGSLQALPT 3450 3460 3470 3480 3490 3500 690 700 710 720 730 740 pF1KE2 KMFSKESKMLQRSISFSN-MALSSCLLLPGDATVITSSW---DNNVYFYSIAFGRRQDTL . . :. . ...:. ... : . ..: : : :: . . : . . CCDS31 RAICGLSRNFCLLMTYSKEQGVRSMNSTDIQWSAILS-WGYADNILRLKSKQSEPPVNFI 3510 3520 3530 3540 3550 3560 750 760 770 780 790 pF1KE2 MGHDD-AVSKICWHDN--RLYSASWDSTVKVW-----SGVPAEMPGTKRHHFDLLAELEH .. .. :.. : . .:...: ... .. :..:.:. . :. : CCDS31 QSSQQYQVTSCAWVPDSCQLFTGSKCGVITAYTNRFTSSTPSEIEMETQIHL-----YGH 3570 3580 3590 3600 3610 800 810 820 830 840 850 pF1KE2 DVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLS . .. . ..:.: ...:: ::::. .... :.. : .. : : . . CCDS31 TEEITSLFVCKPYSILISVSRDGTCIIWDLNRLCYVQSLAGHKSPVTAVSASETSGDIAT 3620 3630 3640 3650 3660 3670 860 870 880 890 900 pF1KE2 T------GTDGCLNVID------VQTGMLISSMT-SDEPQRCFVWDGNSVLSGSQSGELL . :.: : ... :. .: :.. :..:. . : . .: ..: . CCDS31 VCDSAGGGSDLRLWTVNGDLVGHVHCREIICSVAFSNQPEGVSI---NVIAGGLENGIVR 3680 3690 3700 3710 3720 3730 910 920 930 940 pF1KE2 VWDLLGAKISERIQGHTGAVTCIWMNEQCSS--IITGGEDRQIIFWKLQY .:. : ..: . : .. .:.. . :.. : .: : CCDS31 LWSTWDLKPVREITFPKSNKPIISLTFSCDGHHLYTANSDGTVIAWCRKDQQRLKQPMFY 3740 3750 3760 3770 3780 3790 CCDS31 SFLSSYAAG 3800 948 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Oct 24 21:30:45 2019 done: Thu Oct 24 21:30:45 2019 Total Scan time: 2.110 Total Display time: 0.230 Function used was FASTA [36.3.4 Apr, 2011]