FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0149, 830 aa 1>>>pF1KSDA0149 830 - 830 aa - 830 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6472+/-0.00111; mu= 8.9212+/- 0.067 mean_var=341.4895+/-64.303, 0's: 0 Z-trim(115.1): 193 B-trim: 0 in 0/53 Lambda= 0.069404 statistics sampled from 15492 (15693) to 15492 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.782), E-opt: 0.2 (0.482), width: 16 Scan time: 4.950 The best scores are: opt bits E(32554) CCDS11007.1 SCARF1 gene_id:8578|Hs108|chr17 ( 830) 6252 640.6 3.3e-183 CCDS45564.1 SCARF1 gene_id:8578|Hs108|chr17 ( 569) 4021 417.0 4.6e-116 CCDS13779.2 SCARF2 gene_id:91179|Hs108|chr22 ( 871) 2271 242.0 3.4e-63 CCDS46666.1 SCARF2 gene_id:91179|Hs108|chr22 ( 866) 2245 239.4 2e-62 CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 1025 117.3 1.3e-25 CCDS30892.1 PEAR1 gene_id:375033|Hs108|chr1 (1037) 980 112.8 3.1e-24 CCDS4142.1 MEGF10 gene_id:84466|Hs108|chr5 (1140) 950 109.9 2.6e-23 CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541) 776 92.6 5.5e-18 CCDS78055.1 MEGF10 gene_id:84466|Hs108|chr5 ( 567) 669 81.3 5e-15 >>CCDS11007.1 SCARF1 gene_id:8578|Hs108|chr17 (830 aa) initn: 6252 init1: 6252 opt: 6252 Z-score: 3402.6 bits: 640.6 E(32554): 3.3e-183 Smith-Waterman score: 6252; 99.5% identity (99.9% similar) in 830 aa overlap (1-830:1-830) 10 20 30 40 50 60 pF1KSD MGLGLLLPLLLLWTRGTQGSELDPKGQHVCVASSPSAELQCCAGWRQKDQECTIPICEGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MGLGLLLPLLLLWTRGTQGSELDPKGQHVCVASSPSAELQCCAGWRQKDQECTIPICEGP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD DACQKDEVCVKPGLCRCKPGFFGAHCSSRCPGQYWGPDCRESCPCHPHGQCEPATGACQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DACQKDEVCVKPGLCRCKPGFFGAHCSSRCPGQYWGPDCRESCPCHPHGQCEPATGACQC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD QADRWGARCEFPCACGPHGRCDPATGVCHCEPGWWSSTCRRPCQCNTAAARCEQATGACV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QADRWGARCEFPCACGPHGRCDPATGVCHCEPGWWSSTCRRPCQCNTAAARCEQATGACV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD CKPGWWGRRCSFRCNCHGSPCEQDSGRCACRPGWWGPECQQQCECVRGRCSAASGECTCP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CKPGWWGRRCSFRCNCHGSPCEQDSGRCACRPGWWGPECQQQCECVRGRCSAASGECTCP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD PGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPGWNGTQCQQPCLPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPGWNGTQCQQPCLPG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD TFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTFGEDCGSTCPTCVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTFGEDCGSTCPTCVQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD GSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVPCECPEGLCHPVSGSCQPGSGSRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVPCECPEGLCHPVSGSCQPGSGSRD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD TALIVGSLVPLLLLFLGLACCACCCWAPRSDLKDRPARDGATVSRMKLQVWGTLTSLGST ::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TALIAGSLVPLLLLFLGLACCACCCWAPRSDLKDRPARDGATVSRMKLQVWGTLTSLGST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD LPCRSLSSHKLPWVTVSHHDPEVPFNHSFIEPPSAGWATDDSFSSDPESGEADEVPAYCV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LPCRSLSSHKLPWVTVSHHDPEVPFNHSFIEPPSAGWATDDSFSSDPESGEADEVPAYCV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD PPQEGMVPVAQAGSSEASLAAGAFPPPEDASTPFAIPRTSSLARAKRPSVSFAEGTKFAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PPQEGMVPVAQAGSSEASLAAGAFPPPEDASTPFAIPRTSSLARAKRPSVSFAEGTKFAP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD QSRRSSGELSSPLRKPKRLSRGAQSGPEGREAEESTGPDEAEAPESFPAAASPGDSATGH ::::::::::::::::::::::::::::::::::::::.::::::::::::::::::::: CCDS11 QSRRSSGELSSPLRKPKRLSRGAQSGPEGREAEESTGPEEAEAPESFPAAASPGDSATGH 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD RWPPLGSRTVAEHVEAIEGSVQESSGPVTTIYMLAGKPRGSEGPVRSVFRHFGSFQKGQA : ::::.::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RRPPLGGRTVAEHVEAIEGSVQESSGPVTTIYMLAGKPRGSEGPVRSVFRHFGSFQKGQA 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD EAKVKRAIPKPPRQALNRKKGSPGLASGSVGQSPNSAPKAGLPGATGPMAVRPEEAVRGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EAKVKRAIPKPPRQALNRKKGSPGLASGSVGQSPNSAPKAGLPGATGPMAVRPEEAVRGL 730 740 750 760 770 780 790 800 810 820 830 pF1KSD GAGTESSRRAQEPVSGCGSPEQDPQKQAEEERQEEPEYENVVPISRPPEP :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GAGTESSRRAQEPVSGCGSPEQDPQKQAEEERQEEPEYENVVPISRPPEP 790 800 810 820 830 >>CCDS45564.1 SCARF1 gene_id:8578|Hs108|chr17 (569 aa) initn: 4607 init1: 4021 opt: 4021 Z-score: 2197.1 bits: 417.0 E(32554): 4.6e-116 Smith-Waterman score: 4021; 99.0% identity (99.4% similar) in 501 aa overlap (1-501:1-501) 10 20 30 40 50 60 pF1KSD MGLGLLLPLLLLWTRGTQGSELDPKGQHVCVASSPSAELQCCAGWRQKDQECTIPICEGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MGLGLLLPLLLLWTRGTQGSELDPKGQHVCVASSPSAELQCCAGWRQKDQECTIPICEGP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD DACQKDEVCVKPGLCRCKPGFFGAHCSSRCPGQYWGPDCRESCPCHPHGQCEPATGACQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 DACQKDEVCVKPGLCRCKPGFFGAHCSSRCPGQYWGPDCRESCPCHPHGQCEPATGACQC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD QADRWGARCEFPCACGPHGRCDPATGVCHCEPGWWSSTCRRPCQCNTAAARCEQATGACV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QADRWGARCEFPCACGPHGRCDPATGVCHCEPGWWSSTCRRPCQCNTAAARCEQATGACV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD CKPGWWGRRCSFRCNCHGSPCEQDSGRCACRPGWWGPECQQQCECVRGRCSAASGECTCP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 CKPGWWGRRCSFRCNCHGSPCEQDSGRCACRPGWWGPECQQQCECVRGRCSAASGECTCP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD PGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPGWNGTQCQQPCLPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 PGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPGWNGTQCQQPCLPG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD TFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTFGEDCGSTCPTCVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTFGEDCGSTCPTCVQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD GSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVPCECPEGLCHPVSGSCQPGSGSRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVPCECPEGLCHPVSGSCQPGSGSRD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD TALIVGSLVPLLLLFLGLACCACCCWAPRSDLKDRPARDGATVSRMKLQVWGTLTSLGST ::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TALIAGSLVPLLLLFLGLACCACCCWAPRSDLKDRPARDGATVSRMKLQVWGTLTSLGST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD LPCRSLSSHKLPWVTVSHHDPEVPFNHSFIEPPSAGWATDDSFSSDPESGEADEVPAYCV :::::::::::::::.: : CCDS45 LPCRSLSSHKLPWVTASSSRPLPAGPLMTPSHPILSLERQMRFLPTVCHPKKGWSLWPRQ 490 500 510 520 530 540 >>CCDS13779.2 SCARF2 gene_id:91179|Hs108|chr22 (871 aa) initn: 1779 init1: 1221 opt: 2271 Z-score: 1248.1 bits: 242.0 E(32554): 3.4e-63 Smith-Waterman score: 2322; 40.3% identity (61.8% similar) in 856 aa overlap (6-828:28-852) 10 20 30 pF1KSD MGLGLLLPLLLLWT--RGTQGSELDPKGQHVCVASSPS :: ::::: . .::.:.:..:: : :. CCDS13 MEGAGPRGAGPARRRGAGGPPSPLLPSLLLLLLLWMLPDTVAPQELNPRGRNVCRA--PG 10 20 30 40 50 40 50 60 70 80 90 pF1KSD AELQ-CCAGWRQKDQECTIPICEGPDACQKDEVCVKPGLCRCKPGFFGAHCSSRCPGQYW ... :::::::. .:: : .::: ..:...::::.:: :::. :.:::.:...:: :.: CCDS13 SQVPTCCAGWRQQGDECGIAVCEGNSTCSENEVCVRPGECRCRHGYFGANCDTKCPRQFW 60 70 80 90 100 110 100 110 120 130 140 150 pF1KSD GPDCRESCPCHPHGQCEPATGACQCQADRWGARCEFPCACGPHGRCDPATGVCHCEPGWW ::::.: : :::::::: .:: : :.: ::::::: : : :: : : .:.:.:::::: CCDS13 GPDCKELCSCHPHGQCEDVTGQCTCHARRWGARCEHACQC-QHGTCHPRSGACRCEPGWW 120 130 140 150 160 170 160 170 180 190 200 210 pF1KSD SSTCRRPCQCNTAAARCEQATGACVCKPGWWGRRCSFRCNCHGSPCEQDSGRCACRPGWW .. : : : .:..::. ::::.:. ::::: :. .: :..:::::.:::: :: . CCDS13 GAQCASACYC-SATSRCDPQTGACLCHAGWWGRSCNNQCACNSSPCEQQSGRCQCRERTF 180 190 200 210 220 230 220 230 240 250 260 270 pF1KSD GPECQQQCECVRGRCSAASGECTCPPGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCS : .:.. :.: :::: ..: :.: ::.:: :. ::::: .:. : . ::.:: ..::. CCDS13 GARCDRYCQCFRGRCHPVDGTCACEPGYRGKYCREPCPAGFYGLGCRRRCGQCKGQQPCT 240 250 260 270 280 290 280 290 300 310 320 330 pF1KSD PDTGSCESCEPGWNGTQCQQPCLPGTFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLG : : .::::::::.:.::: : .::.: ..:: :: :.::. ::.: ::. ::.: CCDS13 VAEGRCLTCEPGWNGTKCDQPCATGFYGEGCSHRCPPCRDGHACNHVTGKCTRCNAGWIG 300 310 320 330 340 350 340 350 360 370 380 390 pF1KSD PRCEDPCPTGTFGEDCGSTCPTCVQGSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCS ::: : .::.::::. .: : .: :: .: :.:: : :: ::..:: :.:: .:. CCDS13 DRCETKCSNGTYGEDCAFVCADCGSGHCDFQSGRCLCSPGVHGPHCNVTCPPGLHGADCA 360 370 380 390 400 410 400 410 420 430 440 450 pF1KSD VPCECPEGLCHPVSGSCQPGSGSRDTALIVGSLVPLLL-LFLGLACCACCCWAPRSDLKD : : : : ::.:.:. ...: .. .:.:. ::. :.:.: : : : . . CCDS13 QACSCHEDTCDPVTGACHLETNQRKGVMGAGALLVLLVCLLLSLLGCCCACRGKDPTRRP 420 430 440 450 460 470 460 470 480 490 500 510 pF1KSD RPARDGATVSRMKL--QVWGTLTSLGSTLPCRSLSSHKLPWVTVSHHDPEVPFNHSFIEP :: :. ...: : .. : .. .. :: : .::: :.:.::: . .: ::.:: CCDS13 RPRRE-LSLGRKKAPHRLCGRFSRISMKLPRIPLRRQKLPKVVVAHHDLDNTLNCSFLEP 480 490 500 510 520 530 520 530 540 550 560 pF1KSD PSA------GWATDDSFSSDPESGEADEVPAYCVP----PQEGMVPVAQAGSSEASLAAG ::. .:.. :::: .:: :.:::: : :. : . . .:: : . CCDS13 PSGLEQPSPSWSSRASFSS---FDTTDEGPVYCVPHEEAPAESRDPEVPTVPAEAP-APS 540 550 560 570 580 590 570 580 590 600 610 620 pF1KSD AFPPPEDASTPFAIPRTSSLARAKRPSVSFAEGTKFAPQSRRSSGELSSPLRKPKRLSRG : ::. ::: .: . ..: :.: .:: : .: . : . : : : : CCDS13 PVPLTTPASAEEAIPLPAS-SDSER-SASSVEGPGGALYARVARRE-ARPARA--RGEIG 600 610 620 630 640 630 640 650 660 670 680 pF1KSD AQSGPEGREAEESTGPDEAEAPESFPAAASPGDSATGH--RWPPLGSRTVAEHVEAIEGS . : . : .. :: : :. .. . .:.:. :: ::... . . CCDS13 GLSLSPSPERRKPPPPDPATKPKVSWIHGKHSAAAAGRAPSPPPPGSEAAPSPSKRKRTP 650 660 670 680 690 700 690 700 710 720 730 740 pF1KSD VQESSGPVTTIYMLAGKPRGSEGPVRSVFRHFGSFQKGQAEAKVKRAIPKPPRQALNRKK ..:. : :.:: . : : : . : :.::: : : . CCDS13 SDKSAHTVEH-----GSPRTRDPTPRP---------PGLPEEATALAAPSPPR-ARARGR 710 720 730 740 750 750 760 770 780 pF1KSD GSPGLASGS-VGQSPNSAPKAG------LPGATGPMAVRPEEAVRGLG-----AGTESSR : ::: . .: : :::.:. : : : .. : : :. . : : .... CCDS13 G-PGLLEPTDAGGPPRSAPEAASMLAAELRGKTRSLG-RAEVALGAQGPREKPAPPQKAK 760 770 780 790 800 790 800 810 820 830 pF1KSD RAQEPVSGCGSPEQDPQKQAEEERQEEPEYENV---VPISRPPEP :. :.: .: :. . : :. .::..:: CCDS13 RSVPPASPARAPPATETPGPEKAATDLPAPETPRKKTPIQKPPRKKSREAAGELGRAGAP 810 820 830 840 850 860 CCDS13 TL 870 >>CCDS46666.1 SCARF2 gene_id:91179|Hs108|chr22 (866 aa) initn: 1891 init1: 1221 opt: 2245 Z-score: 1234.1 bits: 239.4 E(32554): 2e-62 Smith-Waterman score: 2312; 40.6% identity (62.1% similar) in 855 aa overlap (6-828:28-847) 10 20 30 pF1KSD MGLGLLLPLLLLWT--RGTQGSELDPKGQHVCVASSPS :: ::::: . .::.:.:..:: : :. CCDS46 MEGAGPRGAGPARRRGAGGPPSPLLPSLLLLLLLWMLPDTVAPQELNPRGRNVCRA--PG 10 20 30 40 50 40 50 60 70 80 90 pF1KSD AELQ-CCAGWRQKDQECTIPICEGPDACQKDEVCVKPGLCRCKPGFFGAHCSSRCPGQYW ... :::::::. .:: : .::: ..:...::::.:: :::. :.:::.:...:: :.: CCDS46 SQVPTCCAGWRQQGDECGIAVCEGNSTCSENEVCVRPGECRCRHGYFGANCDTKCPRQFW 60 70 80 90 100 110 100 110 120 130 140 150 pF1KSD GPDCRESCPCHPHGQCEPATGACQCQADRWGARCEFPCACGPHGRCDPATGVCHCEPGWW ::::.: : :::::::: .:: : :.: ::::::: : : :: : : .:.:.:::::: CCDS46 GPDCKELCSCHPHGQCEDVTGQCTCHARRWGARCEHACQC-QHGTCHPRSGACRCEPGWW 120 130 140 150 160 170 160 170 180 190 200 210 pF1KSD SSTCRRPCQCNTAAARCEQATGACVCKPGWWGRRCSFRCNCHGSPCEQDSGRCACRPGWW .. : : : .:..::. ::::.:. ::::: :. .: :..:::::.:::: :: . CCDS46 GAQCASACYC-SATSRCDPQTGACLCHAGWWGRSCNNQCACNSSPCEQQSGRCQCRERTF 180 190 200 210 220 230 220 230 240 250 260 270 pF1KSD GPECQQQCECVRGRCSAASGECTCPPGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCS : .:.. :.: :::: ..: :.: ::.:: :. ::::: .:. : . ::.:: ..::. CCDS46 GARCDRYCQCFRGRCHPVDGTCACEPGYRGKYCREPCPAGFYGLGCRRRCGQCKGQQPCT 240 250 260 270 280 290 280 290 300 310 320 330 pF1KSD PDTGSCESCEPGWNGTQCQQPCLPGTFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLG : : .::::::::.:.::: : .::.: ..:: :: :.::. ::.: ::. ::.: CCDS46 VAEGRCLTCEPGWNGTKCDQPCATGFYGEGCSHRCPPCRDGHACNHVTGKCTRCNAGWIG 300 310 320 330 340 350 340 350 360 370 380 390 pF1KSD PRCEDPCPTGTFGEDCGSTCPTCVQGSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCS ::: : .::.::::. .: : .: :: .: :.:: : :: ::..:: :.:: .:. CCDS46 DRCETKCSNGTYGEDCAFVCADCGSGHCDFQSGRCLCSPGVHGPHCNVTCPPGLHGADCA 360 370 380 390 400 410 400 410 420 430 440 450 pF1KSD VPCECPEGLCHPVSGSCQPGSGSRDTALIVGSLVPLLLLFLGLACCACCCWAPRSDLKDR : : : : ::.:.:. ...: .. .:.:. ::. .: :. .::: : :. :: CCDS46 QACSCHEDTCDPVTGACHLETNQRKGVMGAGALLVLLVCLL-LSLLGCCC-ACRG--KD- 420 430 440 450 460 470 460 470 480 490 500 510 pF1KSD PARDGATVSRMKL--QVWGTLTSLGSTLPCRSLSSHKLPWVTVSHHDPEVPFNHSFIEPP :.: ...: : .. : .. .. :: : .::: :.:.::: . .: ::.::: CCDS46 PTRRELSLGRKKAPHRLCGRFSRISMKLPRIPLRRQKLPKVVVAHHDLDNTLNCSFLEPP 480 490 500 510 520 530 520 530 540 550 560 pF1KSD SA------GWATDDSFSSDPESGEADEVPAYCVP----PQEGMVPVAQAGSSEASLAAGA :. .:.. :::: .:: :.:::: : :. : . . .:: : . CCDS46 SGLEQPSPSWSSRASFSS---FDTTDEGPVYCVPHEEAPAESRDPEVPTVPAEAP-APSP 540 550 560 570 580 570 580 590 600 610 620 pF1KSD FPPPEDASTPFAIPRTSSLARAKRPSVSFAEGTKFAPQSRRSSGELSSPLRKPKRLSRGA : ::. ::: .: . ..: :.: .:: : .: . : . : : : :. CCDS46 VPLTTPASAEEAIPLPAS-SDSER-SASSVEGPGGALYARVARRE-ARPARA--RGEIGG 590 600 610 620 630 640 630 640 650 660 670 680 pF1KSD QSGPEGREAEESTGPDEAEAPESFPAAASPGDSATGH--RWPPLGSRTVAEHVEAIEGSV : . : .. :: : :. .. . .:.:. :: ::... . . CCDS46 LSLSPSPERRKPPPPDPATKPKVSWIHGKHSAAAAGRAPSPPPPGSEAAPSPSKRKRTPS 650 660 670 680 690 700 690 700 710 720 730 740 pF1KSD QESSGPVTTIYMLAGKPRGSEGPVRSVFRHFGSFQKGQAEAKVKRAIPKPPRQALNRKKG ..:. : :.:: . : : : . : :.::: : : .: CCDS46 DKSAHTVEH-----GSPRTRDPTPRP---------PGLPEEATALAAPSPPR-ARARGRG 710 720 730 740 750 760 770 780 pF1KSD SPGLASGS-VGQSPNSAPKAG------LPGATGPMAVRPEEAVRGLG-----AGTESSRR ::: . .: : :::.:. : : : .. : : :. . : : ....: CCDS46 -PGLLEPTDAGGPPRSAPEAASMLAAELRGKTRSLG-RAEVALGAQGPREKPAPPQKAKR 750 760 770 780 790 800 790 800 810 820 830 pF1KSD AQEPVSGCGSPEQDPQKQAEEERQEEPEYENV---VPISRPPEP . :.: .: :. . : :. .::..:: CCDS46 SVPPASPARAPPATETPGPEKAATDLPAPETPRKKTPIQKPPRKKSREAAGELGRAGAPT 810 820 830 840 850 860 CCDS46 L >>CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044 aa) initn: 1097 init1: 332 opt: 1025 Z-score: 573.0 bits: 117.3 E(32554): 1.3e-25 Smith-Waterman score: 1219; 35.8% identity (57.2% similar) in 495 aa overlap (18-443:193-669) 10 20 30 40 pF1KSD MGLGLLLPLLLLWTRGTQGSELDPK-GQHVCVASSPSA--ELQCCAG .:. ::. :. .:. . .. : : : CCDS10 CAAGFRGWRCEELCAPGTHGKGCQLPCQCRHGASCDPRAGECLCAPGYTGVYCEELCPPG 170 180 190 200 210 220 50 60 70 80 90 100 pF1KSD WRQKDQECTIPICEGPDACQKDEVCVK-PGLCRCKPGFFGAHCSSRCPGQYWGPDCRESC .. .: . : : ::. .: . : : : ::. :: :.. :: .: .: ..: CCDS10 --SHGAHCELR-C--P--CQNGGTCHHITGECACPPGWTGAVCAQPCPPGTFGQNCSQDC 230 240 250 260 270 110 120 130 140 150 pF1KSD PCHPHGQCEPATGACQCQADRWGARCEFPCA-------CGPH------GRCDPATGVCHC ::: :::. .:: :.: : : ::. : :. : :.:.:.::.:.: CCDS10 PCHHGGQCDHVTGQCHCTAGYMGDRCQEECPFGSFGFQCSQHCDCHNGGQCSPTTGACEC 280 290 300 310 320 330 160 170 180 190 pF1KSD EPGWWSSTCRR--------------PCQCNT-AAARCEQATGACVCKPGWWGRRCS---- :::. . :.. :: :.. . :. .::::.:.::: :..:. CCDS10 EPGYKGPRCQERLCPEGLHGPGCTLPCPCDADNTISCHPVTGACTCQPGWSGHHCNESCP 340 350 360 370 380 390 200 210 220 pF1KSD ---------FRCNCH-GSPCEQDSGRCACRPGW-------------WGPECQQQCECVRG . :.:. :. :.. .: :.: ::. .::.:.. : : : CCDS10 VGYYGDGCQLPCTCQNGADCHSITGGCTCAPGFMGEVCAVSCAAGTYGPNCSSICSCNNG 400 410 420 430 440 450 230 240 250 260 270 280 pF1KSD -RCSAASGECTCPPGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPG :: ..: ::: :..: : ::::.:. :..: .:: : .. ::: ::: :: :: CCDS10 GTCSPVDGSCTCKEGWQGLDCTLPCPSGTWGLNCNESC-TCANGAACSPIDGSC-SCTPG 460 470 480 490 500 510 290 300 310 320 330 340 pF1KSD WNGTQCQQPCLPGTFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTF : : :. :: :::: .: ..: : :...:.: :::: : :: : ::.. :: : . CCDS10 WLGDTCELPCPDGTFGLNCSEHCD-CSHADGCDPVTGHCC-CLAGWTGIRCDSTCPPGRW 520 530 540 550 560 570 350 360 370 380 390 400 pF1KSD GEDCGSTCPTCVQGSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVPCE-CPEGL-- : .:. .: :::. :.: :. :. :: :. :: ::.:..:. :: : .. CCDS10 GPNCSVSCSCENGGSCSPEDGSCECAPGFRGPLCQRICPPGFYGHGCAQPCPLCVHSSRP 580 590 600 610 620 630 410 420 430 440 450 pF1KSD CHPVSGSCQ--PG-SGSRDTALIVGSLVPLLLLFLGLAC---CACCCWAPRSDLKDRPAR :: .:: :. :: ::. . . .:. ..: : :.: CCDS10 CHHISGICECLPGFSGALCNQVCAGG-------YFGQDCAQLCSCANNGTCSPIDGSCQC 640 650 660 670 680 460 470 480 490 500 510 pF1KSD DGATVSRMKLQVWGTLTSLGSTLPCRSLSSHKLPWVTVSHHDPEVPFNHSFIEPPSAGWA CCDS10 FPGWIGKDCSQACPPGFWGPACFHACSCHNGASCSAEDGACHCTPGWTGLFCTQRCPAAF 690 700 710 720 730 740 >>CCDS30892.1 PEAR1 gene_id:375033|Hs108|chr1 (1037 aa) initn: 1156 init1: 314 opt: 980 Z-score: 548.7 bits: 112.8 E(32554): 3.1e-24 Smith-Waterman score: 1226; 29.4% identity (50.2% similar) in 851 aa overlap (18-763:194-1003) 10 20 30 40 pF1KSD MGLGLLLPLLLLWTRGTQGSELDPK-GQHVCVA--SSPSAELQCCAG .:. ::. : : : ..:: ...: : CCDS30 SCPSGLQPPNCLQPCTPGYYGPACQFRCQCHGAPCDPQTGACFCPAERTGPSCDVSCSQG 170 180 190 200 210 220 50 60 70 80 90 100 pF1KSD WRQKDQECTIPICEGPDACQKDEVCVKP-GLCRCKPGFFGAHCSSRCPGQYWGPDCRESC . .: . .::. : : : : : ::..:. :: :: . ::.: . : CCDS30 -------TSGFFCPSTHSCQNGGVFQTPQGSCSCPPGWMGTICSLPCPEGFHGPNCSQEC 230 240 250 260 270 110 120 130 140 150 pF1KSD PCHPHGQCEPATGACQCQADRWGARC--EFP-----------CACGPHGRCDPATGVCHC :: : :. :: :.: : :: : : : :.: .:: ::.:.: : CCDS30 RCHNGGLCDRFTGQCRCAPGYTGDRCREECPVGRFGQDCAETCDCAPDARCFPANGACLC 280 290 300 310 320 330 160 170 180 190 pF1KSD E-------------P-GWWSSTCRRPCQCNTAAA-RCEQATGACVCKPGWWGRRCSFRC- : : :... .:. :: :. . :. .: : : ::: : .:. : CCDS30 EHGFTGDRCTDRLCPDGFYGLSCQAPCTCDREHSLSCHPMNGECSCLPGWAGLHCNESCP 340 350 360 370 380 390 200 210 220 pF1KSD ----------NC---HGSPCEQDSGRCACRPGWWGPECQQ-------------QCECVRG .: ::. :. :: : : ::. ::.: . .: : . CCDS30 QDTHGPGCQEHCLCLHGGVCQATSGLCQCAPGYTGPHCASLCPPDTYGVNCSARCSCENA 400 410 420 430 440 450 230 240 250 260 270 280 pF1KSD -RCSAASGECTCPPGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPG :: .:::.: :.. . : .::: :. : .: :: .: :. :::.::.: .: :: CCDS30 IACSPIDGECVCKEGWQRGNCSVPCPPGTWGFSCNASC-QCAHEAVCSPQTGAC-TCTPG 460 470 480 490 500 510 290 300 310 320 330 340 pF1KSD WNGTQCQQPCLPGTFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTF :.:..:: :: : :::.: ..: : :...:.: :.:: :. ::.: ::. :: : . CCDS30 WHGAHCQLPCPKGQFGEGCASRCD-CDHSDGCDPVHGRCQ-CQAGWMGARCHLSCPEGLW 520 530 540 550 560 570 350 360 370 380 390 400 pF1KSD GEDCGSTCPTCVQG-SCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVPCECPE-GLC : .:..:: :: .: .: .:.:::. :. ::::. :: : .:. : :::.: . ..: CCDS30 GVNCSNTC-TCKNGGTCLPENGNCVCAPGFRGPSCQRSCQPGRYGKRC-VPCKCANHSFC 580 590 600 610 620 630 410 420 430 440 450 460 pF1KSD HPVSGSCQPGSG--SRDTALIVGSLVPLLLLFLGLACCACC-CWAPRSDLKDRPARDGAT :: .:.: .: . : . : : : : : . .: .::. CCDS30 HPSNGTCYCLAGWTGPDCSQ------PCPPGHWGENCAQTCQC---HHGGTCHP-QDGSC 640 650 660 670 680 470 480 490 500 510 pF1KSD VSRMKLQVWGTLTSLGSTLPCRSLSSHKLPWVTVSHHDPEVPFNHSFIEPPSAGWAT--- . . : : . : ..... . . : . . . ::. . : CCDS30 ICPLG---WTGHHCLEGC-PLGTFGANCSQPCQCGPGEKCHPETGACVCPPGHSGAPCRI 690 700 710 720 730 520 530 540 550 560 pF1KSD --DDSFSSDPESGEA-DEVPAYCVPPQEGMVPVA-----------QAGSSEASLAAGAFP .. :. : . : . . : : . :: : :. . ::. :. CCDS30 GIQEPFTVMPTTPVAYNSLGAVIGIAVLGSLVVALVALFIGYRHWQKGKEHHHLAV-AYS 740 750 760 770 780 790 570 580 590 600 610 620 pF1KSD PPEDASTPFAIPRT--SSLARAKRPSV-SFAEGTKFAPQSRRSSGELSSPLRKPKRLSRG . .. ...: . : . :: .... . : . : : . :..:.: CCDS30 SGRLDGSEYVMPDVPPSYSHYYSNPSYHTLSQCSPNPPPPNKVPGPLFASLQNPER---- 800 810 820 830 840 850 630 640 650 660 670 pF1KSD AQSGPEGREAEESTGPDEAEAPESFPAAASPGDSATGHRW-------P-PLGSRTVAEHV .: .:.. . . : . : :. . :.: . . : :. .. . . CCDS30 -PGGAQGHDNHTTLPADWKHRREPPPGPLDRGSSRLDRSYSYSYSNGPGPFYNKGLISE- 860 870 880 890 900 680 690 700 710 720 pF1KSD EAIEGSVQE--SSGPVTTIY---MLAGKPRGS-----EGPVR-SVFRHFGSFQKGQAEAK : . .:: : .: .:: : : :: : .:: : :. .: .: CCDS30 EELGASVASLSSENPYATIRDLPSLPGGPRESSYMEMKGPPSGSPPRQPPQFWDSQ---- 910 920 930 940 950 960 730 740 750 760 770 780 pF1KSD VKRAIPKPPRQALNRKKGSPGLAS-GSVGQSPNSAPKAGLPGATGPMAVRPEEAVRGLGA .: :.: :.. . .. :: . . :::..: : ::: CCDS30 -RRRQPQPQRDSGTYEQPSPLIHDRDSVGSQPPLPP--GLPPGHYDSPKNSHIPGHYDLP 970 980 990 1000 1010 1020 790 800 810 820 830 pF1KSD GTESSRRAQEPVSGCGSPEQDPQKQAEEERQEEPEYENVVPISRPPEP CCDS30 PVRHPPSPPLRRQDR 1030 >>CCDS4142.1 MEGF10 gene_id:84466|Hs108|chr5 (1140 aa) initn: 766 init1: 363 opt: 950 Z-score: 532.0 bits: 109.9 E(32554): 2.6e-23 Smith-Waterman score: 1133; 35.3% identity (52.3% similar) in 476 aa overlap (28-431:376-842) 10 20 30 40 50 pF1KSD MGLGLLLPLLLLWTRGTQGSELDPKGQHVCVASSP-SAELQCCAGWR--QKDQECTI : : : :.: : :: .. :. CCDS41 AGERCEARLCPEGLYGIKCDKRCPCHLENTHSC---HPMSGECACKPGWSGLYCNETCS- 350 360 370 380 390 400 60 70 80 90 100 pF1KSD P-----ICEGPDACQKDEVCVK-PGLCRCKPGFFGAHCSSRCPGQYWGPDCRESCPCHPH : :. .::. : . : : : ::: : ::. :: .: .: : :. CCDS41 PGFYGEACQQICSCQNGADCDSVTGKCTCAPGFKGIDCSTPCPLGTYGINCSSRCGCKND 410 420 430 440 450 460 110 120 130 140 150 pF1KSD GQCEPATGACQCQAD-------------RWGARCEFPCACGPHGRCDPATGVCHCEPGWW . : :. :.: :.: :: :.. : : : :. :.: : ::: CCDS41 AVCSPVDGSCTCKAGWHGVDCSIRCPSGTWGFGCNLTCQCLNGGACNTLDGTCTCAPGWR 470 480 490 500 510 520 160 170 180 190 pF1KSD SSTCRRPCQ-----------CNTAAAR-CEQATGACVCKPGW-------------WGRRC . :. ::: :. . : :. .:: : : ::: :: : CCDS41 GEKCELPCQDGTYGLNCAERCDCSHADGCHPTTGHCRCLPGWSGVHCDSVCAEGRWGPNC 530 540 550 560 570 580 200 210 220 230 pF1KSD SFRCNC-HGSPCEQDSGRCACRPGWWGPECQQQC--------------ECVR--GRCSAA :. : : .:. : :.: : : ::. : ::. : .::. : : CCDS41 SLPCYCKNGASCSPDDGICECAPGFRGTTCQRICSPGFYGHRCSQTCPQCVHSSGPCHHI 590 600 610 620 630 640 240 250 260 270 280 290 pF1KSD SGECTCPPGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPGWNGTQC .: : : ::: :: :. ::.: : .:: : : .: :.: ::. : ::: :..: CCDS41 TGLCDCLPGFTGALCNEVCPSGRFGKNCAGIC-TCTNNGTCNPIDRSCQ-CYPGWIGSDC 650 660 670 680 690 300 310 320 330 340 350 pF1KSD QQPCLPGTFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTFGEDCGS .::: :. .: .: . : .:..: : :.: .: ::: : : . :: : .:.::. CCDS41 SQPCPPAHWGPNCIHTC-NCHNGAFCSAYDGEC-KCTPGWTGLYCTQRCPLGFYGKDCAL 700 710 720 730 740 750 360 370 380 390 400 410 pF1KSD TCPTCVQGS-CDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVPCEC-PEGLCHPVSGS : : .:. :: ..:.:.: .:. : :. .::.: .: .: :.: .. : ..:. CCDS41 ICQ-CQNGADCDHISGQCTCRTGFMGRHCEQKCPSGTYGYGCRQICDCLNNSTCDHITGT 760 770 780 790 800 810 420 430 440 450 460 pF1KSD C--QPG-SGSR-DTA--LIVGSLVPLLLLFLGLACCACCCWAPRSDLKDRPARDGATVSR : .:: .:.: : : .:::.: : CCDS41 CYCSPGWKGARCDQAGVIIVGNLNSLSRTSTALPADSYQIGAIAGIIILVLVVLFLLALF 820 830 840 850 860 870 >-- initn: 955 init1: 297 opt: 669 Z-score: 379.9 bits: 81.7 E(32554): 7.6e-15 Smith-Waterman score: 901; 37.4% identity (54.1% similar) in 364 aa overlap (40-400:93-370) 10 20 30 40 50 60 pF1KSD LLLWTRGTQGSELDPKGQHVCVASSPSAELQCCAGWRQKDQECTIPICEGPDACQKDEVC ::: :. .. . : .: : : : . . : CCDS41 ILNWFKCTRHRVSYRTAYRHGEKTMYRRKSQCCPGFYESGEMC-VPHCA--DKCVHGR-C 70 80 90 100 110 70 80 90 100 110 120 pF1KSD VKPGLCRCKPGFFGAHCSSRCPGQYWGPDCRESCPCHPHGQCEPATGACQCQADRWGARC . :. :.:.::. :..::: : :..::: : :. :::. :: : CCDS41 IAPNTCQCEPGWGGTNCSSACDGDHWGPHC---------------TSRCQCKN---GALC 120 130 140 150 160 130 140 150 160 170 180 pF1KSD EFPCACGPHGRCDPATGVCHCEPGWWSSTCRRPCQCNTAAARCEQATGACVCKPGWWGRR .: ::.::: :. :: : CCDS41 ------------NPITGACHCAAGFR----------------------------GW---R 170 190 200 210 220 230 240 pF1KSD CSFRCNCHGSPCEQDSGRCACRPGWWGPECQQQCECVRG-RCSAASGECTCPPGFRGARC : :: :: : .: .:.:.:.: : :. ..::: ::::. :: : CCDS41 CEDRC-------EQ---------GTYGNDCHQRCQCQNGATCDHVTGECRCPPGYTGAFC 180 190 200 210 220 250 260 270 280 290 300 pF1KSD ELPCPAGSHGVQCAHSCGRCKHNEPCSPDTGSCESCEPGWNGTQCQQPCLPGTFGESCEQ : :: :.:: :: . : :... : :: : :: :: :: : ::: : ::..: : CCDS41 EDLCPPGKHGPQCEQRCP-CQNGGVCHHVTGEC-SCPSGWMGTVCGQPCPEGRFGKNCSQ 230 240 250 260 270 310 320 330 340 350 360 pF1KSD QCPHCRHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTFGEDCGSTCPTCVQGS-CDTVT .: .:..: .:. ::.:. :.::. : ::.: ::.::.: :. :: ::.:. : :. CCDS41 EC-QCHNGGTCDAATGQCH-CSPGYTGERCQDECPVGTYGVLCAETCQ-CVNGGKCYHVS 280 290 300 310 320 330 370 380 390 400 410 420 pF1KSD GDCVCSAGYWGPSCNAS-CPAGFHGNNCSVPCECPEGLCHPVSGSCQPGSGSRDTALIVG : :.: ::. : :.: :: :..: .:. : : CCDS41 GACLCEAGFAGERCEARLCPEGLYGIKCDKRCPCHLENTHSCHPMSGECACKPGWSGLYC 340 350 360 370 380 390 430 440 450 460 470 480 pF1KSD SLVPLLLLFLGLACCACCCWAPRSDLKDRPARDGATVSRMKLQVWGTLTSLGSTLPCRSL CCDS41 NETCSPGFYGEACQQICSCQNGADCDSVTGKCTCAPGFKGIDCSTPCPLGTYGINCSSRC 400 410 420 430 440 450 >>CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541 aa) initn: 606 init1: 322 opt: 776 Z-score: 436.4 bits: 92.6 E(32554): 5.5e-18 Smith-Waterman score: 1129; 36.9% identity (52.4% similar) in 471 aa overlap (13-417:778-1239) 10 20 30 40 pF1KSD MGLGLLLPLLLLWTRGTQGSELDPKGQHVCVASSPSAELQCC : : : :. : ::. . .. : CCDS41 GAPCHGVTGQCRCPPGRTGEDCEADCPEGRWGLGCQ--EICPACQHAARCDPETGACLCL 750 760 770 780 790 800 50 60 70 80 90 pF1KSD AGW---RQKDQECTI----PICEGPDACQKDEVCVKP--GLCRCKPGFFGAHCSSRCPGQ :. : .: : : :. .: .: : .: : : : ::. : :. : CCDS41 PGFVGSRCQDV-CPAGWYGPSCQTRCSCANDGHC-HPATGHCSCAPGWTGFSCQRACDTG 810 820 830 840 850 860 100 110 120 130 140 pF1KSD YWGPDCRESCPCHP-HGQCEPATGACQCQADRWGARCEFPCA---CGP---------HGR .::::: . : : ::.:. .: : :.: : ::: : :: :: CCDS41 HWGPDCSHPCNCSAGHGSCDAISGLCLCEAGYVGPRCEQQCPQGHFGPGCEQRCQCQHGA 870 880 890 900 910 920 150 160 170 180 pF1KSD -CDPATGVCHCEPGWWSSTCRRPCQ-----------CN-TAAARCEQATGACVCKPGWWG :: ..:.: : :: .. :.. : :: ::.: :. ..:.:.: : : CCDS41 ACDHVSGACTCPAGWRGTFCEHACPAGFFGLDCRSACNCTAGAACDAVNGSCLCPAGRRG 930 940 950 960 970 980 190 200 210 220 pF1KSD RRCSFRC-------NC-------HGSPCEQDSGRCACRPGWWGPECQQQC-------ECV ::. : :: .:. :. :.: : ::: :: : : : .: CCDS41 PRCAETCPAHTYGHNCSQACACFNGASCDPVHGQCHCAPGWMGPSCLQACPAGLYGDNCR 990 1000 1010 1020 1030 1040 230 240 250 260 270 pF1KSD R-------GRCSAASGECTCPPGFRGARCELPCPAGSHGVQCAHSCGRCKHNEPCSPDTG . : :. .::.:.:: :. : :: : . . : :: : : .. :.: :: CCDS41 HSCLCQNGGTCDPVSGHCACPEGWAGLACEKECLPRDVRAGCRHS-GGCLNGGLCDPHTG 1050 1060 1070 1080 1090 1100 280 290 300 310 320 330 pF1KSD SCESCEPGWNGTQCQQPCLPGTFGESCEQQCPHCRHGEACEPDTGHCQRCDPGWLGPRCE : : ::.: .::.::: : :::.: :.: : : ::. :: : :: ::. : :: CCDS41 RCL-CPAGWTGDKCQSPCLRGWFGEACAQRCS-CPPGAACHHVTGAC-RCPPGFTGSGCE 1110 1120 1130 1140 1150 340 350 360 370 380 390 pF1KSD DPCPTGTFGEDCGSTCPTCV--QGSCDTVTGDCVCSAGYWGPSCNASCPAGFHGNNCSVP . :: :.:::::.. : : . .: .:: : :.::: ::::. :: : .: .: CCDS41 QACPPGSFGEDCAQMCQ-CPGENPACHPATGTCSCAAGYHGPSCQQRCPPGRYGPGCEQL 1160 1170 1180 1190 1200 1210 400 410 420 430 440 450 pF1KSD CECPEG-LCHPVSGSCQPGSGSRDTALIVGSLVPLLLLFLGLACCACCCWAPRSDLKDRP : : .: : ..:.:. .: CCDS41 CGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQGRFGPNCTHVCGCGQGAACDPVTGTCL 1220 1230 1240 1250 1260 1270 >-- initn: 690 init1: 322 opt: 726 Z-score: 409.4 bits: 87.6 E(32554): 1.8e-16 Smith-Waterman score: 730; 31.5% identity (48.7% similar) in 409 aa overlap (24-388:380-776) 10 20 30 40 50 pF1KSD MGLGLLLPLLLLWTRGTQGSELDPKGQHVCVASSPSAELQCCAGWRQKDQECT : :.::. . . : : ::.: . . : CCDS41 SAGPLCTCPRGYELDTDQRTCIDVDDCADSPCCQQVCTNNPGGYECGCYAGYRLSADGCG 350 360 370 380 390 400 60 70 80 90 100 pF1KSD IPICEGPDACQK-----DEVCVK-PG--LCRCKPGFFGAHCSSR-C-PGQYWGPDCRESC :: : : . .. :.. : : :. :. : . : : : . : CCDS41 ---CEDVDECASSRGGCEHHCTNLAGSFQCSCEAGYR-LHEDRRGCSPLEEPMVDLDGEL 410 420 430 440 450 460 110 120 130 140 150 160 pF1KSD PC---HPHGQCEPATGACQCQADRWGARCEFPCACGPHGRCDPATGVCHCEPGWWSSTCR : :: : : :: : : : . . : .. : CCDS41 PFVRPLPHIAVLQDELPQLFQDDDVGADEEEAELRGEHTLTEKFV----CLDDSFGHDCS 470 480 490 500 510 520 170 180 190 200 pF1KSD RPCQCNTAAARCEQATGACVCKPGW-------------WGRRCSFRCNCH-GSPCEQDSG :. .. : . .: : :: .:. ::: :.:. :. :.. .: CCDS41 LTCDDCRNGGTCLLGLDGCDCPEGWTGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTG 530 540 550 560 570 580 210 220 230 240 250 pF1KSD RCACRPG-------------WWGPECQQQCECV-RGRCSAASGECTCPPGFRGARCELPC : : :: ..: .:...:.:. :::: : : : ::. : :.: : CCDS41 ACRCPPGVSGTNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTC 590 600 610 620 630 640 260 270 280 290 300 310 pF1KSD PAGSHGVQCAHSCGRC--KHNEPCSPDTGSCESCEPGWNGTQCQQPCLPGTFGESCEQQC : . : :.. : .: :.. :. ::: ::. :. : .:: : : :: .: : : CCDS41 PPWAFGPGCSEEC-QCVQPHTQSCDKRDGSC-SCKAGFRGERCQAECELGYFGPGCWQAC 650 660 670 680 690 320 330 340 350 360 pF1KSD PHCRHGEACEPDTGHC-QRCDPGWLGPRCEDPCPTGTFGEDCGSTCPTCVQGSCDTVTGD : : ::. .:.: .:: :. : : . ::.:::: .:.:.: .: . : :::. CCDS41 T-CPVGVACDSVSGECGKRCPAGFQGEDCGQECPVGTFGVNCSSSC-SCGGAPCHGVTGQ 700 710 720 730 740 750 370 380 390 400 410 420 pF1KSD CVCSAGYWGPSCNASCPAGFHGNNCSVPCECPEGLCHPVSGSCQPGSGSRDTALIVGSLV : : : : .:.:.:: : CCDS41 CRCPPGRTGEDCEADCPEGRWGLGCQEICPACQHAARCDPETGACLCLPGFVGSRCQDVC 760 770 780 790 800 810 >>CCDS78055.1 MEGF10 gene_id:84466|Hs108|chr5 (567 aa) initn: 513 init1: 297 opt: 669 Z-score: 383.2 bits: 81.3 E(32554): 5e-15 Smith-Waterman score: 1183; 35.6% identity (55.8% similar) in 464 aa overlap (40-443:93-544) 10 20 30 40 50 60 pF1KSD LLLWTRGTQGSELDPKGQHVCVASSPSAELQCCAGWRQKDQECTIPICEGPDACQKDEVC ::: :. .. . : .: : : : . . : CCDS78 ILNWFKCTRHRVSYRTAYRHGEKTMYRRKSQCCPGFYESGEMC-VPHCA--DKCVHGR-C 70 80 90 100 110 70 80 90 100 110 120 pF1KSD VKPGLCRCKPGFFGAHCSSRCPGQYWGPDCRESCPCHPHGQCEPATGACQCQADRWGARC . :. :.:.::. :..::: : :..::: : : :. . :.: ::::.: : : :: CCDS78 IAPNTCQCEPGWGGTNCSSACDGDHWGPHCTSRCQCKNGALCNPITGACHCAAGFRGWRC 120 130 140 150 160 170 130 140 150 160 pF1KSD EFPCACGPHGR-------------CDPATGVCHCEPGWWSSTCRRPC-------QCNT-- : : : .: :: .:: :.: ::. .. :. : ::. CCDS78 EDRCEQGTYGNDCHQRCQCQNGATCDHVTGECRCPPGYTGAFCEDLCPPGKHGPQCEQRC 180 190 200 210 220 230 170 180 190 200 210 pF1KSD ---AAARCEQATGACVCKPGW-------------WGRRCSFRCNCH-GSPCEQDSGRCAC .. :...:: : : :: .:. :: .:.:: :. :. .:.: : CCDS78 PCQNGGVCHHVTGECSCPSGWMGTVCGQPCPEGRFGKNCSQECQCHNGGTCDAATGQCHC 240 250 260 270 280 290 220 230 240 250 pF1KSD RPGWWGPECQQQC-------------ECVRG-RCSAASGECTCPPGFRGARCELP-CPAG ::. : .::..: .:: : .: .:: : : :: : ::: :: : CCDS78 SPGYTGERCQDECPVGTYGVLCAETCQCVNGGKCYHVSGACLCEAGFAGERCEARLCPEG 300 310 320 330 340 350 260 270 280 290 300 310 pF1KSD SHGVQCAHSCGRC--KHNEPCSPDTGSCESCEPGWNGTQCQQPCLPGTFGESCEQQCPHC .:..: . : : .... : : .: : .:.:::.: :.. : :: .::.:.: : : CCDS78 LYGIKCDKRCP-CHLENTHSCHPMSGEC-ACKPGWSGLYCNETCSPGFYGEACQQICS-C 360 370 380 390 400 410 320 330 340 350 360 370 pF1KSD RHGEACEPDTGHCQRCDPGWLGPRCEDPCPTGTFGEDCGSTCPTCVQGSCDTVTGDCVCS ..: :. ::.: : ::. : : ::: ::.: .:.: : .. :. : :.:.:. CCDS78 QNGADCDSVTGKCT-CAPGFKGIDCSTPCPLGTYGINCSSRCGCKNDAVCSPVDGSCTCK 420 430 440 450 460 470 380 390 400 410 420 430 pF1KSD AGYWGPSCNASCPAGFHGNNCSVPCECPEG-LCHPVSGSCQPGSGSRDTALIVGSLVPLL ::. : .:. ::.: : .:.. :.: .: :. ..:.: . : : .: CCDS78 AGWHGVDCSIRCPSGTWGFGCNLTCQCLNGGACNTLDGTCTCAPGWRGEK----CELPCQ 480 490 500 510 520 530 440 450 460 470 480 pF1KSD LLFLGLAC---CACCCWAPRSDLKDRPARDGATVSRMKLQVWGTLTSLGSTLPCRSLSSH :: : : : CCDS78 DGTYGLNCAERCDCSHADGCHPTTGHCRCLPGWSGLF 540 550 560 830 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 00:16:06 2016 done: Thu Nov 3 00:16:07 2016 Total Scan time: 4.950 Total Display time: 0.200 Function used was FASTA [36.3.4 Apr, 2011]