FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1008, 928 aa 1>>>pF1KA1008 928 - 928 aa - 928 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0057+/-0.000929; mu= 18.0988+/- 0.056 mean_var=79.9214+/-15.798, 0's: 0 Z-trim(106.7): 23 B-trim: 39 in 1/48 Lambda= 0.143464 statistics sampled from 9113 (9126) to 9113 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.636), E-opt: 0.2 (0.28), width: 16 Scan time: 4.440 The best scores are: opt bits E(32554) CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 ( 928) 6159 1284.9 0 CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 ( 958) 5459 1140.0 0 CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 ( 796) 5238 1094.2 0 CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 ( 971) 964 209.7 2.2e-53 CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054) 964 209.7 2.4e-53 CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 603) 566 127.2 9.3e-29 CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 ( 885) 566 127.3 1.3e-28 CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080) 323 77.2 3.7e-13 CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649) 323 77.2 4.6e-13 >>CCDS45057.1 DIS3 gene_id:22894|Hs108|chr13 (928 aa) initn: 6159 init1: 6159 opt: 6159 Z-score: 6883.1 bits: 1284.9 E(32554): 0 Smith-Waterman score: 6159; 99.9% identity (99.9% similar) in 928 aa overlap (1-928:1-928) 10 20 30 40 50 60 pF1KA1 MLKSKTFLKKTRAGGVMKIVREHYLRDDIGCGAPGCAACGGAHEGPALEPQPQDPASSVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MLKSKTFLKKTRAGGVMKIVREHYLRDDIGCGAPGCAACGGAHEGPALEPQPQDPASSVC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 PQPHYLLPDTNVLLHQIVSAWRPGTWASVASSLRLPGSLETYVEQEQGENANDRNDRAIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 PQPHYLLPDTNVLLHQIVSAWRPGTWASVASSLRLPGSLETYVEQEQGENANDRNDRAIR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 VAAKWYNEHLKKMSADNQLQVIFITNDRRNKEKAIEEGIPAFTCEEYVKSLTANPELIDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VAAKWYNEHLKKMSADNQLQVIFITNDRRNKEKAIEEGIPAFTCEEYVKSLTANPELIDR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 LACLSEEGNEIESGKIIFSEHLPLSKLQQGIKSGTYLQGTFRASRENYLEATVWIHGDNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LACLSEEGNEIESGKIIFSEHLPLSKLQQGIKSGTYLQGTFRASRENYLEATVWIHGDNE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 ENKEIILQGLKHLNRAVHEDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEERERML ::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::: CCDS45 ENKEIILQGLKHLNRAVHEDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEETERML 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 KTAVSEKMLKPTGRVVGIIKRNWRPYCGMLSKSDIKESRRHLFTPADKRIPRIRIETRQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KTAVSEKMLKPTGRVVGIIKRNWRPYCGMLSKSDIKESRRHLFTPADKRIPRIRIETRQA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 STLEGRRIIVAIDGWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 STLEGRRIIVAIDGWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 FLPKMPWSITEKDMKNREDLRHLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 FLPKMPWSITEKDMKNREDLRHLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 HFIRPGNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 HFIRPGNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 EILKTKFTKSVINSKASLTYAEAQLRIDSANMNDDITTSLRGLNKLAKILKKRRIEKGAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EILKTKFTKSVINSKASLTYAEAQLRIDSANMNDDITTSLRGLNKLAKILKKRRIEKGAL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 TLSSPEVRFHMDSETHDPIDLQTKELRETNSMVEEFMLLANISVAKKIHEEFSEHALLRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TLSSPEVRFHMDSETHDPIDLQTKELRETNSMVEEFMLLANISVAKKIHEEFSEHALLRK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 HPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYLNTLLRILATRCMMQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 HPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYLNTLLRILATRCMMQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 AVYFCSGMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAIGADCTYPELTDKHKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 AVYFCSGMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAIGADCTYPELTDKHKL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 ADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFVRKNAIVVLIPKYGLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFVRKNAIVVLIPKYGLE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 GTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLVEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLVEP 850 860 870 880 890 900 910 920 pF1KA1 QIPGISIPTDTSNMDLNGPKKKKMKLGK :::::::::::::::::::::::::::: CCDS45 QIPGISIPTDTSNMDLNGPKKKKMKLGK 910 920 >>CCDS9447.1 DIS3 gene_id:22894|Hs108|chr13 (958 aa) initn: 5995 init1: 5459 opt: 5459 Z-score: 6099.9 bits: 1140.0 E(32554): 0 Smith-Waterman score: 5927; 94.9% identity (95.4% similar) in 958 aa overlap (1-928:1-958) 10 20 30 40 50 60 pF1KA1 MLKSKTFLKKTRAGGVMKIVREHYLRDDIGCGAPGCAACGGAHEGPALEPQPQDPASSVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MLKSKTFLKKTRAGGVMKIVREHYLRDDIGCGAPGCAACGGAHEGPALEPQPQDPASSVC 10 20 30 40 50 60 70 80 90 pF1KA1 PQPHYLLPDTNVLLHQIVSAWRPG-----TWASVASSLR---LP---------------- ::::::::::::::::: :. . .: . .: : CCDS94 PQPHYLLPDTNVLLHQIDVLEDPAIRNVIVLQTVLQEVRNRSAPVYKRIRDVTNNQEKHF 70 80 90 100 110 120 100 110 120 130 140 150 pF1KA1 ------GSLETYVEQEQGENANDRNDRAIRVAAKWYNEHLKKMSADNQLQVIFITNDRRN ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 YTFTNEHHRETYVEQEQGENANDRNDRAIRVAAKWYNEHLKKMSADNQLQVIFITNDRRN 130 140 150 160 170 180 160 170 180 190 200 210 pF1KA1 KEKAIEEGIPAFTCEEYVKSLTANPELIDRLACLSEEGNEIESGKIIFSEHLPLSKLQQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 KEKAIEEGIPAFTCEEYVKSLTANPELIDRLACLSEEGNEIESGKIIFSEHLPLSKLQQG 190 200 210 220 230 240 220 230 240 250 260 270 pF1KA1 IKSGTYLQGTFRASRENYLEATVWIHGDNEENKEIILQGLKHLNRAVHEDIVAVELLPKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 IKSGTYLQGTFRASRENYLEATVWIHGDNEENKEIILQGLKHLNRAVHEDIVAVELLPKS 250 260 270 280 290 300 280 290 300 310 320 330 pF1KA1 QWVAPSSVVLHDEGQNEEDVEKEEERERMLKTAVSEKMLKPTGRVVGIIKRNWRPYCGML ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS94 QWVAPSSVVLHDEGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRNWRPYCGML 310 320 330 340 350 360 340 350 360 370 380 390 pF1KA1 SKSDIKESRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVRNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SKSDIKESRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVRNL 370 380 390 400 410 420 400 410 420 430 440 450 pF1KA1 GDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLRHLCICSVDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 GDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLRHLCICSVDP 430 440 450 460 470 480 460 470 480 490 500 510 pF1KA1 PGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVYLCEKRIDMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 PGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVYLCEKRIDMV 490 500 510 520 530 540 520 530 540 550 560 570 pF1KA1 PELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKTKFTKSVINSKASLTYAEAQLRIDSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 PELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKTKFTKSVINSKASLTYAEAQLRIDSA 550 560 570 580 590 600 580 590 600 610 620 630 pF1KA1 NMNDDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHMDSETHDPIDLQTKELRETN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 NMNDDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHMDSETHDPIDLQTKELRETN 610 620 630 640 650 660 640 650 660 670 680 690 pF1KA1 SMVEEFMLLANISVAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKTDTAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SMVEEFMLLANISVAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKTDTAKS 670 680 690 700 710 720 700 710 720 730 740 750 pF1KA1 LAESLDQAESPTFPYLNTLLRILATRCMMQAVYFCSGMDNDFHHYGLASPIYTHFTSPIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 LAESLDQAESPTFPYLNTLLRILATRCMMQAVYFCSGMDNDFHHYGLASPIYTHFTSPIR 730 740 750 760 770 780 760 770 780 790 800 810 pF1KA1 RYADVIVHRLLAVAIGADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 RYADVIVHRLLAVAIGADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFF 790 800 810 820 830 840 820 830 840 850 860 870 pF1KA1 KSKGIVSEEAYILFVRKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 KSKGIVSEEAYILFVRKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTV 850 860 870 880 890 900 880 890 900 910 920 pF1KA1 FHVFDKVKVKIMLDSSNLQHQKIRMSLVEPQIPGISIPTDTSNMDLNGPKKKKMKLGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 FHVFDKVKVKIMLDSSNLQHQKIRMSLVEPQIPGISIPTDTSNMDLNGPKKKKMKLGK 910 920 930 940 950 >>CCDS81772.1 DIS3 gene_id:22894|Hs108|chr13 (796 aa) initn: 5238 init1: 5238 opt: 5238 Z-score: 5853.9 bits: 1094.2 E(32554): 0 Smith-Waterman score: 5238; 99.9% identity (99.9% similar) in 796 aa overlap (133-928:1-796) 110 120 130 140 150 160 pF1KA1 VEQEQGENANDRNDRAIRVAAKWYNEHLKKMSADNQLQVIFITNDRRNKEKAIEEGIPAF :::::::::::::::::::::::::::::: CCDS81 MSADNQLQVIFITNDRRNKEKAIEEGIPAF 10 20 30 170 180 190 200 210 220 pF1KA1 TCEEYVKSLTANPELIDRLACLSEEGNEIESGKIIFSEHLPLSKLQQGIKSGTYLQGTFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 TCEEYVKSLTANPELIDRLACLSEEGNEIESGKIIFSEHLPLSKLQQGIKSGTYLQGTFR 40 50 60 70 80 90 230 240 250 260 270 280 pF1KA1 ASRENYLEATVWIHGDNEENKEIILQGLKHLNRAVHEDIVAVELLPKSQWVAPSSVVLHD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 ASRENYLEATVWIHGDNEENKEIILQGLKHLNRAVHEDIVAVELLPKSQWVAPSSVVLHD 100 110 120 130 140 150 290 300 310 320 330 340 pF1KA1 EGQNEEDVEKEEERERMLKTAVSEKMLKPTGRVVGIIKRNWRPYCGMLSKSDIKESRRHL ::::::::::::: :::::::::::::::::::::::::::::::::::::::::::::: CCDS81 EGQNEEDVEKEEETERMLKTAVSEKMLKPTGRVVGIIKRNWRPYCGMLSKSDIKESRRHL 160 170 180 190 200 210 350 360 370 380 390 400 pF1KA1 FTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVRNLGDVGEKETETEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 FTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVRNLGDVGEKETETEV 220 230 240 250 260 270 410 420 430 440 450 460 pF1KA1 LLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLRHLCICSVDPPGCTDIDDALHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLRHLCICSVDPPGCTDIDDALHC 280 290 300 310 320 330 470 480 490 500 510 520 pF1KA1 RELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 RELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLK 340 350 360 370 380 390 530 540 550 560 570 580 pF1KA1 CDVDRLAFSCIWEMNHNAEILKTKFTKSVINSKASLTYAEAQLRIDSANMNDDITTSLRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 CDVDRLAFSCIWEMNHNAEILKTKFTKSVINSKASLTYAEAQLRIDSANMNDDITTSLRG 400 410 420 430 440 450 590 600 610 620 630 640 pF1KA1 LNKLAKILKKRRIEKGALTLSSPEVRFHMDSETHDPIDLQTKELRETNSMVEEFMLLANI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LNKLAKILKKRRIEKGALTLSSPEVRFHMDSETHDPIDLQTKELRETNSMVEEFMLLANI 460 470 480 490 500 510 650 660 670 680 690 700 pF1KA1 SVAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 SVAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPT 520 530 540 550 560 570 710 720 730 740 750 760 pF1KA1 FPYLNTLLRILATRCMMQAVYFCSGMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 FPYLNTLLRILATRCMMQAVYFCSGMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLA 580 590 600 610 620 630 770 780 790 800 810 820 pF1KA1 VAIGADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 VAIGADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYI 640 650 660 670 680 690 830 840 850 860 870 880 pF1KA1 LFVRKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LFVRKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIM 700 710 720 730 740 750 890 900 910 920 pF1KA1 LDSSNLQHQKIRMSLVEPQIPGISIPTDTSNMDLNGPKKKKMKLGK :::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LDSSNLQHQKIRMSLVEPQIPGISIPTDTSNMDLNGPKKKKMKLGK 760 770 780 790 >>CCDS10214.1 DIS3L gene_id:115752|Hs108|chr15 (971 aa) initn: 1195 init1: 378 opt: 964 Z-score: 1071.8 bits: 209.7 E(32554): 2.2e-53 Smith-Waterman score: 1709; 37.2% identity (64.7% similar) in 886 aa overlap (102-912:43-906) 80 90 100 110 120 130 pF1KA1 VLLHQIVSAWRPGTWASVASSLRLPGSLETYVEQEQGENANDRNDRAIRVAAKWYNEHLK :. .:.::. . . :.: :: :: .: . CCDS10 GRRQYNKLRNLLKDARHDCILFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQ 20 30 40 50 60 70 140 150 160 170 180 pF1KA1 KMSADNQLQVIFITNDRRNKEK--AIEEGIPAFTCEEYVKS----LTANPELIDR-LACL ... ....:.:.. .. . ::. ..: ..:. . : : :: : : CCDS10 -----DRMPIVMVTEDEEAIQQYGSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSR 80 90 100 110 120 190 200 210 220 230 pF1KA1 SEEGNEI-ESGKIIFSEHLPLSKLQQGIKSGTYLQGTFRASREN-YLEATVWIHG----D :. :: :: . ::::: :. ::::: :.:: . .... .:: : ..: : CCDS10 RERENESQESHGKEYPEHLPLEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKD 130 140 150 160 170 180 240 250 260 270 280 290 pF1KA1 NEENKEIILQGLKHLNRAVHEDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEERER .. ..:...:.: ::..: :.:.::::::..: .:.: :.: . . : CCDS10 SDLVSDILIHGMKARNRSIHGDVVVVELLPKNEW-KGRTVAL-----CENDCDDKASGE- 190 200 210 220 230 240 300 310 320 330 340 350 pF1KA1 MLKTAVSEKMLKPTGRVVGIIKRNWRPYCGML-SKSDI----KESRRHLFTPADKRIPRI . :: : ::::::::...::: : . :: .. :.... : :: : :::.: CCDS10 ----SPSEPM--PTGRVVGILQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKI 250 260 270 280 290 360 370 380 390 400 410 pF1KA1 RIETRQASTLEGRRIIVAIDGWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQP :: :.:: ::. :..: ::.: .: :::::::: :: .:. : : ..:.:... : CCDS10 RISTQQAETLQDFRVVVRIDSWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIP 300 310 320 330 340 350 420 430 440 450 460 pF1KA1 FSQAVLSFLP----KMPWSITEKDMKNREDLR--HLCICSVDPPGCTDIDDALHCRELEN ::.: . .: . ::... .. ..:.::: :: . :.:: :: :.::.: : :.: CCDS10 FSEAQMCEMPVNTPESPWKVSPEEEQKRKDLRKSHL-VFSIDPKGCEDVDDTLSVRTLNN 360 370 380 390 400 410 470 480 490 500 510 520 pF1KA1 GNLEVGVHIADVSHFIRPGNALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDR ::::.:::::::.::. :.. .: :. :.:: :: ..: ::.: .::..:::: ::: CCDS10 GNLELGVHIADVTHFVAPNSYIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDR 420 430 440 450 460 470 530 540 550 560 570 pF1KA1 LAFSCIWEMNHNA-EILKTKFTKSVINSKASLTYAEAQLRIDSA-NMNDDIT-------- : : .::... . :: :. . ...: : .: : :: .:. .. ::: CCDS10 YAVSIMWELDKASYEIKKVWYGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEK 480 490 500 510 520 530 580 590 600 610 620 pF1KA1 ---TSLRGL----NKLAKILKKRRIEK---GALTLSSPEVRFHMDSET--HDPIDLQTKE ..:. : .::. : .. : .. ::: : . :: ..:.. :: : : : CCDS10 SRQAKLEELVWAIGKLTDIARHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLE 540 550 560 570 580 590 630 640 650 660 670 680 pF1KA1 LRETNSMVEEFMLLANISVAKKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKT ..:: : : :.::: ::::: : : ..::::.:: : . : . :..... : : CCDS10 VHET---VAECMILANHWVAKKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDT 600 610 620 630 640 650 690 700 710 720 730 740 pF1KA1 DTAKSLAESLDQAESPTFPYLNTLLRILATRCMMQAVYFCSG--MDNDFHHYGLASPIYT . :.::.:::.:..: : .: ::: .::. : .:.:: .: ...::::::: :: CCDS10 RSNKTLADSLDNANDPHDPIVNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYT 660 670 680 690 700 710 750 760 770 780 790 800 pF1KA1 HFTSPIRRYADVIVHRLLAVAIGADCTYP---ELTDKHKLADICKNLNFRHKMAQYAQRA :::::::::.:..::::: .::. : . .: ... : ..:...: :.. ::..:. CCDS10 HFTSPIRRYSDIVVHRLLMAAISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQ 720 730 740 750 760 770 810 820 830 840 pF1KA1 SVAFHTQLFFKSKGIVSEE-----AYILFVRKNAIVVLIPKYGLEGTVFFEEKD------ :. . ..::.: ..:: . : .: :.....::..:..:......:: CCDS10 STELFQCMYFKDKDPATEERCISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISC 780 790 800 810 820 830 850 860 870 880 890 pF1KA1 --------KPNPQLIYDDEIPSLKI--EDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLV- ::. ....: : :...::.::.: :.: ...: . . ::. .. CCDS10 GPDSCSEWKPGSLQRFQNKITSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIIS 840 850 860 870 880 890 900 910 920 pF1KA1 -EP-QIPGISIPTDTSNMDLNGPKKKKMKLGK .: .::. . ..: CCDS10 NKPYKIPNTELIHQSSPLLKSELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSL 900 910 920 930 940 950 >>CCDS45286.1 DIS3L gene_id:115752|Hs108|chr15 (1054 aa) initn: 1260 init1: 378 opt: 964 Z-score: 1071.2 bits: 209.7 E(32554): 2.4e-53 Smith-Waterman score: 1762; 35.6% identity (62.5% similar) in 1012 aa overlap (3-912:5-989) 10 20 30 40 50 pF1KA1 MLKSKTFLKKTRAGGVMKIVREHYLRDDIGCGAPGC---AACGGAHEGPALEPQPQDP . :..: .: : ...:::::::: . : .: : ::: .:.: : .: CCDS45 MLQKREKVLLLRTFQGRTLRIVREHYLRPCVPCHSPLCPQPAAC--SHDGKLL---SSDV 10 20 30 40 50 60 70 80 90 pF1KA1 ASSVCPQ----PHYL----LPDTN--VLLHQIVSAWRPGTWASVASSLR----------- . : :. :: .:. . .... .: . ..:: CCDS45 THYVIPDWKVVQDYLEILEFPELKGIIFMQTACQAVQHQRGRRQYNKLRNLLKDARHDCI 60 70 80 90 100 110 100 110 120 130 140 150 pF1KA1 -LPGSLET--YVEQEQGENANDRNDRAIRVAAKWYNEHLKKMSADNQLQVIFITNDRRNK . . .. :. .:.::. . . :.: :: :: .: . ... ....:.:.. CCDS45 LFANEFQQCCYLPRERGESMEKWQTRSIYNAAVWYYHHCQ-----DRMPIVMVTEDEEAI 120 130 140 150 160 170 160 170 180 190 200 pF1KA1 EK--AIEEGIPAFTCEEYVKS----LTANPELIDR-LACLSEEGNEI-ESGKIIFSEHLP .. . ::. ..: ..:. . : : :: : : :. :: :: . :::: CCDS45 QQYGSETEGVFVITFKNYLDNFWPDLKAAHELCDSILQSRRERENESQESHGKEYPEHLP 180 190 200 210 220 230 210 220 230 240 250 pF1KA1 LSKLQQGIKSGTYLQGTFRASREN-YLEATVWIHG----DNEENKEIILQGLKHLNRAVH : :. ::::: :.:: . .... .:: : ..: :.. ..:...:.: ::..: CCDS45 LEVLEAGIKSGRYIQGILNVNKHRAQIEAFVRLQGASSKDSDLVSDILIHGMKARNRSIH 240 250 260 270 280 290 260 270 280 290 300 310 pF1KA1 EDIVAVELLPKSQWVAPSSVVLHDEGQNEEDVEKEEERERMLKTAVSEKMLKPTGRVVGI :.:.::::::..: . .:.: :.: . . : . :: : :::::::: CCDS45 GDVVVVELLPKNEWKG-RTVAL-----CENDCDDKASGE-----SPSEPM--PTGRVVGI 300 310 320 330 320 330 340 350 360 370 pF1KA1 IKRNWRPYCGML-SKSDI----KESRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAID ...::: : . :: .. :.... : :: : :::.::: :.:: ::. :..: :: CCDS45 LQKNWRDYVVTFPSKEEVQSQGKNAQKILVTPWDYRIPKIRISTQQAETLQDFRVVVRID 340 350 360 370 380 390 380 390 400 410 420 pF1KA1 GWPRNSRYPNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLP----KMPWSI .: .: :::::::: :: .:. : : ..:.:... :::.: . .: . ::.. CCDS45 SWESTSVYPNGHFVRVLGRIGDLEGEIATILVENSISVIPFSEAQMCEMPVNTPESPWKV 400 410 420 430 440 450 430 440 450 460 470 480 pF1KA1 TEKDMKNREDLR--HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGN . .. ..:.::: :: . :.:: :: :.::.: : :.:::::.:::::::.::. :.. CCDS45 SPEEEQKRKDLRKSHL-VFSIDPKGCEDVDDTLSVRTLNNGNLELGVHIADVTHFVAPNS 460 470 480 490 500 510 490 500 510 520 530 540 pF1KA1 ALDQESARRGTTVYLCEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNA-EILKTK .: :. :.:: :: ..: ::.: .::..:::: ::: : : .::... . :: :. CCDS45 YIDIEARTRATTYYLADRRYDMLPSVLSADLCSLLGGVDRYAVSIMWELDKASYEIKKVW 520 530 540 550 560 570 550 560 570 580 590 pF1KA1 FTKSVINSKASLTYAEAQLRIDSA-NMNDDIT-----------TSLRGL----NKLAKIL . ...: : .: : :: .:. .. ::: ..:. : .::. : CCDS45 YGRTIIRSAYKLFYEAAQELLDGNLSVVDDIPEFKDLDEKSRQAKLEELVWAIGKLTDIA 580 590 600 610 620 630 600 610 620 630 640 pF1KA1 KKRRIEK---GALTLSSPEVRFHMDSET--HDPIDLQTKELRETNSMVEEFMLLANISVA .. : .. ::: : . :: ..:.. :: : : :..:: : : :.::: :: CCDS45 RHVRAKRDGCGALELEGVEVCVQLDDKKNIHDLIPKQPLEVHET---VAECMILANHWVA 640 650 660 670 680 690 650 660 670 680 690 700 pF1KA1 KKIHEEFSEHALLRKHPAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPY ::: : : ..::::.:: : . : . :..... : : . :.::.:::.:..: : CCDS45 KKIWESFPHQALLRQHPPPHQEFFSELRECAKAKGFFIDTRSNKTLADSLDNANDPHDPI 700 710 720 730 740 750 710 720 730 740 750 760 pF1KA1 LNTLLRILATRCMMQAVYFCSG--MDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAV .: ::: .::. : .:.:: .: ...::::::: :::::::::::.:..::::: . CCDS45 VNRLLRSMATQAMSNALYFSTGSCAEEEFHHYGLALDKYTHFTSPIRRYSDIVVHRLLMA 760 770 780 790 800 810 770 780 790 800 810 pF1KA1 AIGADCTYP---ELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEE- ::. : . .: ... : ..:...: :.. ::..:. :. . ..::.: ..:: CCDS45 AISKDKKMEIKGNLFSNKDLEELCRHINNRNQAAQHSQKQSTELFQCMYFKDKDPATEER 820 830 840 850 860 870 820 830 840 850 860 pF1KA1 ----AYILFVRKNAIVVLIPKYGLEGTVFFEEKD--------------KPNPQLIYDDEI . : .: :.....::..:..:......:: ::. ....: CCDS45 CISDGVIYSIRTNGVLLFIPRFGIKGAAYLKNKDGLVISCGPDSCSEWKPGSLQRFQNKI 880 890 900 910 920 930 870 880 890 900 910 pF1KA1 PSLKI--EDTVFHVFDKVKVKIMLDSSNLQHQKIRMSLV--EP-QIPGISIPTDTSNMDL : :...::.::.: :.: ...: . . ::. .. .: .::. . ..: CCDS45 TSTTTDGESVTFHLFDHVTVRISIQASRCHSDTIRLEIISNKPYKIPNTELIHQSSPLLK 940 950 960 970 980 990 920 pF1KA1 NGPKKKKMKLGK CCDS45 SELVKEVTKSVEEAQLAQEVKVNIIQEEYQEYRQTKGRSLYTLLEEIRDLALLDVSNNYG 1000 1010 1020 1030 1040 1050 >>CCDS58752.1 DIS3L2 gene_id:129563|Hs108|chr2 (603 aa) initn: 702 init1: 442 opt: 566 Z-score: 629.8 bits: 127.2 E(32554): 9.3e-29 Smith-Waterman score: 654; 31.7% identity (58.3% similar) in 460 aa overlap (195-569:47-503) 170 180 190 200 210 220 pF1KA1 EEYVKSLTANPELIDRLACLSEEGNEIESGKIIFSEHLPLSKLQQGIKSGTYLQGTFRAS : :: .. ...:.: :: .::..: . CCDS58 RGVSAVAGPHDIGASPGDKKSKNRSTRGKKKSIFETYMSKEDVSEGLKRGTLIQGVLRIN 20 30 40 50 60 70 230 240 250 260 270 pF1KA1 RENYLEATVWIHGDNEENKEIILQGLKHLNRAVHEDIVAVELLPKSQW--VAPSS----- ... :: . . . ...:...:. :::.. :.:.:.:::. .: : : : CCDS58 PKKFHEAFI---PSPDGDRDIFIDGVVARNRALNGDLVVVKLLPEEHWKVVKPESNDKET 80 90 100 110 120 130 280 290 pF1KA1 ------------------------------VVLHDE--GQNEED------------VEK- :... . :.. :: :.: CCDS58 EAAYESDIPEELCGHHLPQQSLKSYNDSPDVIVEAQFDGSDSEDGHGITQNVLVDGVKKL 140 150 160 170 180 190 300 310 320 330 pF1KA1 -----EEERER----MLKT----------AVSEKMLKPTGRVVGII-KRNWRPYCGMLSK :. :: . : :.::: :. ...:: :. :.. : :.:. CCDS58 SVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSAKVVYILEKKHSRAATGFLKL 200 210 220 230 240 250 340 350 360 370 380 pF1KA1 SDIKES---RRH-LFTPADKRIPRIRIETR--------QASTLEGRRIIVAIDGWPRNSR :.: :.. ::.:.:.:.::: . . . . . .: : : .. CCDS58 LADKNSELFRKYALFSPSDHRVPRIYVPLKDCPQDFVARPKDYANTLFICRIVDWKEDCN 260 270 280 290 300 310 390 400 410 420 430 pF1KA1 YPNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPK-MPWSITEKDMKNRED . :.....::..:: : ::: .: :. : . ::. :: ::. .::.: .....:.: CCDS58 FALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEVLECLPQGLPWTIPPEEFSKRRD 320 330 340 350 360 370 440 450 460 470 480 490 pF1KA1 LRHLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTT ::. :: ..:: :.:::: :. : .::..:::::::::.:. :. ::. .:.:.:. CCDS58 LRKDCIFTIDPSTARDLDDALSCKPLADGNFKVGVHIADVSYFVPEGSDLDKVAAERATS 380 390 400 410 420 430 500 510 520 530 540 550 pF1KA1 VYLCEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKTKFTKSVINSKASLT ::: .: . :.:.:: .::::. :.:.:: :: .. ...:: : ...: : ..:. CCDS58 VYLVQKVVPMLPRLLCEELCSLNPMSDKLTFSVIWTLTPEGKILDEWFGRTIIRSCTKLS 440 450 460 470 480 490 560 570 580 590 600 610 pF1KA1 YAEAQLRIDSANMNDDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHMDSETHDPI : .:: :.: CCDS58 YEHAQSMIESPTEKIPAKELPPISPEHSSEEVHQQNADKDGAAHLQASHSPSAEDAEAQP 500 510 520 530 540 550 >>CCDS42834.1 DIS3L2 gene_id:129563|Hs108|chr2 (885 aa) initn: 859 init1: 449 opt: 566 Z-score: 627.2 bits: 127.3 E(32554): 1.3e-28 Smith-Waterman score: 1210; 32.2% identity (59.3% similar) in 816 aa overlap (195-893:47-856) 170 180 190 200 210 220 pF1KA1 EEYVKSLTANPELIDRLACLSEEGNEIESGKIIFSEHLPLSKLQQGIKSGTYLQGTFRAS : :: .. ...:.: :: .::..: . CCDS42 RGVSAVAGPHDIGASPGDKKSKNRSTRGKKKSIFETYMSKEDVSEGLKRGTLIQGVLRIN 20 30 40 50 60 70 230 240 250 260 270 pF1KA1 RENYLEATVWIHGDNEENKEIILQGLKHLNRAVHEDIVAVELLPKSQW--VAPSS----- ... :: . . . ...:...:. :::.. :.:.:.:::. .: : : : CCDS42 PKKFHEAFI---PSPDGDRDIFIDGVVARNRALNGDLVVVKLLPEEHWKVVKPESNDKET 80 90 100 110 120 130 280 290 pF1KA1 ------------------------------VVLHDE--GQNEED------------VEK- :... . :.. :: :.: CCDS42 EAAYESDIPEELCGHHLPQQSLKSYNDSPDVIVEAQFDGSDSEDGHGITQNVLVDGVKKL 140 150 160 170 180 190 300 310 320 330 pF1KA1 -----EEERER----MLKT----------AVSEKMLKPTGRVVGII-KRNWRPYCGMLSK :. :: . : :.::: :. ...:: :. :.. : :.:. CCDS42 SVCVSEKGREDGDAPVTKDETTCISQDTRALSEKSLQRSAKVVYILEKKHSRAATGFLKL 200 210 220 230 240 250 340 350 360 370 380 pF1KA1 SDIKES---RRH-LFTPADKRIPRIRIETR--------QASTLEGRRIIVAIDGWPRNSR :.: :.. ::.:.:.:.::: . . . . . .: : : .. CCDS42 LADKNSELFRKYALFSPSDHRVPRIYVPLKDCPQDFVARPKDYANTLFICRIVDWKEDCN 260 270 280 290 300 310 390 400 410 420 430 pF1KA1 YPNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPK-MPWSITEKDMKNRED . :.....::..:: : ::: .: :. : . ::. :: ::. .::.: .....:.: CCDS42 FALGQLAKSLGQAGEIEPETEGILTEYGVDFSDFSSEVLECLPQGLPWTIPPEEFSKRRD 320 330 340 350 360 370 440 450 460 470 480 490 pF1KA1 LRHLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTT ::. :: ..:: :.:::: :. : .::..:::::::::.:. :. ::. .:.:.:. CCDS42 LRKDCIFTIDPSTARDLDDALSCKPLADGNFKVGVHIADVSYFVPEGSDLDKVAAERATS 380 390 400 410 420 430 500 510 520 530 540 550 pF1KA1 VYLCEKRIDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKTKFTKSVINSKASLT ::: .: . :.:.:: .::::. :.:.:: :: .. ...:: : ...: : ..:. CCDS42 VYLVQKVVPMLPRLLCEELCSLNPMSDKLTFSVIWTLTPEGKILDEWFGRTIIRSCTKLS 440 450 460 470 480 490 560 570 580 590 600 pF1KA1 YAEAQLRIDSA---------------NMNDDITTSLRGLNKLAKILKKRRIEKGALTLSS : .:: :.: . .... .. .:. .:: :...:. ::: :.. CCDS42 YEHAQSMIESPTEKIPAKELPPISPEHSSEEVHQAVLNLHGIAKQLRQQRFVDGALRLDQ 500 510 520 530 540 550 610 620 630 640 650 660 pF1KA1 PEVRFHMDSETHDPIDLQTKELRETNSMVEEFMLLANISVAKKIHEEFSEHALLRKHPAP .. : .: :: : . : ::.:..:::::::::..::.:::. : :.::::.:: : CCDS42 LKLAFTLDHETGLPQGCHIYEYRESNKLVEEFMLLANMAVAHKIHRAFPEQALLRRHPPP 560 570 580 590 600 610 670 680 690 700 710 720 pF1KA1 PPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL--NTLLRILATRCMMQAV ::. . .: . ..: .: .:: :. . : . .: . .: :..:. CCDS42 QTRMLSDLVEFCDQMGLPVDFSSAGALNKSLTQTFGDDKYSLARKEVLTNMCSRPMQMAL 620 630 640 650 660 670 730 740 750 760 770 pF1KA1 YFCSGMDND---FHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAIGADCTYPELTDK-H :::::. .: :.::.: :.::::::::::.:::.::::::.:.: : . CCDS42 YFCSGLLQDPAQFRHYALNVPLYTHFTSPIRRFADVLVHRLLAAALGYRERLDMAPDTLQ 680 690 700 710 720 730 780 790 800 810 820 830 pF1KA1 KLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFVRKNAIVVLIPKYG : :: : : :. .. .:. :... .. : .: . ::... . :.:. ::. .:: CCDS42 KQADHC---NDRRMASKRVQELSTSLFFAVLVKESGPLESEAMVMGILKQAFDVLVLRYG 740 750 760 770 780 790 840 850 860 870 880 pF1KA1 LEGTVF----------FEE-KDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDSSN .. .. :.. ::. :... : . . :. .:. :.: .. .:. CCDS42 VQKRIYCNALALRSHHFQKVGKKPELTLVWEPEDMEQEPAQQVITIFSLVEVVLQAESTA 800 810 820 830 840 850 890 900 910 920 pF1KA1 LQHQKIRMSLVEPQIPGISIPTDTSNMDLNGPKKKKMKLGK :... : CCDS42 LKYSAILKRPGTQGHLGPEKEEEESDGEPEDSSTS 860 870 880 >>CCDS13527.1 HELZ2 gene_id:85441|Hs108|chr20 (2080 aa) initn: 290 init1: 123 opt: 323 Z-score: 349.6 bits: 77.2 E(32554): 3.7e-13 Smith-Waterman score: 424; 24.0% identity (53.4% similar) in 558 aa overlap (313-813:620-1167) 290 300 310 320 pF1KA1 EGQNEEDVEKEEERERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC--- :::.:..::. : : CCDS13 GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP 590 600 610 620 630 640 330 340 350 360 370 380 pF1KA1 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY : ..: ...:. :. ... :. :. .: : . ..: . : : : .. : CCDS13 INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY 650 660 670 680 690 700 390 400 410 420 430 440 pF1KA1 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR : : . : ... : ..: ::... : .::... . . . . ::: : CCDS13 PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR 710 720 730 740 750 760 450 460 470 480 490 500 pF1KA1 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY . .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. : CCDS13 AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY 770 780 790 800 810 820 510 520 530 540 550 pF1KA1 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT .. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:. CCDS13 APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS 830 840 850 860 870 880 560 570 580 590 600 610 pF1KA1 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM : ::. : .:. . :.. . . . ....:...:... . . : CCDS13 YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG 890 900 910 920 930 940 620 630 640 650 pF1KA1 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH .: ...:: . . : .: ::.. .. . . : . :. ... CCDS13 FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR 950 960 970 980 990 1000 660 670 680 690 700 pF1KA1 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL . : : .:: . ..:.. .. .. .:. ..... . . . :.: CCDS13 VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLV--TTDDMHPFL 1010 1020 1030 1040 1050 1060 710 720 730 740 750 760 pF1KA1 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI : : .: :. : ... ::.: :: ::::::: ::...: . .:. CCDS13 APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL 1070 1080 1090 1100 1110 1120 770 780 790 800 810 820 pF1KA1 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV : . : . .:. ....: .:: :: . ..: . .:.. CCDS13 GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE 1130 1140 1150 1160 1170 830 840 850 860 870 880 pF1KA1 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS CCDS13 AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP 1180 1190 1200 1210 1220 1230 >>CCDS33508.1 HELZ2 gene_id:85441|Hs108|chr20 (2649 aa) initn: 290 init1: 123 opt: 323 Z-score: 348.0 bits: 77.2 E(32554): 4.6e-13 Smith-Waterman score: 424; 24.0% identity (53.4% similar) in 558 aa overlap (313-813:1189-1736) 290 300 310 320 pF1KA1 EGQNEEDVEKEEERERMLKTAVSEKMLKPTGRVVGIIKRN------------WRPYC--- :::.:..::. : : CCDS33 GRLDCGMAFAGDEVLVQLLSGDKAPEGRLRGRVLGVLKRKRHELAFVCRMDTWDPRIMVP 1160 1170 1180 1190 1200 1210 330 340 350 360 370 380 pF1KA1 --GMLSK---SDIKE-SRRHLFTPADKRIPRIRIETRQASTLEGRRIIVAIDGWPRNSRY : ..: ...:. :. ... :. :. .: : . ..: . : : : .. : CCDS33 INGSVTKIFVAELKDPSQVPIYSLRKGRLQRVGLERLTAEARHSRLFWVQIVLWRQGFYY 1220 1230 1240 1250 1260 1270 390 400 410 420 430 440 pF1KA1 PNGHFVRNLGDVGEKETETEVLLLEHDVPHQPFSQAVLSFLPKMPWSITEKDMKNREDLR : : . : ... : ..: ::... : .::... . . . . ::: : CCDS33 PLGIVREVLPEASTWEQGLRILGLEYSLRVPPSDQATITKVLQKYHTELGRVAGRREDCR 1280 1290 1300 1310 1320 1330 450 460 470 480 490 500 pF1KA1 HLCICSVDPPGCTDIDDALHCRELENGNLEVGVHIADVSHFIRPGNALDQESARRGTTVY . .::: : ..:::: :.: . ::.:::.::. :. ..:: :. :.:.. : CCDS33 AFLTFTVDPQGACNLDDALSVRDL-GPRCEVAVHITDVASFVPRDGVLDVEARRQGAAFY 1340 1350 1360 1370 1380 1390 510 520 530 540 550 pF1KA1 LCEKR-IDMVPELLSSNLCSLKCDVDRLAFSCIWEMNHNAEILKT-KFTKSVINSKASLT .. . :.: : ... :: ::::.: . :.. . ::. .:. ::..: .:. CCDS33 APGREPVPMLPASLCQDVLSLLPGRDRLAISLFLTMEKASGQLKSLRFAPSVVQSDRQLS 1400 1410 1420 1430 1440 1450 560 570 580 590 600 610 pF1KA1 YAEAQLRI---DSANMN-----DDITTSLRGLNKLAKILKKRRIEKGALTLSSPEVRFHM : ::. : .:. . :.. . . . ....:...:... . . : CCDS33 YEEAEEVIRQHPGAGRELPARLDSVDACVVAACYFSRLLRRHRLRSDCFYEQPDEDGTLG 1460 1470 1480 1490 1500 1510 620 630 640 650 pF1KA1 DSETHDPIDLQTKE-LRETNSMVEEFMLLANISVA---------------KKIHEEFSEH .: ...:: . . : .: ::.. .. . . : . :. ... CCDS33 FRAAH----IMVKEYMIQFNRLVAEFLVGSECTRTVTPLRWQPAPRSQQLKALCEKHGDR 1520 1530 1540 1550 1560 1570 660 670 680 690 700 pF1KA1 ALLRKH---------PAPPPSNYEILVKAARSRNLEIKTDTAKSLAESLDQAESPTFPYL . : : .:: . ..:.. .. .. .:. ..... . . . :.: CCDS33 VPLSLHLGHHLHGGGGSPPDTRLHLLASLWKQVQFAARTQDYEQMVDLV--TTDDMHPFL 1580 1590 1600 1610 1620 1630 710 720 730 740 750 760 pF1KA1 NTLLRILATRCMMQAVYFCS-GMDNDFHHYGLASPIYTHFTSPIRRYADVIVHRLLAVAI : : .: :. : ... ::.: :: ::::::: ::...: . .:. CCDS33 APAGRDLRKALERSAFGRCARGHQQQGGHYSLQVDWYTWATSPIRRYLDVVLQRQILLAL 1640 1650 1660 1670 1680 1690 770 780 790 800 810 820 pF1KA1 GADCTYPELTDKHKLADICKNLNFRHKMAQYAQRASVAFHTQLFFKSKGIVSEEAYILFV : . : . .:. ....: .:: :: . ..: . .:.. CCDS33 GHGGSAYSARD---IDGLCQAFSLQHALAQSYQRRARSLHLAVQLKAQPLDKLGFVVDVE 1700 1710 1720 1730 1740 830 840 850 860 870 880 pF1KA1 RKNAIVVLIPKYGLEGTVFFEEKDKPNPQLIYDDEIPSLKIEDTVFHVFDKVKVKIMLDS CCDS33 AGSRCFRLLFPSNRETLPDPCPVPYGSLQLAEHPHALAGRPGLRLLWRRRVYSAQGSSPP 1750 1760 1770 1780 1790 1800 928 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 10:39:13 2016 done: Thu Nov 3 10:39:14 2016 Total Scan time: 4.440 Total Display time: 0.290 Function used was FASTA [36.3.4 Apr, 2011]