FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0990, 802 aa 1>>>pF1KSDA0990 802 - 802 aa - 802 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8690+/-0.000949; mu= 18.4172+/- 0.057 mean_var=87.6029+/-17.741, 0's: 0 Z-trim(106.8): 34 B-trim: 0 in 0/51 Lambda= 0.137030 statistics sampled from 9187 (9210) to 9187 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.644), E-opt: 0.2 (0.283), width: 16 Scan time: 3.890 The best scores are: opt bits E(32554) CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 ( 802) 5423 1082.6 0 CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 ( 882) 3625 727.2 2.8e-209 CCDS6010.1 CSGALNACT1 gene_id:55790|Hs108|chr8 ( 532) 676 144.1 5.9e-34 CCDS7201.1 CSGALNACT2 gene_id:55454|Hs108|chr10 ( 542) 643 137.6 5.5e-32 CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 ( 772) 486 106.6 1.6e-22 CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 ( 764) 482 105.8 2.8e-22 CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 ( 775) 471 103.7 1.3e-21 CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 ( 613) 427 94.9 4.4e-19 >>CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 (802 aa) initn: 5423 init1: 5423 opt: 5423 Z-score: 5792.3 bits: 1082.6 E(32554): 0 Smith-Waterman score: 5423; 99.9% identity (99.9% similar) in 802 aa overlap (1-802:1-802) 10 20 30 40 50 60 pF1KSD MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSGQAAASQAGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSGQAAASQAGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD ARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTWSKTIPGKVQFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTWSKTIPGKVQFF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD SSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDVYIKGDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDVYIKGDR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD LENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREVLRRMVPHIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREVLRRMVPHIG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD KCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRDLHNSKIHQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRDLHNSKIHQA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD ITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLHREIVLMSKYSNTEIHKEDLQLGIPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLHREIVLMSKYSNTEIHKEDLQLGIPP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQREALDDIVMQVMEMINANA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQREALDDIVMQVMEMINANA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD KTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPVRRHAYLQQTFSKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPVRRHAYLQQTFSKI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD QFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHKEPKDKKINILIPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHKEPKDKKINILIPL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD SGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMTDYRIKYPKADMQ ::::::::::::::::::::::::::::::::::::::::::::::: :::::::::::: CCDS10 SGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMRDYRIKYPKADMQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD ILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD SQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLED 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD VDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEM 730 740 750 760 770 780 790 800 pF1KSD WLEKNDPSYSKSSNNNGSVRTA :::::::::::::::::::::: CCDS10 WLEKNDPSYSKSSNNNGSVRTA 790 800 >>CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 (882 aa) initn: 3732 init1: 2151 opt: 3625 Z-score: 3870.7 bits: 727.2 E(32554): 2.8e-209 Smith-Waterman score: 3642; 68.6% identity (86.4% similar) in 780 aa overlap (30-785:99-872) 10 20 30 40 50 pF1KSD MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGP---RRRAS-PEGCRS--GQA :.: .. : :::. ::: . : CCDS34 RPRQEQSPPPARQDLQGPPLPEAAPGITSFRSSPWQQPPPLQQRRRGREPEGATGLPGAP 70 80 90 100 110 120 60 70 80 90 pF1KSD AAS-----QAGGARGDARGAQLWPPGSDP----DGG---P--RDRNFLFVGVMTAQKYLQ :: . ::: :. : .. :::. ::: : : :.::.:::::::::: CCDS34 AAEGEPEEEDGGAAGQRRDGR---PGSSHNGSGDGGAAAPSARPRDFLYVGVMTAQKYLG 130 140 150 160 170 180 100 110 120 130 140 150 pF1KSD TRAVAAYRTWSKTIPGKVQFFSSE----GSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKY .::.:: :::.. :::.:.::::. ... :.::. : :::::::::::::::.:: CCDS34 SRALAAQRTWARFIPGRVEFFSSQQPPNAGQPPPPLPVIALPGVDDSYPPQKKSFMMIKY 190 200 210 220 230 240 160 170 180 190 200 210 pF1KSD MHDHYLDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPG ::::::::::::::::::::::::.::.::::::::.::.:::::::. ::.:::.:::: CCDS34 MHDHYLDKYEWFMRADDDVYIKGDKLEEFLRSLNSSKPLYLGQTGLGNIEELGKLGLEPG 250 260 270 280 290 300 220 230 240 250 260 270 pF1KSD ENFCMGGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQ :::::::::.:.:::::::::::::.:::::::::::::::::::::.:.:::::::::: CCDS34 ENFCMGGPGMIFSREVLRRMVPHIGECLREMYTTHEDVEVGRCVRRFGGTQCVWSYEMQQ 310 320 330 340 350 360 280 290 300 310 320 330 pF1KSD LFYENYEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLH ::.::::.:.::::.:::::::: :::::::: : ::::::.:::::::::::.:::::: CCDS34 LFHENYEHNRKGYIQDLHNSKIHAAITLHPNKRPAYQYRLHNYMLSRKISELRYRTIQLH 370 380 390 400 410 420 340 350 360 370 380 390 pF1KSD REIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRR :: .:::: ::::. ::: :::. ::: .::::.:.:..:::::::: ::::...::::. CCDS34 RESALMSKLSNTEVSKEDQQLGVIPSFNHFQPRERNEVIEWEFLTGKLLYSAAENQPPRQ 430 440 450 460 470 480 400 410 420 430 440 450 pF1KSD GMDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLY ...: : :::: :.::::::: :::.:::.::::::::::::::::.:.:::::::::: CCDS34 SLSSILRTALDDTVLQVMEMINENAKSRGRLIDFKEIQYGYRRVNPMHGVEYILDLLLLY 490 500 510 520 530 540 460 470 480 490 500 510 pF1KSD KKHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLV :.:::.:.:::::::::::: ::: : : ::::.. :.. ::.:. :.::.::::: : CCDS34 KRHKGRKLTVPVRRHAYLQQLFSKPFFRETEELDVNSLVESINSETQSFSFISNSLKILS 550 560 570 580 590 600 520 530 540 550 560 570 pF1KSD PFQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSD :: :.: : ..::..::.:: ::.:.:.::: :::. ::::.::::::..::. : CCDS34 SFQ--GAK-EMGGHNEKKVHILVPLIGRYDIFLRFMENFENMCLIPKQNVKLVIILFSRD 610 620 630 640 650 660 580 590 600 610 620 630 pF1KSD SNPDKAKQVELMTDYRIKYPKADMQILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLV :. :..:..::. :. :::::.: ..:..:::::.:.::..:.::.:..::.::::::. CCDS34 SGQDSSKHIELIKGYQNKYPKAEMTLIPMKGEFSRGLGLEMASAQFDNDTLLLFCDVDLI 670 680 690 700 710 720 640 650 660 670 680 690 pF1KSD FTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGI : .:::::: ::. :::.:.::::::::::.. .:. :.:..: :..::::::.::.:: CCDS34 FREDFLQRCRDNTIQGQQVYYPIIFSQYDPKVTNGGNPPTDDYFIFSKKTGFWRDYGYGI 730 740 750 760 770 780 700 710 720 730 740 750 pF1KSD TCIYKGDLVRVGGFDVSIQGWGLEDVDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNL :::::.::. .::::.::::::::::::.:::. .::. ::::::::::. ::: ::::: CCDS34 TCIYKSDLLGAGGFDTSIQGWGLEDVDLYNKVILSGLRPFRSQEVGVVHIFHPVHCDPNL 790 800 810 820 830 840 760 770 780 790 800 pF1KSD DPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA :::::::::::::::..::.::::.::::. CCDS34 DPKQYKMCLGSKASTFASTMQLAELWLEKHLGVRYNRTLS 850 860 870 880 >>CCDS6010.1 CSGALNACT1 gene_id:55790|Hs108|chr8 (532 aa) initn: 650 init1: 331 opt: 676 Z-score: 723.1 bits: 144.1 E(32554): 5.9e-34 Smith-Waterman score: 681; 35.9% identity (69.0% similar) in 306 aa overlap (489-780:208-510) 460 470 480 490 500 510 pF1KSD KGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLS------NSLK : : : ....:.: :. . .: CCDS60 DELVEAIESALETLNSPAENSPNHRPYTASDFIEGIYRTERDKGTLYELTFKGDHKHEFK 180 190 200 210 220 230 520 530 540 550 560 pF1KSD KLVPFQLPGS----KSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLV .:. :. : :.:. . . ::...::. : : : .:: ::.. :. . :.:. CCDS60 RLILFRPFGPIMKVKNEKLNMANTLINVIVPLAKRVDKFRQFMQNFREMCIEQDGRVHLT 240 250 260 270 280 290 570 580 590 600 610 620 pF1KSD VLLFNSDSNPDKAKQVELMTDYRIKYPKADMQILPVSGEFSRALALEVGSSQFNNES-LL :. :... . ...: . :. .. .. .. ..:::::. .:.::. ... . :: CCDS60 VVYFGKE-EINEVKGILENTSKAANF--RNFTFIQLNGEFSRGKGLDVGARFWKGSNVLL 300 310 320 330 340 350 630 640 650 660 670 680 pF1KSD FFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVYSGK--VPS-DNHFAFTQK ::::::. ::.:::. :: :: :.....:..::::.: :.:. . :: ...... .. CCDS60 FFCDVDIYFTSEFLNTCRLNTQPGKKVFYPVLFSQYNPGIIYGHHDAVPPLEQQLVIKKE 360 370 380 390 400 410 690 700 710 720 730 740 pF1KSD TGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLEDVDLFNKVVQAGLKTFRSQEVGVVH :::::..:::.:: :..:.. .::::..:.::: ::: :. : ....: . :. :. : CCDS60 TGFWRDFGFGMTCQYRSDFINIGGFDLDIKGWGGEDVHLYRKYLHSNLIVVRTPVRGLFH 420 430 440 450 460 470 750 760 770 780 790 800 pF1KSD VHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA . : : .: :.:::::. ::: . .: ::. . CCDS60 LWHEKRCMDELTPEQYKMCMQSKAMNEASHGQLGMLVFRHEIEAHLRKQKQKTSSKKT 480 490 500 510 520 530 >>CCDS7201.1 CSGALNACT2 gene_id:55454|Hs108|chr10 (542 aa) initn: 580 init1: 314 opt: 643 Z-score: 687.7 bits: 137.6 E(32554): 5.5e-32 Smith-Waterman score: 643; 35.2% identity (70.7% similar) in 270 aa overlap (516-780:253-519) 490 500 510 520 530 540 pF1KSD EELDAQELAKRINQESGSLSFLSNSLKKLVPF-QLPGSKSEHKEPKDKKINILIPLSGRF :: : ::: . . :::..::. : CCDS72 YRTERDKGTQYELFFKKADLTEYRHVTLFRPFGPLMKVKSEMIDITRSIINIIVPLAERT 230 240 250 260 270 280 550 560 570 580 590 600 pF1KSD DMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMTDYRIKYPKADMQILPV . ::.:: ::. .:. .....:.:. :.... .:.:.. . . . .. .. . CCDS72 EAFVQFMQNFRDVCIHQDKKIHLTVVYFGKEGL-SKVKSI--LESVTSESNFHNYTLVSL 290 300 310 320 330 610 620 630 640 650 660 pF1KSD SGEFSRALALEVGSSQFNN-ESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQY . ::.:. .:.::. ... : :.::::::. :..:::. :: :. :.....:..:: : CCDS72 NEEFNRGRGLNVGARAWDKGEVLMFFCDVDIYFSAEFLNSCRLNAEPGKKVFYPVVFSLY 340 350 360 370 380 390 670 680 690 700 710 720 pF1KSD DPKIVYSGKV---PSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLED .: :::... : ..... . .::::..:::.:: :..:.. .::::. ..::: :: CCDS72 NPAIVYANQEVPPPVEQQLVHKKDSGFWRDFGFGMTCQYRSDFLTIGGFDMEVKGWGGED 400 410 420 430 440 450 730 740 750 760 770 780 pF1KSD VDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEM : :. : ... : ..:. :. :. : : .: :.::.::. ::: . .: ..:. . CCDS72 VHLYRKYLHGDLIVIRTPVPGLFHLWHEKRCADELTPEQYRMCIQSKAMNEASHSHLGML 460 470 480 490 500 510 790 800 pF1KSD WLEKNDPSYSKSSNNNGSVRTA CCDS72 VFREEIETHLHKQAYRTNSEAVG 520 530 540 >>CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 (772 aa) initn: 328 init1: 152 opt: 486 Z-score: 517.7 bits: 106.6 E(32554): 1.6e-22 Smith-Waterman score: 676; 24.9% identity (53.1% similar) in 830 aa overlap (8-784:8-766) 10 20 30 40 50 pF1KSD MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSG-QAAASQAG : : : :.::. :. : : :.: .. : . : :.: : :.: CCDS34 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR 10 20 30 40 50 60 60 70 80 90 100 pF1KSD GARGDAR-GAQLWPPGSDPDG---------------GPRDRNFLFVGVMTAQKYLQTRAV ..: .. : ::. : :.: :.:.:.:.. :.: :: CCDS34 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRER--LLVAVLTSRATLSTLAV 70 80 90 100 110 110 120 130 140 150 160 pF1KSD AAYRTWSKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMM---LKYMHDHY :. :: .. .: . : ...:. . . . :: :. .. ...: :...: :. CCDS34 AVNRTVAHHFPRLLYFTGQRGARAPAGMQVV-------SHGDERPAWLMSETLRHLHTHF 120 130 140 150 160 170 170 180 190 200 210 220 pF1KSD LDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCM :.::. .::.:... :: . :. .. :.::.. : .: : : .. .: CCDS34 GADYDWFFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA----EEFIG--AGEQAR-YCH 180 190 200 210 220 230 240 250 260 270 280 pF1KSD GGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYEN :: : ..:: .: :. ::. : .. ... : .:::. :: :: ... :: :.. CCDS34 GGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRS 230 240 250 260 270 280 290 300 310 320 330 pF1KSD YEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYM----LSRKISELRHRTIQLHR .: :. . .: . .:...:: .. .::::. . : : ::... :. : CCDS34 FELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-R 290 300 310 320 330 340 340 350 360 370 380 390 pF1KSD EIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRG ...... ... . . .:.: : :..: :.: :...: .. .: .:: : . CCDS34 NLTVLTPEGEAGL---SWPVGLPAP---FTPHSRFEVLGWDYFTEQHTFSCADGAP-KCP 350 360 370 380 390 400 410 420 430 440 450 pF1KSD MDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYK ...:.: . : . ..:..: . : :. ... :::: .: : :: ::::: CCDS34 LQGASRADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECV 400 410 420 430 440 450 460 470 480 490 500 510 pF1KSD KHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVP ..:.. .. :.. : . .:..... . ..... . : CCDS34 TQRGHRRALA--RRVSLLRPLSRVEILP-------------------MPYVTEATR--VQ 460 470 480 490 520 530 540 550 560 570 pF1KSD FQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLF---- . :: .:. .. :.. : . : : ... :..:: CCDS34 LVLP---------------LLVAEAAAAPAFLE---AFAANVLEPREHALLTLLLVYGPR 500 510 520 530 580 590 600 610 620 pF1KSD -NSDSNPDKAKQVELMT-DYRIKYPKADMQILPVSGEF-SRALALEVGSSQFNNESLLFF .. . :: :. . . . .:: . . : : .: :.. ..: :.. ..:.:. CCDS34 EGGRGAPDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFL 540 550 560 570 580 590 630 640 650 660 670 680 pF1KSD CDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVY---------SGKVPSDNHFA : : :.::: :.. : : .::. :....: . .: : . : CCDS34 TTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGA 600 610 620 630 640 650 690 700 710 720 pF1KSD FTQKT----GFWRNYGFGITCIYKGDLV----RVGGFDVSIQGW-----GLEDVDLFNKV .. : . . . :.:..: . :..: ... : ::: .:.: . CCDS34 DPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAG-ELAGQEEEEALEGLEVMDVFLRF 660 670 680 690 700 710 730 740 750 760 770 780 pF1KSD VQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDP .::. ::. : :.:. :.: :. . :. : :. :. ::: .:. CCDS34 --SGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQA 720 730 740 750 760 790 800 pF1KSD SYSKSSNNNGSVRTA CCDS34 NST 770 >>CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 (764 aa) initn: 328 init1: 152 opt: 482 Z-score: 513.5 bits: 105.8 E(32554): 2.8e-22 Smith-Waterman score: 656; 25.0% identity (54.7% similar) in 741 aa overlap (80-784:89-758) 50 60 70 80 90 100 pF1KSD SGQAAASQAGGARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTW : :.: :.:.:.:.. :.: :::. :: CCDS64 DFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRER--LLVAVLTSRATLSTLAVAVNRTV 60 70 80 90 100 110 110 120 130 140 150 160 pF1KSD SKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMM---LKYMHDHYLDKYEW .. .: . : ...:. . . . :: :. .. ...: :...: :. :.: CCDS64 AHHFPRLLYFTGQRGARAPAGMQVV-------SHGDERPAWLMSETLRHLHTHFGADYDW 120 130 140 150 160 170 180 190 200 210 220 pF1KSD FMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVI :. .::.:... :: . :. .. :.::.. : .: : : .. .: :: : . CCDS64 FFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA----EEFIG--AGEQAR-YCHGGFGYL 170 180 190 200 210 220 230 240 250 260 270 280 pF1KSD MSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKK .:: .: :. ::. : .. ... : .:::. :: :: ... :: :...: :. CCDS64 LSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRSFELAKN 230 240 250 260 270 280 290 300 310 320 330 340 pF1KSD GYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYM----LSRKISELRHRTIQLHREIVLMS . .: . .:...:: .. .::::. . : : ::... :. :...... CCDS64 RDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-RNLTVLT 290 300 310 320 330 350 360 370 380 390 400 pF1KSD KYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQR ... . . .:.: : :..: :.: :...: .. .: .:: : . ...:.: CCDS64 PEGEAGL---SWPVGLPAPF---TPHSRFEVLGWDYFTEQHTFSCADGAP-KCPLQGASR 340 350 360 370 380 390 410 420 430 440 450 460 pF1KSD EALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKK . : . ..:..: . : :. ... :::: .: : :: ::::: ..:.. CCDS64 ADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECVTQRGHR 400 410 420 430 440 450 470 480 490 500 510 520 pF1KSD MTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGS .. :.. : . .:..... . ..... . : . :: CCDS64 RALA--RRVSLLRPLSRVEILP-------------------MPYVTEATR--VQLVLP-- 460 470 480 530 540 550 560 570 pF1KSD KSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLF-----NSDSN .:. .. :.. : . : : ... :..:: .. . CCDS64 -------------LLVAEAAAAPAFLE---AFAANVLEPREHALLTLLLVYGPREGGRGA 490 500 510 520 530 580 590 600 610 620 630 pF1KSD PDKAKQVELMT-DYRIKYPKADMQILPVSGEF-SRALALEVGSSQFNNESLLFFCDVDLV :: :. . . . .:: . . : : .: :.. ..: :.. ..:.:. : CCDS64 PDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTR 540 550 560 570 580 590 640 650 660 670 680 pF1KSD FTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVY---------SGKVPSDNHFAFTQKT- : :.::: :.. : : .::. :....: . .: : . : .. CCDS64 PGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGA 600 610 620 630 640 650 690 700 710 720 730 pF1KSD ---GFWRNYGFGITCIYKGDLV----RVGGFDVSIQGW-----GLEDVDLFNKVVQAGLK : . . . :.:..: . :..: ... : ::: .:.: . .::. CCDS64 PIGGRFDRQASAEGCFYNADYLAARARLAG-ELAGQEEEEALEGLEVMDVFLRF--SGLH 660 670 680 690 700 740 750 760 770 780 790 pF1KSD TFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSS ::. : :.:. :.: :. . :. : :. :. ::: .:. CCDS64 LFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST 710 720 730 740 750 760 800 pF1KSD NNNGSVRTA >>CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 (775 aa) initn: 415 init1: 150 opt: 471 Z-score: 501.7 bits: 103.7 E(32554): 1.3e-21 Smith-Waterman score: 643; 25.9% identity (54.5% similar) in 719 aa overlap (80-784:114-769) 50 60 70 80 90 100 pF1KSD SGQAAASQAGGARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTW : :.: :.:.:.:.: : : .::. :: CCDS24 WEPRVLPYHPAQPGQAAKKAVRTRYISTELGIRQR--LLVAVLTSQTTLPTLGVAVNRTL 90 100 110 120 130 140 110 120 130 140 150 160 pF1KSD SKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMR .. . : . ...: . . :: : : . : . . :... ... : ..::. CCDS24 GHRLERVVFLTGARGRRAPPGMAVVTL-GEER---PIGHLHLALRHLLEQHGDDFDWFFL 150 160 170 180 190 170 180 190 200 210 220 pF1KSD ADDDVYIKGD---RLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVI . : .: .. :: . : :: :. :.::. . .: ::. .: :: ::. CCDS24 VPDTTYTEAHGLARLTGHL-SLASAAHLYLGRP----QDFIGGEPT-PGR-YCHGGFGVL 200 210 220 230 240 250 230 240 250 260 270 280 pF1KSD MSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKK .:: .:... ::. : .. ... : .:::. .:: :. ..: . : . : . CCDS24 LSRMLLQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHE--GVHYSHLELSPG 260 270 280 290 300 290 300 310 320 330 340 pF1KSD GYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQ-LHREIVLMSKYS ... . ....:.: :: ..: ..:.::. ..: : .. :: :. :: :. . CCDS24 EPVQE-GDPHFRSALTAHPVRDPVHMYQLHK-AFARAELERTYQEIQELQWEIQNTSHLA 310 320 330 340 350 360 350 360 370 380 390 400 pF1KSD NTEIHKEDLQLGIP-PSFMRFQPRQREEILEWEFLTGKYLYSAVDGQP--PRRGMDSAQR . .::: :: .: .: :.:.:...: .. .: .::.: : :: : : CCDS24 VDGDQAAAWPVGIPAPS----RPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGAD---R 370 380 390 400 410 410 420 430 440 450 460 pF1KSD EALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKK . :.. ..: .: . :. ... :::: .: : :: ::: : .: . CCDS24 ADVADVLGTALEELNRRYHPALRLQK-QQLVNGYRRFDPARGMEYTLDLQLEALTPQGGR 420 430 440 450 460 470 470 480 490 500 510 520 pF1KSD MTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGS :. :.. : . .:..... . :.:.. : :. . . :.: : . CCDS24 R--PLTRRVQLLRPLSRVEILPVPYVTE---ASRLT----VLLPLAAAERDLAPGFLEAF 480 490 500 510 520 530 540 550 560 570 580 pF1KSD KSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDS-NPDKA . :: : . . : .: : : ... ..: : :: CCDS24 ATAALEPGDAAAALTLLLL------------YE-----PRQAQRVA----HADVFAPVKA 530 540 550 560 590 600 610 620 630 640 pF1KSD KQVELMTDYRIKYPKADMQILPVSGEFSRALAL-EVGSSQFNNESLLFFCDVDLVFTTEF . .:: ..: : . : :. : : .. :.. ..:... : :.: .: CCDS24 HVAELER----RFPGARVPWLSVQTAAPSPLRLMDLLSKKHPLDTLFLLAGPDTVLTPDF 570 580 590 600 610 620 650 660 670 680 690 pF1KSD LQRCRANTVLGQQIYFPIIFSQYDPKIVY-SGKVPSDNHFAFTQKTGFWRNYGFGITCIY :.::: ... : : .::. :. . : .. .: : . . . :: . . . .:.: CCDS24 LNRCRMHAISGWQAFFPMHFQAFHPAVAPPQGPGPPE----LGRDTGRFDRQAASEACFY 630 640 650 660 670 680 700 710 720 730 740 750 pF1KSD KGDLVRVGGFDVSIQGWG---LEDVDLFNKVVQ-AGLKTFRSQEVGVVHVHHPVFCDPNL ..: : . : .. . ::..:... .. ..:...:. : .... .. :. : CCDS24 NSDYVAARGRLAAASEQEEELLESLDVYELFLHFSSLHVLRAVEPALLQRYRAQTCSARL 690 700 710 720 730 740 760 770 780 790 800 pF1KSD DPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA . :. :: : :: ::: . .:. CCDS24 SEDLYHRCLQSVLEGLGSRTQLAMLLFEQEQGNST 750 760 770 >>CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 (613 aa) initn: 415 init1: 150 opt: 427 Z-score: 456.1 bits: 94.9 E(32554): 4.4e-19 Smith-Waterman score: 599; 25.4% identity (54.3% similar) in 654 aa overlap (145-784:11-607) 120 130 140 150 160 170 pF1KSD GKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDV : . . :... ... : ..::. . : . CCDS56 MAVVTLGEERPIGHLHLALRHLLEQHGDDFDWFFLVPDTT 10 20 30 40 180 190 200 210 220 230 pF1KSD YIKGD---RLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREV : .. :: . : :: :. :.::. . .: ::. .: :: ::..:: . CCDS56 YTEAHGLARLTGHL-SLASAAHLYLGRP----QDFIGGEPT-PGR-YCHGGFGVLLSRML 50 60 70 80 90 240 250 260 270 280 290 pF1KSD LRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRD :... ::. : .. ... : .:::. .:: :. ..: . : . : . ... CCDS56 LQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHE--GVHYSHLELSPGEPVQE 100 110 120 130 140 150 300 310 320 330 340 350 pF1KSD LHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQ-LHREIVLMSKYSNTEIH . ....:.: :: ..: ..:.::. ..: : .. :: :. :: :. . . CCDS56 -GDPHFRSALTAHPVRDPVHMYQLHK-AFARAELERTYQEIQELQWEIQNTSHLAVDGDQ 160 170 180 190 200 360 370 380 390 400 pF1KSD KEDLQLGIP-PSFMRFQPRQREEILEWEFLTGKYLYSAVDGQP--PRRGMDSAQREALDD .::: :: .: .: :.:.:...: .. .: .::.: : :: : : . : CCDS56 AAAWPVGIPAPS----RPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGAD---RADVAD 210 220 230 240 250 260 410 420 430 440 450 460 pF1KSD IVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPV .. ..: .: . :. ... :::: .: : :: ::: : .: . :. CCDS56 VLGTALEELNRRYHPALRLQK-QQLVNGYRRFDPARGMEYTLDLQLEALTPQGGRR--PL 270 280 290 300 310 470 480 490 500 510 520 pF1KSD RRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHK :.. : . .:..... . :.:.. : :. . . :.: : . . CCDS56 TRRVQLLRPLSRVEILPVPYVTE---ASRLT----VLLPLAAAERDLAPGFLEAFATAAL 320 330 340 350 360 370 530 540 550 560 570 580 pF1KSD EPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDS-NPDKAKQVEL :: : . . : .: : : ... ..: : ::. .:: CCDS56 EPGDAAAALTLLLL------------YE-----PRQAQRVA----HADVFAPVKAHVAEL 380 390 400 410 590 600 610 620 630 640 pF1KSD MTDYRIKYPKADMQILPVSGEFSRALAL-EVGSSQFNNESLLFFCDVDLVFTTEFLQRCR ..: : . : :. : : .. :.. ..:... : :.: .::.::: CCDS56 ER----RFPGARVPWLSVQTAAPSPLRLMDLLSKKHPLDTLFLLAGPDTVLTPDFLNRCR 420 430 440 450 460 650 660 670 680 690 700 pF1KSD ANTVLGQQIYFPIIFSQYDPKIVY-SGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLV ... : : .::. :. . : .. .: : . . . :: . . . .:.:..: : CCDS56 MHAISGWQAFFPMHFQAFHPAVAPPQGPGPPE----LGRDTGRFDRQAASEACFYNSDYV 470 480 490 500 510 520 710 720 730 740 750 760 pF1KSD RVGGFDVSIQGWG---LEDVDLFNKVVQ-AGLKTFRSQEVGVVHVHHPVFCDPNLDPKQY . : .. . ::..:... .. ..:...:. : .... .. :. :. : CCDS56 AARGRLAAASEQEEELLESLDVYELFLHFSSLHVLRAVEPALLQRYRAQTCSARLSEDLY 530 540 550 560 570 580 770 780 790 800 pF1KSD KMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA . :: : :: ::: . .:. CCDS56 HRCLQSVLEGLGSRTQLAMLLFEQEQGNST 590 600 610 802 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 18:56:36 2016 done: Thu Nov 3 18:56:37 2016 Total Scan time: 3.890 Total Display time: 0.170 Function used was FASTA [36.3.4 Apr, 2011]