FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1402, 772 aa 1>>>pF1KA1402 772 - 772 aa - 772 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6156+/-0.000915; mu= 6.6252+/- 0.056 mean_var=183.3079+/-37.081, 0's: 0 Z-trim(112.8): 7 B-trim: 317 in 1/52 Lambda= 0.094729 statistics sampled from 13491 (13498) to 13491 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.729), E-opt: 0.2 (0.415), width: 16 Scan time: 4.350 The best scores are: opt bits E(32554) CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 ( 772) 5229 727.2 2.4e-209 CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 ( 764) 5104 710.1 3.3e-204 CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 ( 775) 2331 331.1 4.1e-90 CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 ( 613) 2029 289.8 9e-78 CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 ( 802) 486 79.0 3.4e-14 CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 ( 882) 444 73.3 1.9e-12 >>CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 (772 aa) initn: 5229 init1: 5229 opt: 5229 Z-score: 3871.8 bits: 727.2 E(32554): 2.4e-209 Smith-Waterman score: 5229; 100.0% identity (100.0% similar) in 772 aa overlap (1-772:1-772) 10 20 30 40 50 60 pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV 670 680 690 700 710 720 730 740 750 760 770 pF1KA1 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST 730 740 750 760 770 >>CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 (764 aa) initn: 5080 init1: 5080 opt: 5104 Z-score: 3779.5 bits: 710.1 E(32554): 3.3e-204 Smith-Waterman score: 5104; 98.4% identity (98.8% similar) in 767 aa overlap (6-772:1-764) 10 20 30 40 50 60 pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR .:.: :: :: .: :::::::::::::::::::::::::::::::::::: CCDS64 MLSLARPPLP---PTGLRTSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR 10 20 30 40 50 70 80 90 100 110 120 pF1KA1 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KA1 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KA1 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KA1 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KA1 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL 300 310 320 330 340 350 370 380 390 400 410 420 pF1KA1 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP 360 370 380 390 400 410 430 440 450 460 470 480 pF1KA1 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM 420 430 440 450 460 470 490 500 510 520 530 540 pF1KA1 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD 480 490 500 510 520 530 550 560 570 580 590 600 pF1KA1 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG 540 550 560 570 580 590 610 620 630 640 650 660 pF1KA1 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI 600 610 620 630 640 650 670 680 690 700 710 720 pF1KA1 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV 660 670 680 690 700 710 730 740 750 760 770 pF1KA1 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST 720 730 740 750 760 >>CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 (775 aa) initn: 2696 init1: 1004 opt: 2331 Z-score: 1731.3 bits: 331.1 E(32554): 4.1e-90 Smith-Waterman score: 2870; 56.9% identity (78.7% similar) in 795 aa overlap (1-772:1-775) 10 20 30 40 50 pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQ---GEGE----DPCVEAVGERGGPQ :: : ::..:::: :. .:.::: .:::: :.:.. : : : . :. .. . CCDS24 MRASLLLSVLRPAGPVAVGISLGFTLSLLSVTWVEEPCGPGPPQPGDSELPPRGNTNAAR 10 20 30 40 50 60 60 70 80 90 100 pF1KA1 NPDS------RARLDQSD---EDFKPRIVPYY-RDPNKPYKKVLRTRYIQTELGSRERLL :.: : . .. :...::..::. .:.. ::..:::::.:::: :.::: CCDS24 RPNSVQPGAEREKPGAGEGAGENWEPRVLPYHPAQPGQAAKKAVRTRYISTELGIRQRLL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KA1 VAVLTSRATLSTLAVAVNRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSET ::::::..:: ::.::::::..:.. :....:: :: ::: :: ::. :.::: . . CCDS24 VAVLTSQTTLPTLGVAVNRTLGHRLERVVFLTGARGRRAPPGMAVVTLGEERPIGHLHLA 130 140 150 160 170 180 170 180 190 200 210 220 pF1KA1 LRHLHTHFGADYDWFFIMQDDTYVQAPRLAALAGHLSINQ--DLYLGRAEEFIGAGEQA- :::: . : :.::::.. : ::..: :: :.::::. . ::::: ..::: :: . CCDS24 LRHLLEQHGDDFDWFFLVPDTTYTEAHGLARLTGHLSLASAAHLYLGRPQDFIG-GEPTP 190 200 210 220 230 230 240 250 260 270 pF1KA1 -RYCHGGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ :::::::: :::: :: .:::::.:::.::.:::::::::::..:. ::::...:.: . CCDS24 GRYCHGGFGVLLSRMLLQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHEGVH 240 250 260 270 280 290 280 290 300 310 320 330 pF1KA1 YRSFELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQ : .::. . .: .::. : ::...::: . . ::.::: :. ::::.:.::..:: . CCDS24 YSHLELSPG-EPVQEGDPHFRSALTAHPVRDPVHMYQLHKAFARAELERTYQEIQELQWE 300 310 320 330 340 350 340 350 360 370 380 390 pF1KA1 IRNLTVLTPEGEAGLSWPVGLPAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGAS :.: . :. .:. . .::::.::: : :::::: ::::::::.::::::.:.:::.::. CCDS24 IQNTSHLAVDGDQAAAWPVGIPAPSRPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGAD 360 370 380 390 400 410 400 410 420 430 440 450 pF1KA1 RADVGDALETALEQLNRRYQPRLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHR ::::.:.: ::::.:::::.: ::.:::.:.:::::::::::::::::: :: .: .: : CCDS24 RADVADVLGTALEELNRRYHPALRLQKQQLVNGYRRFDPARGMEYTLDLQLEALTPQGGR 420 430 440 450 460 470 460 470 480 490 500 510 pF1KA1 RALARRVSLLRPLSRVEILPMPYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPRE : :.:::.::::::::::::.::::::.:. ..::: .:: ::.::::::. .::: . CCDS24 RPLTRRVQLLRPLSRVEILPVPYVTEASRLTVLLPLAAAERDLAPGFLEAFATAALEPGD 480 490 500 510 520 530 520 530 540 550 560 570 pF1KA1 HAL-LTLLLVYGPREGGRGA-PDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLM : :::::.: ::.. : : : : ::: .::::::.::.:. ::.:.. ::: .::: CCDS24 AAAALTLLLLYEPRQAQRVAHADVFAPVKAHVAELERRFPGARVPWLSVQTAAPSPLRLM 540 550 560 570 580 590 580 590 600 610 620 630 pF1KA1 DVVSKKHPVDTLFFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPP :..:::::.::::.:. : :. ::::::.::::::::::.::: :.::..: ..: CCDS24 DLLSKKHPLDTLFLLAGPDTVLTPDFLNRCRMHAISGWQAFFPMHFQAFHPAVAPPQGP- 600 610 620 630 640 650 640 650 660 670 680 690 pF1KA1 GPPGAGPDPPSPPGADPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEE ::: : : :::::::..:.::::.::.:::.:::. :...::: CCDS24 GPPELGRDT---------------GRFDRQAASEACFYNSDYVAARGRLAA--ASEQEEE 660 670 680 690 700 700 710 720 730 740 750 pF1KA1 ALEGLEVMDVFLRFSGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRA ::.:.:...::.::.::..:::::.:.:.. . :: ::::.::::: : :::::.:. CCDS24 LLESLDVYELFLHFSSLHVLRAVEPALLQRYRAQTCSARLSEDLYHRCLQSVLEGLGSRT 710 720 730 740 750 760 760 770 pF1KA1 QLAMALFEQEQANST :::: ::::::.::: CCDS24 QLAMLLFEQEQGNST 770 >>CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 (613 aa) initn: 2303 init1: 1004 opt: 2029 Z-score: 1509.7 bits: 289.8 E(32554): 9e-78 Smith-Waterman score: 2463; 59.7% identity (80.6% similar) in 633 aa overlap (146-772:1-613) 120 130 140 150 160 170 pF1KA1 LAVAVNRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADY : ::. :.::: . .:::: . : :. CCDS56 MAVVTLGEERPIGHLHLALRHLLEQHGDDF 10 20 30 180 190 200 210 220 230 pF1KA1 DWFFIMQDDTYVQAPRLAALAGHLSINQ--DLYLGRAEEFIGAGEQA--RYCHGGFGYLL ::::.. : ::..: :: :.::::. . ::::: ..::: :: . :::::::: :: CCDS56 DWFFLVPDTTYTEAHGLARLTGHLSLASAAHLYLGRPQDFIG-GEPTPGRYCHGGFGVLL 40 50 60 70 80 240 250 260 270 280 290 pF1KA1 SRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDP :: :: .:::::.:::.::.:::::::::::..:. ::::...:.: .: .::. . .: CCDS56 SRMLLQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHEGVHYSHLELSPG-EP 90 100 110 120 130 140 300 310 320 330 340 350 pF1KA1 EKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGE .::. : ::...::: . . ::.::: :. ::::.:.::..:: .:.: . :. .:. CCDS56 VQEGDPHFRSALTAHPVRDPVHMYQLHKAFARAELERTYQEIQELQWEIQNTSHLAVDGD 150 160 170 180 190 200 360 370 380 390 400 410 pF1KA1 AGLSWPVGLPAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETAL . .::::.::: : :::::: ::::::::.::::::.:.:::.::.::::.:.: ::: CCDS56 QAAAWPVGIPAPSRPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGADRADVADVLGTAL 210 220 230 240 250 260 420 430 440 450 460 470 pF1KA1 EQLNRRYQPRLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRP :.:::::.: ::.:::.:.:::::::::::::::::: :: .: .: :: :.:::.:::: CCDS56 EELNRRYHPALRLQKQQLVNGYRRFDPARGMEYTLDLQLEALTPQGGRRPLTRRVQLLRP 270 280 290 300 310 320 480 490 500 510 520 530 pF1KA1 LSRVEILPMPYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHAL-LTLLLVYG ::::::::.::::::.:. ..::: .:: ::.::::::. .::: . : :::::.: CCDS56 LSRVEILPVPYVTEASRLTVLLPLAAAERDLAPGFLEAFATAALEPGDAAAALTLLLLYE 330 340 350 360 370 380 540 550 560 570 580 pF1KA1 PREGGRGA-PDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTL ::.. : : : : ::: .::::::.::.:. ::.:.. ::: .::::..:::::.::: CCDS56 PRQAQRVAHADVFAPVKAHVAELERRFPGARVPWLSVQTAAPSPLRLMDLLSKKHPLDTL 390 400 410 420 430 440 590 600 610 620 630 640 pF1KA1 FFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSP :.:. : :. ::::::.::::::::::.::: :.::..: ..: ::: : : CCDS56 FLLAGPDTVLTPDFLNRCRMHAISGWQAFFPMHFQAFHPAVAPPQGP-GPPELGRDT--- 450 460 470 480 490 500 650 660 670 680 690 700 pF1KA1 PGADPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFL :::::::..:.::::.::.:::.:::. :...::: ::.:.:...:: CCDS56 ------------GRFDRQAASEACFYNSDYVAARGRLAA--ASEQEEELLESLDVYELFL 510 520 530 540 550 710 720 730 740 750 760 pF1KA1 RFSGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQA .::.::..:::::.:.:.. . :: ::::.::::: : :::::.:.:::: ::::::. CCDS56 HFSSLHVLRAVEPALLQRYRAQTCSARLSEDLYHRCLQSVLEGLGSRTQLAMLLFEQEQG 560 570 580 590 600 610 770 pF1KA1 NST ::: CCDS56 NST >>CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 (802 aa) initn: 328 init1: 152 opt: 486 Z-score: 368.4 bits: 79.0 E(32554): 3.4e-14 Smith-Waterman score: 684; 25.3% identity (53.0% similar) in 834 aa overlap (8-766:8-784) 10 20 30 40 50 60 pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR : : : :.::. :. : : :.: .. : . : :.: : :.: CCDS10 MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSG-QAAASQAG 10 20 30 40 50 70 80 90 100 110 pF1KA1 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRER--LLVAVLTSRATLSTLAV ..: .. : ::. : :.: :.:.:.:.. :.: :: CCDS10 GARGDAR-GAQLWPPGSDPDG---------------GPRDRNFLFVGVMTAQKYLQTRAV 60 70 80 90 100 120 130 140 150 160 170 pF1KA1 AVNRTVAHHFPRLLYFTGQRGARAPAGMQVV-------SHGDERPAWLMSETLRHLHTHF :. :: .. .: . : ...:. . . . :: :. .. ...: :...: :. CCDS10 AAYRTWSKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMM---LKYMHDHY 110 120 130 140 150 160 180 190 200 210 220 pF1KA1 GADYDWFFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA----EEFIG--AGEQAR-YCH :.::. .::.:... :: . :. .. :.::.. : .: : : .. .: CCDS10 LDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCM 170 180 190 200 210 220 230 240 250 260 270 280 pF1KA1 GGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRS :: : ..:: .: :. ::. : .. ... : .:::. :: :: ... :: :.. CCDS10 GGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYEN 230 240 250 260 270 280 290 300 310 320 330 340 pF1KA1 FELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-R .: :. . .: . .:...:: .. .::::. . : : ::... :. : CCDS10 YEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYM----LSRKISELRHRTIQLHR 290 300 310 320 330 350 360 370 380 390 pF1KA1 NLTVLTPEGEAGL---SWPVGLPAPFT---PHSRFEVLGWDYFTEQHTFSCADGAP-KCP ...... ... . . .:.: : :..: :.: :...: .. .: .:: : . CCDS10 EIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRG 340 350 360 370 380 390 400 410 420 430 440 450 pF1KA1 LQGASRADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECV ...:.: . : . ..:..: . : :. ... :::: .: : :: ::::: CCDS10 MDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYK 400 410 420 430 440 450 460 470 480 490 pF1KA1 TQRGHRRALA--RRVSLLRPLSRVEILP-------------------MPYVTEATR--VQ ..:.. .. :.. : . .:..... . ..... . : CCDS10 KHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVP 460 470 480 490 500 510 500 510 520 530 pF1KA1 LVLP---------------LLVAEAAAAPAFLE---AFAANVLEPREHALLTLLLVYGPR . :: .:. .. :.. : . : : ... :..:: CCDS10 FQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLF---- 520 530 540 550 560 570 540 550 560 570 580 pF1KA1 EGGRGAPDPFLGVKAAAAELER----RYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDT .. . :: :: .:: : .:: . . : : .: :.. ..: :.. .. CCDS10 -NSDSNPD-----KAKQVELMRDYRIKYPKADMQILPVSGEF-SRALALEVGSSQFNNES 580 590 600 610 620 590 600 610 620 630 640 pF1KA1 LFFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPS :.:. : : :.::: :.. : : .::. :....: . .: : . CCDS10 LLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVY---------SGKVPSD 630 640 650 660 670 650 660 670 680 690 700 pF1KA1 PPGADPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAG-ELAGQEEEEALEGLEVMDV : .. : . . . :.:..: . :..: ... : ::: .:. CCDS10 NHFAFTQKT----GFWRNYGFGITCIYKGDLV----RVGGFDVSIQGW-----GLEDVDL 680 690 700 710 720 710 720 730 740 750 760 pF1KA1 FLRF--SGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFE : . .::. ::. : :.:. :.: :. . :. : :. :. ::: .: CCDS10 FNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLE 730 740 750 760 770 780 770 pF1KA1 QEQANST . CCDS10 KNDPSYSKSSNNNGSVRTA 790 800 >>CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 (882 aa) initn: 466 init1: 147 opt: 444 Z-score: 336.8 bits: 73.3 E(32554): 1.9e-12 Smith-Waterman score: 665; 24.5% identity (55.6% similar) in 738 aa overlap (99-766:170-871) 70 80 90 100 110 120 pF1KA1 KPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAVNRTVAHHF :. : :.:.:.. :.. :.:..:: :. . CCDS34 GAAGQRRDGRPGSSHNGSGDGGAAAPSARPRDFLYVGVMTAQKYLGSRALAAQRTWARFI 140 150 160 170 180 190 130 140 150 160 170 pF1KA1 P-RLLYFTGQRGARA---PAGMQVV-------SHGDERPAWLMSETLRHLHTHFGADYDW : :. .:..:. : : . :. :. .. ...: ....: :. :.: CCDS34 PGRVEFFSSQQPPNAGQPPPPLPVIALPGVDDSYPPQKKSFMM---IKYMHDHYLDKYEW 200 210 220 230 240 250 180 190 200 210 220 230 pF1KA1 FFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA-----EEF--IGAGEQARYCHGGFGYL :. .::.:... .: . :. .. ::::.. ::. .: .: :: :.. CCDS34 FMRADDDVYIKGDKLEEFLRSLNSSKPLYLGQTGLGNIEELGKLGLEPGENFCMGGPGMI 260 270 280 290 300 310 240 250 260 270 280 pF1KA1 LSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRSFELAKN .:: .: :. ::. : .. ... : .:::. :. :: ... :: ....: .. CCDS34 FSREVLRRMVPHIGECLREMYTTHEDVEVGRCVRRFGGTQCVWSYEMQQLFHENYEHNRK 320 330 340 350 360 370 290 300 310 320 330 340 pF1KA1 RDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-RNLTVLT . .: . .:...:: .. . .::::. . : : ::.. :. :. .... CCDS34 GYIQDLHNSKIHAAITLHPNKRPAYQYRLHNYM----LSRKISELRYRTIQLHRESALMS 380 390 400 410 420 430 350 360 370 380 390 400 pF1KA1 PEGEAGLS---WPVG-LPA--PFTPHSRFEVLGWDYFTEQHTFSCADGAP-KCPLQGASR ... .: .: .:. : :. : ::. :...: . .: :.. : . :.. : CCDS34 KLSNTEVSKEDQQLGVIPSFNHFQPRERNEVIEWEFLTGKLLYSAAENQPPRQSLSSILR 440 450 460 470 480 490 410 420 430 440 450 pF1KA1 ADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECVTQRGHR . . :.. ..:..:. . : :. ... :::: .: .:.:: ::::: ..:.. CCDS34 TALDDTVLQVMEMINENAKSRGRLIDFKEIQYGYRRVNPMHGVEYILDLLLLYKRHKGRK 500 510 520 530 540 550 460 470 480 pF1KA1 RAL-ARRVSLL-----RPLSR-VEILPMPYVTEAT------------------------- .. .:: . : .:. : .: : . ..:. CCDS34 LTVPVRRHAYLQQLFSKPFFRETEELDVNSLVESINSETQSFSFISNSLKILSSFQGAKE 560 570 580 590 600 610 490 500 510 520 530 540 pF1KA1 -------RVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD .:....:: ... :.: : : :.... :...: :..:. . CCDS34 MGGHNEKKVHILVPL-IGRYDIFLRFMENFENMCLIPKQNVKLVIILF--SRDSGQDSSK 620 630 640 650 660 550 560 570 580 590 600 pF1KA1 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG . .:. . .:: .... . ...: . : ...: . :::... : CCDS34 HIELIKG----YQNKYPKAEMTLIPMKGEFSRGLGL-EMASAQFDNDTLLLFCDVDLIFR 670 680 690 700 710 720 610 620 630 640 650 660 pF1KA1 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI . :.::: :.:.: :...:. :....: .. : .::. :. . CCDS34 EDFLQRCRDNTIQGQQVYYPIIFSQYDPKVT----------NGGNPPTDDYFIFSKKT-- 730 740 750 760 770 670 680 690 700 710 pF1KA1 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLR--FSGLHLFR : . . . :.:..: :.: .: . ::: .:.. . .:::. :: CCDS34 -GFWRDYGYGITCIYKSDLLGA--------GGFDTSIQGWGLEDVDLYNKVILSGLRPFR 780 790 800 810 820 720 730 740 750 760 770 pF1KA1 AVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST . : :.:. : :.: :. . :. : :. ... ::: .:. CCDS34 SQEVGVVHIFHPVHCDPNLDPKQYKMCLGSKASTFASTMQLAELWLEKHLGVRYNRTLS 830 840 850 860 870 880 772 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 21:08:53 2016 done: Wed Nov 2 21:08:54 2016 Total Scan time: 4.350 Total Display time: 0.130 Function used was FASTA [36.3.4 Apr, 2011]