本文将分享为什么在对表达式求值时将byte和short值提升为int的详细内容,并且还将对表达式求值为什么要用栈进行详尽解释,此外,我们还将为大家带来关于C++表达式求值详解、c/c++表达式求值、C
本文将分享为什么在对表达式求值时将byte和short值提升为int的详细内容,并且还将对表达式求值为什么要用栈进行详尽解释,此外,我们还将为大家带来关于C++表达式求值详解、c/c++ 表达式求值、C/C++表达式求值问题、Go 表达式求值器的相关知识,希望对你有所帮助。
本文目录一览:为什么在对表达式求值时将byte和short值提升为int(表达式求值为什么要用栈)
我想知道为什么在计算表达式或按位运算时将byte
和short
提升为值的原因int
?
答案1
小编典典因为Java语言规范是这样说的。第5.6.1节定义了用于撤消某些运算符的一元数值提升,并指出:
- 如果操作数的编译时类型为byte,short或char,则通过扩展基元转换(第5.1.2节)将其提升为int类型的值。
关于二进制数值运算符(“
binary”表示具有两个操作数,如“
+”的运算符)的评估的第5.6.2节说类似的话:
- 如果一个操作数的类型为double,则另一个将转换为double。
- 否则,如果其中一个操作数的类型为float,则另一个将转换为float。
- 否则,如果其中一个操作数的类型为long,则另一个将转换为long。
- 否则,两个操作数都将转换为int类型。
为什么这样定义?一个主要原因是,在设计Java语言和Java虚拟机时,计算机的标准字长为32位,而使用较小类型的基本算术在性能上没有优势。通过使用32位作为int大小,然后在Java字节码中提供专用指令,Java虚拟机被设计为利用此优势。用于使用整数,长整数,浮点数和双精度数的算术运算,但不适用于任何较小的数字类型(字节,短数和字符)。消除较小的类型将使字节码更简单,并使完整的指令集以及将来的扩展空间仍将操作码放在单个字节中。同样,JVM的设计偏向于在32位系统上轻松实现,在类和堆栈中的数据布局中,其中64位类型(双精度和长整数)占用两个插槽,而所有其他类型(32-位或更少)占用一个插槽。
因此,较小的类型通常在Java设计中被视为二等公民,并在各个步骤将其转换为int,因为这简化了某些事情。较小的类型仍然很重要,因为它们打包在一起时(例如,以数组形式)占用较少的内存,但是在计算表达式时却无济于事。
C++表达式求值详解
一.细节处理:
1.注意负数 因此要进行字符串预处理
string format(string str) { int len = str.length(); for (int i = 0; i < len; i++) { if (str[i] == ''-'') { if (i == 0) { str.insert(0, 1, ''0''); }//处理-3*2+1情况 else if (str[i - 1]==''('') { str.insert(i, 1, ''0''); }//处理(-3*4+1)情况 } } return str; }
2.考虑除数为0
case ''/'': if (0 != y) { res = x / y; } else { cout << "非法表达式"; return -1; } break;
3.原字符串再加上一个定界符 ''#''
str=str+''#''
4.优先级:
1."("未入栈前为3 入栈后为0 2.”)"和"#"为0 3.”+" "-"为1 4.”*"和"/"为2
二.知识要点:
中缀表达式转为后缀表达式
1. 首先设置存储运算符和存储操作数两个栈 即Symbol[N]和Num[N]且分别对应top2,top1
top1=-1 Symbol[0]=''#'' //运算符栈设置定界符 top2=0
2.入栈和出栈的规则 字符串为str
一.若str[i]>=''0&&str[i]<=''9'',则入操作数栈并继续扫描以一个字符 即Num[++top1]=str[i++]-''0'';
二.否则 将当前字符str1与运算符栈的栈顶元素str2进行优先级比较 ,自写比较函数
例如: str1==‘+'' 则若str2==# ,(,) 则返回1 说明str1比str2优先级高
1. 此时若str1优先级大于str2 则将str1入运算符栈并继续扫描 即 Symbol[++top2]=str[i++]
2.优先级相等则返回0 此时将运算符栈顶元素弹出,并继续扫描下一个字符即 top2-- i++
3.若str1优先级小于str2返回-1,此时将运算符栈顶元素弹出 即op=Symbol[top2--]
并弹出操作数栈的两个元素 即y=Num[top1--],x=Num[top1--] 之后进行计算操作
三.最后 return Num[top1]
三.完整源码:
#define _CRT_SECURE_NO_WARNINGS #include<bits/stdc++.h> using namespace std; class Expression { public: Expression(string str); ~Expression(); int Compute(); private: int Comp(char str1, char str2); string str1; }; Expression::Expression(string str) { this->str1 = str + ''#'';//以定界符开头 } Expression :: ~Expression() {} //将中缀表达转为后缀表达 int Expression::Compute() { int Num[100], Symbol[100];//定义存操作数和运算符的两个栈 int i, k, x, y, res; char op; Symbol[0] = ''#''; int top1 = -1, top2 = 0; for (i = 0; str1[i] != ''\0'';) { if (str1[i] >= ''0'' && str1[i] <= ''9'') { Num[++top1] = str1[i++] - ''0''; } else {//非操作数就比较运算符优先级 int cmp = Comp(str1[i], Symbol[top2]); if (cmp == 1) { Symbol[++top2] = str1[i++]; }//将运算符入栈 并接着扫描下一个字符 else if (cmp == 0) { --top2; i++; }//优先级相等 弹栈 并接着扫描下一个字符 else {//优先级低 继续处理当前运算符 y = Num[top1--];//后面的数要先弹出来 才不会算反 x= Num[top1--]; op = Symbol[top2--]; switch (op) { case ''+'': res = x + y;//将运算结果入栈 break; case ''-'': res = x - y; break; case ''*'': res = x * y; break; case ''/'': if (0 != y) { res = x / y; } else { cout << "非法表达式"; return -1; } break; default:break; } Num[++top1] = res; } } } return Num[top1]; } string format(string str) { int len = str.length(); for (int i = 0; i < len; i++) { if (str[i] == ''-'') { if (i == 0) { str.insert(0, 1, ''0''); }//处理-3*2+1情况 else if (str[i - 1]==''('') { str.insert(i, 1, ''0''); }//处理(-3*4+1)情况 } } return str; } int main() { string str; int n = 3; while (n--) { cout << "请输入一个表达式: " << endl; cin >> str; str = format(str); Expression E(str); int result = E.Compute(); cout << "表达式的值的是: " << result << endl; } return 0; } int Expression::Comp(char str1, char str2)//当前字符元素和栈顶运算符优先级比较 { //1代表 str1优先级大于str2 0 代表相等 -1代表小于 switch (str1) { case''+'':case''-'': if (str2 == ''#''||str2=='')''||str2==''('') { return 1; }//左括号入队列后优先级变为0 else { return -1; } break; case''*'':case''/'': if (str2 == ''*'' || str2 == ''/'') { return -1; } else { return 1; } break; case''('': return 1; break; case'')'': if (str2 == ''('') { return 0; } else if(str2 == ''#'') { return 1; } else { return -1; } break; case''#'': if (str2 == ''#'') { return 0; } else { return -1; } break; default: break; } }
四.测试结果:
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注的更多内容!
- C语言中栈和队列实现表达式求值的实例
- JavaScript数据结构中栈的应用之表达式求值问题详解
- 浅谈C/C++ 语言中的表达式求值
- C++利用链栈实现表达式求值
c/c++ 表达式求值
表达式求值[问题描述]
一个算术表达式是由操作数 (operand)、运算符 (operator) 和界限符 (delimiter) 组成的。假设操作数是正整数,运算符只含加减乘除等四种运算符,界限符有左右括号和表达式起始、结束符 “#”,如:#(7+15)*(23-28/4)#。引入表达式起始、结束符是为了方便。编程利用 “算符优先法” 求算术表达式的值。
[基本要求]
(1) 从键盘读入一个合法的算术表达式,输出正确的结果。
(2) 显示输入序列和栈的变化过程。
[选作内容]
(1) 扩充运算符集合。
(2) 引入变量操作数。
(3) 操作数类型扩充到实数。
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <math.h>
#include <conio.h>
#define TRUE 1
#define FALSE 0
#define Stack_Size 50
char ops[7]={''+'',''-'',''*'',''/'',''('','')'',''#''}; /*运算符数组*/
int cmp[7][7]={
{2,2,1,1,1,2,2}, /*用来进行比较运算符优先级的矩阵,3代表''='',2代表''>'',1代表''<'',0代表不可比*/
{2,2,1,1,1,2,2},
{2,2,2,2,1,2,2},
{2,2,2,2,1,2,2},
{1,1,1,1,1,3,0},
{2,2,2,2,0,2,2},
{1,1,1,1,1,0,3}};
typedef struct
{
char elem[Stack_Size];
int top;
}SeqStack; /*运算符栈的定义*/
typedef struct
{
int elem[Stack_Size];
int top;
}nSeqStack; /* 运算数栈的定义*/
void InitStack(SeqStack *S) /*初始化运算符栈*/
{
S->top =-1;
}
void InitStackn(nSeqStack *S) /*初始化运算数栈*/
{
S->top =-1;
}
int IsEmpty(SeqStack *S) /*判断栈S为空栈时返回值为真,反之为假*/
{
return(S->top==-1?TRUE:FALSE);
}
int IsEmptyn(nSeqStack *S) /*判断栈S为空栈时返回值为真,反之为假*/
{
return(S->top==-1?TRUE:FALSE);
}
/*判栈满*/
int IsFull(SeqStack *S) /*判断栈S为满栈时返回值为真,反之为假*/
{
return(S->top==Stack_Size-1?TRUE:FALSE);
}
int IsFulln(nSeqStack *S) /*判断栈S为满栈时返回值为真,反之为假*/
{
return(S->top==Stack_Size-1?TRUE:FALSE);
}
int Push(SeqStack *S, char x) /*运算符栈入栈函数*/
{
if (S->top==Stack_Size-1)
{
printf("Stack is full!\n");
return FALSE;
}
else
{
S->top++;
S->elem[S->top]=x;
return TRUE;
}
}
int Pushn(nSeqStack *S, int x) /*运算数栈入栈函数*/
{
if (S->top==Stack_Size-1)
{
printf("Stack is full!\n");
return FALSE;
}
else
{
S->top++;
S->elem[S->top]=x;
return TRUE;
}
}
int Pop(SeqStack *S, char *x) /*运算符栈出栈函数*/
{
if (S->top==-1)
{
printf("运算符栈空!\n");
return FALSE;
}
else
{
*x=S->elem[S->top];
S->top--;
return TRUE;
}
}
int Popn(nSeqStack *S, int *x) /*运算数栈出栈函数*/
{
if (S->top==-1)
{
printf("运算符栈空!\n");
return FALSE;
}
else
{
*x=S->elem[S->top];
S->top--;
return TRUE;
}
}
char GetTop(SeqStack *S) /*运算符栈取栈顶元素函数*/
{
if (S->top ==-1)
{
printf("运算符栈为空!\n");
return FALSE;
}
else
{
return (S->elem[S->top]);
}
}
int GetTopn(nSeqStack *S) /*运算数栈取栈顶元素函数*/
{
if (S->top ==-1)
{
printf("运算符栈为空!\n");
return FALSE;
}
else
{
return (S->elem[S->top]);
}
}
int Isoperator(char ch) /*判断输入字符是否为运算符函数,是返回TRUE,不是返回FALSE*/
{
int i;
for (i=0;i<7;i++)
{
if(ch==ops[i])
return TRUE;
}
return FALSE;
}
/*
int isvariable(char ch)
{ if (ch>=''a''&&ch<=''z'')
return true;
else
return false;
}*/
char Compare(char ch1, char ch2) /*比较运算符优先级函数*/
{
int i,m,n;
char pri;
int priority;
for(i=0;i<7;i++) /*找到相比较的两个运算符在比较矩阵里的相对位置*/
{
if(ch1==ops[i])
m=i;
if (ch2==ops[i])
n=i;
}
priority = cmp[m][n];
switch(priority)
{
case 1:
pri=''<'';
break;
case 2:
pri=''>'';
break;
case 3:
pri=''='';
break;
case 0:
pri=''$'';
printf("表达式错误!\n");
break;
}
return pri;
}
int Execute(int a, char op, int b) /*运算函数*/
{
int result;
switch(op)
{
case ''+'':
result=a+b;
break;
case ''-'':
result=a-b;
break;
case ''*'':
result=a*b;
break;
case ''/'':
result=a/b;
break;
}
return result;
}
int ExpEvaluation()
/*读入一个简单算术表达式并计算其值。optr和operand分别为运算符栈和运算数栈,OPS为运算符集合*/
{
int a,b,v,temp;
char ch,op;
char *str;
int i=0;
SeqStack optr;
nSeqStack operand;
InitStack(&optr);
InitStackn(&operand);
Push(&optr,''#'');
printf("请输入表达式(以#结束):\n"); /*表达式输入*/
str =(char *)malloc(50*sizeof(char));
gets(str);
ch=str[i];
i++;
while(ch!=''#''||GetTop(&optr)!=''#'')
{
if(!Isoperator(ch))
{
temp=ch-''0''; /*将字符转换为十进制数*/
ch=str[i];
i++;
while(!Isoperator(ch))
{
temp=temp*10 + ch-''0''; /*将逐个读入运算数的各位转化为十进制数*/
ch=str[i];
i++;
}
Pushn(&operand,temp);
}
else
{
switch(Compare(GetTop(&optr),ch))
{
case ''<'':
Push(&optr,ch);
ch=str[i];
i++;
break;
case ''='':
Pop(&optr,&op);
ch=str[i];
i++;
break;
case ''>'':
Pop(&optr,&op);
Popn(&operand,&b);
Popn(&operand,&a);
v=Execute(a,op,b); /* 对a和b进行op运算 */
Pushn(&operand,v);
break;
}
}
}
v=GetTopn(&operand);
return v;
}
void main() /*主函数*/
{
int result;
result=ExpEvaluation();
printf("\n表达式结果是%d\n",result);
}
下面这个是在网上找的:
用 C++ 实现的加、减、乘、除表达式计算
前些日子面试一个开发工作,考官出了这么一笔试题目,要我写出实现过程, 思量半天,终于
用 C++ 完成,现将代码贴出,与诸同道共分享。
// 头文件 Calc.h
#ifndef __CALC_H__
#define __CALC_H__
#include <stack>
#define ascii_int(x) (x >= 0x30 && x <= 0x39) ? (x - 0x30) : (x)
const int GREATER = 1;
const int EQUAL = 0;
const int LESS = -1;
class Calculate {
public:
int evaluteExpr(char *exp);
private:
int getLevel(char ch);
bool isOperator(char ch);
int compareOpteratorLevel(char inputChar, char optrStackTop);
int calc(int num1, int num2, char op);
void evaluate(char ch);
private:
std::stack<int> _opnd_stack;
std::stack<char> _optr_stack;
static char _optr[];
static int _level[];
};
#endif
// 头文件的实现代码 Calc.cxx
#include "Calc.h"
char Calculate::_optr[] = {''#'', ''('', ''+'', ''-'', ''*'', ''/'', '')''};
int Calculate::_level[] = { 0, 1, 2, 2, 3, 3, 4 };
// Get current operator level for calculating
int Calculate::getLevel(char ch) {
for (int i = 0; *(_optr+i) != ''\0''; ++i)
if (*(_optr+i) == ch)
return *(_level+i);
}
// Calculate the operands
int Calculate::calc(int num1, int num2, char op) {
switch (op)
{
case ''+'':
return num1 + num2;
case ''-'':
return num1 - num2;
case ''*'':
return num1 * num2;
case ''/'':
return num1 / num2;
}
}
// judge inputing character is operator or not
bool Calculate::isOperator(char ch) {
for (char *p = _optr; *p != ''\0''; ++p)
if (*p == ch)
return true;
return false;
}
// Compare level of input operator and the top operator of operator stack
int Calculate::compareOpteratorLevel(char inputChar, char optrStackTop) {
// if (inputChar == ''('' && optrStackTop == '')'')
// return EQUAL;
// else
if (inputChar == ''('')
return GREATER;
if (inputChar == '')'' && optrStackTop == ''('')
return EQUAL;
else if (inputChar == '')'')
return LESS;
if (inputChar == ''#'' && optrStackTop == ''#'')
return EQUAL;
// else if (inputChar == ''#'')
// return LESS;
return (getLevel(inputChar) > getLevel(optrStackTop)) ? GREATER : LESS;
}
// Evaluate value while inputing operators
void Calculate::evaluate(char ch) {
char op;
int num, result;
if (!isOperator(ch)) {
_opnd_stack.push(ascii_int(ch));
return ;
}
switch (compareOpteratorLevel(ch, _optr_stack.top()))
{
case GREATER :
_optr_stack.push(ch);
break;
case EQUAL :
_optr_stack.pop();
break;
case LESS :
num = _opnd_stack.top();
_opnd_stack.pop();
result = _opnd_stack.top();
_opnd_stack.pop();
op = _optr_stack.top();
_optr_stack.pop();
result = calc(result, num, op);
_opnd_stack.push(result);
evaluate(ch);
break;
}
}
// Evaluate user specified expression
int Calculate::evaluteExpr(char *exp) {
_optr_stack.push(''#'');
for (char *p =exp; *p != ''\0''; ++p )
evaluate(*p);
int result = _opnd_stack.top();
_opnd_stack.pop();
return result;
}
// 测试代码 calc_test.cxx
#include <iostream>
#include "Calc.h"
using namespace std;
int main(void) {
Calculate *calc = new Calculate();
cout << "1+3*(4+7) = "
<< calc->evaluteExpr("1+3*(4+7)#")
<< endl;
cout << "((1+2)) = "
<< calc->evaluteExpr("((1+2))#")
<< endl;
cout << "3*8+9/7-5-9+(1-9)/4 = "
<< calc->evaluteExpr("3*8+9/7-5-9+(1-9)/4#")
<< endl;
cout << "(6-7)*(5+9) = "
<< calc->evaluteExpr("(6-7)*(5+9)#")
<< endl;
cout << "0*8+0/6-9+(7-1) = "
<< calc->evaluteExpr("0*8+0/6-9+(7-1)#")
<< endl;
delete calc;
}
用 MinGW/G++ 3.4.5 编译如下:
g++ -o test.exe Calc.cxx Calc_test.cxx
作为一个演示算法够了, 但代码还是有一些缺点:
(1) 只能处理一位数的加、减、乘、除表达式计算(可带括号)
本文同步分享在 博客 “shiter”(CSDN)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与 “OSC 源创计划”,欢迎正在阅读的你也加入,一起分享。
C/C++表达式求值问题
转载:https://originlee.com/2016/05/01/eval-expression-in-c-and-cpp/
前几日,一个刚学编程的老朋友问了我一个问题:
int i = 0;
i = i ++;
printf(“%d\n”, i);
为什么打印i的值是1而不是0?
这种undefined的问题在网上是讨论烂了的。一般会纠结这种问题的同学,多半是看了本烂书。
我给这位老朋友看了一篇裘宗燕先生的文章,他立马就明白了问题所在,并不再纠结于类似的问题了。
C/C++ 语言中表达式的求值
裘宗燕
北京大学数学学院信息科学系
本文基本内容发表于《编程高手》杂志2004年第12期经常可以在一些讨论组里看到下面的提问:“谁知道下面C语句给n赋什么值?”
m = 1; n = m+++m++;
最近有位不相识的朋友发email给我,问为什么在某个C++系统里,下面表达式打印出两个4,而不是4和5:
a = 4; cout << a++ << a;
C++ 不是规定 << 操作左结合吗?是C++ 书上写错了,还是这个系统的实现有问题?
要弄清这些,需要理解的一个问题是:如果程序里某处修改了一个变量(通过赋值、增量/减量操作等),什么时候从该变量能够取到新值?有人可能说,“这算什么问题!我修改了变量,再从这个变量取值,取到的当然是修改后的值!”其实事情并不这么简单。
C/C++ 语言是“基于表达式的语言”,所有计算(包括赋值)都在表达式里完成。“x = 1;”就是表达式“x = 1”后加表示语句结束的分号。要弄清程序的意义,首先要理解表达式的意义,也就是:1)表达式所确定的计算过程;2)它对环境(可以把环境看作当时可用的所有变量)的影响。如果一个表达式(或子表达式)只计算出值而不改变环境,我们就说它是引用透明的,这种表达式早算晚算对其他计算没有影响(不改变计算的环境。当然,它的值可能受到其他计算的影响)。如果一个表达式不仅算出一个值,还修改了环境,就说这个表达式有副作用(因为它多做了额外的事)。a++ 就是有副作用的表达式。这些说法也适用于其他语言里的类似问题。现在问题变成:如果C/C++ 程序里的某个表达式(部分)有副作用,这种副作用何时才能实际体现到使用中?为使问题更清楚,我们假定程序里有代码片段“…a[i]++ … a[j] …”,假定当时i与j的值恰好相等(a[i] 和a[j] 正好引用同一数组元素);假定a[i]++ 确实在a[j] 之前计算;再假定其间没有其他修改a[i] 的动作。在这些假定下,a[i]++ 对 a[i] 的修改能反映到 a[j] 的求值中吗?注意:由于 i 与 j 相等的问题无法静态判定,在目标代码里,这两个数组元素访问(对内存的访问)必然通过两段独立代码完成。现代计算机的计算都在寄存器里做,问题现在变成:在取 a[j] 值的代码执行之前,a[i] 更新的值是否已经被(从寄存器)保存到内存?如果了解语言在这方面的规定,这个问题的答案就清楚了。
程序语言通常都规定了执行中变量修改的最晚实现时刻(称为顺序点、序点或执行点)。程序执行中存在一系列顺序点(时刻),语言保证一旦执行到达一个顺序点,在此之前发生的所有修改(副作用)都必须实现(必须反应到随后对同一存储位置的访问中),在此之后的所有修改都还没有发生。在顺序点之间则没有任何保证。对C/C++ 语言这类允许表达式有副作用的语言,顺序点的概念特别重要。
现在上面问题的回答已经很清楚了:如果在a[i]++ 和a[j] 之间存在一个顺序点,那么就能保证a[j] 将取得修改之后的值;否则就不能保证。
C/C++语言定义(语言的参考手册)明确定义了顺序点的概念。顺序点位于:
- 每个完整表达式结束时。完整表达式包括变量初始化表达式,表达式语句,return语句的表达式,以及条件、循环和switch语句的控制表达式(for头部有三个控制表达式);
- 运算符 &&、||、?: 和逗号运算符的第一个运算对象计算之后;
- 函数调用中对所有实际参数和函数名表达式(需要调用的函数也可能通过表达式描述)的求值完成之后(进入函数体之前)。
假设时刻ti和ti+1是前后相继的两个顺序点,到了ti+1,任何C/C++ 系统(VC、BC等都是C/C++系统)都必须实现ti之后发生的所有副作用。当然它们也可以不等到时刻ti+1,完全可以选择在时段 [t, ti+1] 之间的任何时刻实现在此期间出现的副作用,因为C/C++ 语言允许这些选择。
前面讨论中假定了a[i]++ 在a[i] 之前做。在一个程序片段里a[i]++ 究竟是否先做,还与它所在的表达式确定的计算过程有关。我们都熟悉C/C++ 语言有关优先级、结合性和括号的规定,而出现多个运算对象时的计算顺序却常常被人们忽略。看下面例子:
(a + b) * (c + d)
fun(a++, b, a+5)这里“*”的两个运算对象中哪个先算?fun及其三个参数按什么顺序计算?对第一个表达式,采用任何计算顺序都没关系,因为其中的子表达式都是引用透明的。第二个例子里的实参表达式出现了副作用,计算顺序就非常重要了。少数语言明确规定了运算对象的计算顺序(Java规定从左到右),C/C++ 则有意不予规定,既没有规定大多数二元运算的两个对象的计算顺序(除了&&、|| 和,),也没有规定函数参数和被调函数的计算顺序。在计算第二个表达式时,首先按照某种顺序算fun、a++、b和a+5,之后是顺序点,而后进入函数执行。
不少书籍在这些问题上有错(包括一些很流行的书)。例如说C/C++ 先算左边(或右边),或者说某个C/C++ 系统先计算某一边。这些说法都是错误的!一个C/C++ 系统可以永远先算左边或永远先算右边,也可以有时先算左边有时先算右边,或在同一表达式里有时先算左边有时先算右边。不同系统可能采用不同的顺序(因为都符合语言标准);同一系统的不同版本完全可以采用不同方式;同一版本在不同优化方式下,在不同位置都可能采用不同顺序。因为这些做法都符合语言规范。在这里还要注意顺序点的问题:即使某一边的表达式先算了,其副作用也可能没有反映到内存,因此对另一边的计算没有影响。
回到前面的例子:“谁知道下面C语句给n赋什么值?”
m = 1; n = m++ +m++;
正确回答是:不知道!语言没有规定它应该算出什么,结果完全依赖具体系统在具体上下文中的具体处理。其中牵涉到运算对象的求值顺序和变量修改的实现时刻问题。对于:
cout << a++ << a;
我们知道它是
(cout.operator <<(a++)).operator << (a);
的简写。先看外层函数调用,这里需要算出所用函数(由加下划线的一段得到),还需要计算a的值。语言没有规定哪个先算。如果真的先算函数,这一计算中出现了另一次函数调用,在被调函数体执行前有一个顺序点,那时a++的副作用就会实现。如果是先算参数,求出a的值4,而后计算函数时的副作用当然不会改变它(这种情况下输出两个4)。当然,这些只是假设,实际应该说的是:这种东西根本不该写,讨论其效果没有意义。
有人可能说,为什么人们设计C/C++时不把顺序规定清楚,免去这些麻烦?C/C++ 语言的做法完全是有意而为,其目的就是允许编译器采用任何求值顺序,使编译器在优化中可以根据需要调整实现表达式求值的指令序列,以得到效率更高的代码。像Java那样严格规定表达式的求值顺序和效果,不仅限制了语言的实现方式,还要求更频繁的内存访问(以实现副作用),这些可能带来可观的效率损失。应该说,在这个问题上,C/C++和Java的选择都贯彻了它们各自的设计原则,各有所获(C/C++ 潜在的效率,Java更清晰的程序行为),当然也都有所失。还应该指出,大部分程序设计语言实际上都采用了类似C/C++的规定。
讨论了这么多,应该得到什么结论呢?C/C++ 语言的规定告诉我们,任何依赖于特定计算顺序、依赖于在顺序点之间实现修改效果的表达式,其结果都没有保证。程序设计中应该贯彻的规则是:如果在任何“完整表达式”(形成一段由顺序点结束的计算)里存在对同一“变量”的多个引用,那么表达式里就不应该出现对这一“变量”的副作用。否则就不能保证得到预期结果。注意:这里的问题不是在某个系统里试一试的问题,因为我们不可能试验所有可能的表达式组合形式以及所有可能的上下文。这里讨论的是语言,而不是某个实现。总而言之,绝不要写这种表达式,否则我们或早或晚会某种环境中遇到麻烦。
后记:去年参加一个学术会议,看到有同行写文章讨论某个C系统里表达式究竟按什么顺序求值,并总结出一些“规律”。从讨论中了解到某“程序员水平考试”出了这类题目。这使我感到很不安。今年给一个教师学习班讲课,发现许多专业课教师也对这一基本问题也不甚明了,更觉得问题确实严重。因此整理出这篇短文供大家参考。
后后记:4年多过去了,许多新的和老的教科书仍然在不厌其烦地讨论在C语言里原本并无意义的问题(如本文所指出的)。希望学习和使用C语言的人不要陷入其中。——2009.2
Go 表达式求值器
本篇将创建简单算术表达式的一个求值器。
定义接口和类型
开始,先确定要使用一个接口 Expr 来代表这种语言的任意一个表达式。暂时没有任何方法,稍后再逐个添加:
// Expr: 算术表达式 type Expr interface{}
我们的表达式语言将包括以下符号:
- 浮点数字面量
- 二元操作符:加减乘除(+、-、*、\/)
- 一元操作符:表示正数和负数的 -x 和 +x
- 函数调用:pow(x,y)、sin(x) 和 sqrt(x)
- 变量:比如 x、pi,自己定义一个变量名称,每次可以提供不用的值
还要有标准的操作符优先级,以及小括号。所有的值都是 float64 类型。
下面是几个示例表达式:
sqrt(A / pi) pow(x,3) + pow(y,3) (F - 32) * 5 / 9
下面5种具体类型代表特定类型的表达式:
- Var : 代表变量引用。这个类型是可导出的,至于为什么,后面会讲明
- literal : 代表浮点数常量
- unary : 代表有一个操作数的操作符表达式,操作数可以是任意的 Expr
- binary : 代表有两个操作数的操作符表达式,操作数可以是任意的 Expr
- call : 代表函数调用,这里限制它的 fn 字段只能是 pow、sin、sqrt
为了要计算包含变量的表达式,还需要一个上下文(environment)来把变量映射到数值。所有接口和类型的定义如下:
package eval // Expr: 算术表达式 type Expr interface { // 返回表达式在 env 上下文下的值 Eval(env Env) float64 // Check 方法报告表达式中的错误,并把表达式中的变量加入 Vars 中 Check(vars map[Var]bool) error } // Var 表示一个变量,比如:x. type Var string // Env 变量到数值的映射关系 type Env map[Var]float64 // literal 是一个数字常量,比如:3.1415926 type literal float64 // unary 表示一元操作符表达式,比如:-x type unary struct { op rune // one of ‘+‘,‘-‘ x Expr } // binary 表示二元操作符表达式,比如:x+y. type binary struct { op rune // one of ‘+‘,‘-‘,‘*‘,‘/‘ x,y Expr } // call 表示函数调用表达式,比如:sin(x). type call struct { fn string // one of "pow","sin","sqrt" args []Expr }
在定义好各种类型后,发现每个类型都需要提供一个 Eval 方法,于是加把这个方法加到接口中,已经添加到上面的代码中了。
这个包只导出了 Expr、Var、Env。客户端可以在不接触其他表达式类型的情况下使用这个求值器。
定义方法
接下来实现每个类型的 Eval 方法来满足接口:
- Var 的 Eval 方法从上下文中查询结果,如果变量不存在,则会返回0。
- literal 的 Eval 方法直接返回本身的值。
- unbary 的 Eval 方法首先对操作数递归求值,然后应用 op 操作符。
- binary 的 Eval 方法的处理逻辑和 unbary 一样。
- call 的 Eval 方法先对 pow、sin、sqrt 函数的参数求值,再调用 math 包中的对应函数。
package eval import ( "fmt" "math" ) func (v Var) Eval(env Env) float64 { return env[v] // 如果查询不到变量名,则返回类型的零值,就是0 } func (l literal) Eval(_ Env) float64 { return float64(l) } func (u unary) Eval(env Env) float64 { switch u.op { case ‘+‘: return +u.x.Eval(env) case ‘-‘: return -u.x.Eval(env) } panic(fmt.Sprintf("unsupported unary operator: %q",u.op)) } func (b binary) Eval(env Env) float64 { switch b.op { case ‘+‘: return b.x.Eval(env) + b.y.Eval(env) case ‘-‘: return b.x.Eval(env) - b.y.Eval(env) case ‘*‘: return b.x.Eval(env) * b.y.Eval(env) case ‘/‘: return b.x.Eval(env) / b.y.Eval(env) } panic(fmt.Sprintf("unsupported binary operator: %q",b.op)) } func (c call) Eval(env Env) float64 { switch c.fn { case "pow": return math.Pow(c.args[0].Eval(env),c.args[1].Eval(env)) case "sin": return math.Sin(c.args[0].Eval(env)) case "sqrt": return math.Sqrt(c.args[0].Eval(env)) } panic(fmt.Sprintf("unsupported function call: %s",c.fn)) }
某些方法可能会失败,有些错误会导致 Eval 崩溃,还有些会导致返回不正确的结果。所有这些错误可以在求值之前做检查来发现,所以还需要一个Check方法。不过暂时可以先不管Check方法,而是把 Eval 方法用起来,并通过测试进行验证。
Parse函数
要验证 Eval 方法,首先需要得到对象,然后调用对像的 Eval 方法。而对象需要通过解析字符串来获取,这就需要一个 Parse 函数。
text/scanner 包的使用
词法分析器 lexer 使用 text/scanner 包提供的扫描器 Scanner 类型来把输入流分解成一系列的标记(token),包括注释、标识符、字符串字面量和数字字面量。扫描器的 Scan 方法将提前扫描并返回下一个标记(类型为 rune)。大部分标记(比如‘(‘)都只包含单个rune,但 text/scanner 包也可以支持由多个字符组成的记号。调用 Scan 会返回标记的类型,调用 TokenText 则会返回标记的文本。
因为每个解析器可能需要多次使用当前的记号,但是 Scan 会一直向前扫描,所以把扫描器封装到一个 lexer 辅助类型中,其中保存了 Scan 最近返回的标记。下面是一个简单的用法示例:
package main import ( "fmt" "os" "strings" "text/scanner" ) type lexer struct { scan scanner.Scanner token rune // 当前标记 } func (lex *lexer) next() { lex.token = lex.scan.Scan() } func (lex *lexer) text() string { return lex.scan.TokenText() } // consume 方法并没有被使用到,包括后面的Pause函数 // 不过这是一个可复用的处理逻辑 func (lex *lexer) consume(want rune) { if lex.token != want { // 注意: 错误处理不是这篇的重点,简单粗暴的处理了 panic(fmt.Sprintf("got %q,want %q",lex.text(),want)) } lex.next() } func main() { for _,input := range os.Args[1:] { lex := new(lexer) lex.scan.Init(strings.NewReader(input)) lex.scan.Mode = scanner.ScanIdents | scanner.ScanInts | scanner.ScanFloats fmt.Println(input,":") lex.next() for lex.token != scanner.EOF { fmt.Println("\t",scanner.TokenString(lex.token),lex.text()) lex.next() } } }
执行效果如下:
PS G:\Steed\Documents\Go\src\localdemo\parse> go run main.go "sqrt(A / pi)" "pow(x,3)" "(F - 32) * 5 / 9" sqrt(A / pi) : Ident sqrt "(" ( Ident A "/" / Ident pi ")" ) pow(x,3) : Ident pow "(" ( Ident x ",",Int 3 ")" ) "+" + Ident pow "(" ( Ident y ",Int 3 ")" ) (F - 32) * 5 / 9 : "(" ( Ident F "-" - Int 32 ")" ) "*" * Int 5 "/" / Int 9 PS G:\Steed\Documents\Go\src\localdemo\parse>
Parse 函数
Parse 函数,递归地将字符串解析为表达式,下面是完整的代码:
package eval import ( "fmt" "strconv" "strings" "text/scanner" ) type lexer struct { scan scanner.Scanner token rune // 当前标记 } func (lex *lexer) next() { lex.token = lex.scan.Scan() } func (lex *lexer) text() string { return lex.scan.TokenText() } type lexPanic string // describe 返回一个描述当前标记的字符串,用于错误处理 func (lex *lexer) describe() string { switch lex.token { case scanner.EOF: return "end of file" case scanner.Ident: return fmt.Sprintf("identifier %s",lex.text()) case scanner.Int,scanner.Float: return fmt.Sprintf("number %s",lex.text()) } return fmt.Sprintf("%q",rune(lex.token)) // any other rune } func precedence(op rune) int { switch op { case ‘*‘,‘/‘: return 2 case ‘+‘,‘-‘: return 1 } return 0 } // Parse 将字符串解析为表达式 // // expr = num a literal number,e.g.,3.14159 // | id a variable name,x // | id ‘(‘ expr ‘,‘ ... ‘)‘ a function call // | ‘-‘ expr a unary operator (+-) // | expr ‘+‘ expr a binary operator (+-*/) // func Parse(input string) (_ Expr,err error) { defer func() { // 选择性地使用 recover // 已经将 panic value 设置成特殊类型 lexPanic // 在 recover 时对 panic value 进行检查 switch x := recover().(type) { case nil: // no panic case lexPanic: // 如果发现 panic value 是特殊类型,就将这个 panic 作为 errror 处理 err = fmt.Errorf("%s",x) default: // 如果不是,则按照正常的 panic 进行处理 panic(x) } }() lex := new(lexer) lex.scan.Init(strings.NewReader(input)) lex.scan.Mode = scanner.ScanIdents | scanner.ScanInts | scanner.ScanFloats lex.next() // 获取第一个标记 e := parseExpr(lex) if lex.token != scanner.EOF { return nil,fmt.Errorf("unexpected %s",lex.describe()) } return e,nil } func parseExpr(lex *lexer) Expr { return parseBinary(lex,1) } // binary = unary (‘+‘ binary)* // parseBinary 遇到优先级低于 prec1 的运算符时就停止 // 这个递归处理计算优先级的循环策略比较难理解 func parseBinary(lex *lexer,prec1 int) Expr { lhs := parseUnary(lex) for prec := precedence(lex.token); prec >= prec1; prec-- { for precedence(lex.token) == prec { op := lex.token lex.next() // consume operator rhs := parseBinary(lex,prec+1) // 优先级加1,进入下一次递归 lhs = binary{op,lhs,rhs} } } return lhs } // unary = ‘+‘ expr | primary func parseUnary(lex *lexer) Expr { if lex.token == ‘+‘ || lex.token == ‘-‘ { op := lex.token lex.next() // consume ‘+‘ or ‘-‘ return unary{op,parseUnary(lex)} } return parsePrimary(lex) } // primary = id // | id ‘(‘ expr ‘,‘ ... ‘,‘ expr ‘)‘ // | num // | ‘(‘ expr ‘)‘ func parsePrimary(lex *lexer) Expr { switch lex.token { case scanner.Ident: id := lex.text() lex.next() // consume Ident if lex.token != ‘(‘ { return Var(id) } lex.next() // consume ‘(‘ var args []Expr if lex.token != ‘)‘ { for { args = append(args,parseExpr(lex)) if lex.token != ‘,‘ { break } lex.next() // consume ‘,‘ } if lex.token != ‘)‘ { msg := fmt.Sprintf("got %q,want ‘)‘",lex.token) panic(lexPanic(msg)) } } lex.next() // consume ‘)‘ return call{id,args} case scanner.Int,scanner.Float: f,err := strconv.ParseFloat(lex.text(),64) if err != nil { panic(lexPanic(err.Error())) } lex.next() // consume number return literal(f) case ‘(‘: lex.next() // consume ‘(‘ e := parseExpr(lex) if lex.token != ‘)‘ { msg := fmt.Sprintf("got %s,lex.describe()) panic(lexPanic(msg)) } lex.next() // consume ‘)‘ return e } msg := fmt.Sprintf("unexpected %s",lex.describe()) panic(lexPanic(msg)) }
整体的逻辑都比较难理解。parseBinary 函数是负责解析二元表达式的,其中包括了对运算符优先级的处理(逻辑比较难懂,自己想不出来,看也没完全看懂,以后有类似的实现或许可以借鉴)。
测试函数
下面的 TestEval 函数用于测试求值器,它使用 testing 包,使用基于表的测试方式。表格中定义了三个表达式并为每个表达式准备了不同的上下文。第一个表达式用于根据圆面积A求半径,第二个用于计算两个变量x和y的立方和,第三个把华氏温度F转为摄氏温度:
package eval import ( "fmt" "math" "testing" ) func TestEval(t *testing.T) { tests := []struct { expr string env Env want string }{ {"sqrt(A / pi)",Env{"A": 87616,"pi": math.Pi},"167"},{"pow(x,3)",Env{"x": 12,"y": 1},"1729"},Env{"x": 9,"y": 10},{"5 / 9 * (F - 32)",Env{"F": -40},"-40"},Env{"F": 32},"0"},Env{"F": 212},"100"},} var prevExpr string for _,test := range tests { // 仅在表达式变更时才输出 if test.expr != prevExpr { fmt.Printf("\n%s\n",test.expr) prevExpr = test.expr } expr,err := Parse(test.expr) if err != nil { t.Error(err) // 解析出错 continue } got := fmt.Sprintf("%.6g",expr.Eval(test.env)) fmt.Printf("\t%v => %s\n",test.env,got) if got != test.want { t.Errorf("%s.Eval() in %v = %q,want %q\n",test.expr,got,test.want) } } }
对于表格中的每一行记录,先解析表达式,在上下文中求值,再输出表达式。启用 -v 选项查看测试的输出:
PS G:\Steed\Documents\Go\src\gopl\output\expression_evaluator\eval> go test -v === RUN TestEval sqrt(A / pi) map[A:87616 pi:3.141592653589793] => 167 pow(x,3) map[x:12 y:1] => 1729 map[x:9 y:10] => 1729 5 / 9 * (F - 32) map[F:-40] => -40 map[F:32] => 0 map[F:212] => 100 --- PASS: TestEval (0.00s) PASS ok gopl/output/expression_evaluator/eval 0.329s PS G:\Steed\Documents\Go\src\gopl\output\expression_evaluator\eval>
check 方法
到目前为止,所有的输入都是合法的,但是并不是总能如此。即使在解释性语言中,通过语法检查来发现静态错误(即不用运行程序也能检测出来的错误)也是很常见的。通过分离静态检查和动态检查,可以更快发现错误,也可以只在运行前检查一次,而不用在表达式求值时每次都检查。
现在就给 Expr 加上一个 Check 方法,用于在表达式语法树上检查静态错误。这个 Check 方法有一个 vars 参数,并不是因为需要传参,而是为了让递归调用的实现起来更方便,具体看后面的代码和说明:
// Expr: 算术表达式 type Expr interface { // 返回表达式在 env 上下文下的值 Eval(env Env) float64 // Check 方法报告表达式中的错误,并把表达式中的变量加入 Vars 中 Check(vars map[Var]bool) error }
具体的 Check 方法如下所示。literal 和 Var 的求值不可能出错,所以直接返回 nil。unary 和 binary 的方法首先检查操作符是否合法,再递归地检查操作数。类似地,call 的方法首先检查函数是否是已知的,然后检查参数个数,最后递归地检查每个参数:
package eval import ( "fmt" "strings" ) func (v Var) Check(vars map[Var]bool) error { vars[v] = true return nil } func (literal) Check(vars map[Var]bool) error { return nil } func (u unary) Check(vars map[Var]bool) error { if !strings.ContainsRune("+-",u.op) { return fmt.Errorf("unexpected unary op %q",u.op) } return u.x.Check(vars) } func (b binary) Check(vars map[Var]bool) error { if !strings.ContainsRune("+-*/",b.op) { return fmt.Errorf("unexpected binary op %q",b.op) } if err := b.x.Check(vars); err != nil { return err } return b.y.Check(vars) } func (c call) Check(vars map[Var]bool) error { arity,ok := numParams[c.fn] if !ok { return fmt.Errorf("unkNown function %q",c.fn) } if len(c.args) != arity { return fmt.Errorf("call to %s has %d args,want %d",c.fn,len(c.args),arity) } for _,arg := range c.args { if err := arg.Check(vars); err != nil { return err } } return nil } // 已知的函数名称和对应的参数个数 var numParams = map[string]int{"pow": 2,"sin": 1,"sqrt": 1}
关于递归的实现。Check 的输入参数是一个 Var 集合,这个集合是表达式中的变量名。要让表达式能成功求值,上下文必须包含所有的变量。从逻辑上来讲,这个集合应当是 Check 的输出结果而不是输入参数,但因为这个方法是递归调用的,在这种情况下使用参数更为方便。调用方最初调用时需要提供一个空的集合。
Web 应用
这篇里已经有一个绘制函数 z=f(x,y) 的 SVG 图形的实现了:
https://blog.51cto.com/steed/2356431
不过当时的函数 f 是在编译的时候指定的。既然这里可以对字符串形式的表达式进行解析、检查和求值,那么就可以构建一个 Web 应用,在运行时从客户端接收一个表达式,并绘制函数的曲面图。可以使用 vars 集合来检查表达式是否是一个只有两个变量x、y的函数(为了简单起见,还提供了半径r,所以实际上是3个变量)。使用 Check 方法来拒绝掉不规范的表达式,这样就不会在下面函数的40000个计算过程中(100x100的格子,每一个有4个角)重复这些检查。
表达式求值器已经完成了,把它作为一个包引入。然后把绘制函数图形加上 Web 应用的代码重新实现一遍,完整的代码如下:
package main import ( "fmt" "io" "log" "math" "net/http" ) import "gopl/output/expression_evaluator/eval" const ( width,height = 600,320 // canvas size in pixels cells = 100 // number of grid cells xyrange = 30.0 // x,y axis range (-xyrange..+xyrange) xyscale = width / 2 / xyrange // pixels per x or y unit zscale = height * 0.4 // pixels per z unit ) var sin30,cos30 = 0.5,math.Sqrt(3.0 / 4.0) // sin(30°),cos(30°) func corner(f func(x,y float64) float64,i,j int) (float64,float64) { // find point (x,y) at corner of cell (i,j) x := xyrange * (float64(i)/cells - 0.5) y := xyrange * (float64(j)/cells - 0.5) z := f(x,y) // compute surface height z // project (x,y,z) isometrically onto 2-D SVG canvas (sx,sy) sx := width/2 + (x-y)*cos30*xyscale sy := height/2 + (x+y)*sin30*xyscale - z*zscale return sx,sy } func surface(w io.Writer,f func(x,y float64) float64) { fmt.Fprintf(w,"<svg xmlns=‘http://www.w3.org/2000/svg‘ "+ "style=‘stroke: grey; fill: white; stroke-width: 0.7‘ "+ "width=‘%d‘ height=‘%d‘>",width,height) for i := 0; i < cells; i++ { for j := 0; j < cells; j++ { ax,ay := corner(f,i+1,j) bx,by := corner(f,j) cx,cy := corner(f,j+1) dx,dy := corner(f,j+1) fmt.Fprintf(w,"<polygon points=‘%g,%g %g,%g‘/>\n",ax,ay,bx,by,cx,cy,dx,dy) } } fmt.Fprintln(w,"</svg>") } // 组合了解析(Parse方法)和检查(Check方法)步骤 func parseAndCheck(s string) (eval.Expr,error) { if s == "" { return nil,fmt.Errorf("empty expression") } expr,err := eval.Parse(s) if err != nil { return nil,err } vars := make(map[eval.Var]bool) if err := expr.Check(vars); err != nil { return nil,err } for v := range vars { if v != "x" && v != "y" && v != "r" { return nil,fmt.Errorf("undefined variable: %s",v) } } return expr,nil } // 解析并检查Get请求的表达式,用它来创建一个有两个变量的匿名函数。 // 这个匿名函数与曲面绘制程序中的f有同样的签名。 func plot(w http.ResponseWriter,r *http.Request) { r.ParseForm() expr,err := parseAndCheck(r.Form.Get("expr")) if err != nil { http.Error(w,"bad expr: "+err.Error(),http.StatusBadRequest) return } w.Header().Set("Content-Type","image/svg+xml") surface(w,func(x,y float64) float64 { r := math.Hypot(x,y) // distance from (0,0) return expr.Eval(eval.Env{"x": x,"y": y,"r": r}) }) } func main() { fmt.Println("http://localhost:8000/plot?expr=sin(-x)*pow(1.5,-r)") fmt.Println("http://localhost:8000/plot?expr=pow(2,sin(y))*pow(2,sin(x))/12") fmt.Println("http://localhost:8000/plot?expr=sin(x*y/10)/10") http.HandleFunc("/plot",plot) log.Fatal(http.ListenAndServe("localhost:8000",nil)) }
重点看 parseAndCheck 函数,组合了解析和检查的步骤。 还有 plot 函数,函数的签名与 http.HandlerFunc 类似。解析并检查 HTTP 请求中的表达式,并用它来创建一个有两个变量的匿名函数。这个匿名函数与原始曲面绘制程序中的 f 有同样的签名,并且能对用户提供的表达式进行求值。上下文定义了x、y和半径r。最后,plot 调用了 surface 函数,这里略做了修改,原本直接使用函数 f,现在把函数 f 作为参数传入。
今天的关于为什么在对表达式求值时将byte和short值提升为int和表达式求值为什么要用栈的分享已经结束,谢谢您的关注,如果想了解更多关于C++表达式求值详解、c/c++ 表达式求值、C/C++表达式求值问题、Go 表达式求值器的相关知识,请在本站进行查询。
本文标签: