2008-01-18
D 语言的子集的 Z 编译器
把 D 语言的语法规则改写成 ANTLR 的语法脚本后,大概有30多K,编译的时候,出了很多的错误,最后内存溢出了。想一想,也是,一来我对 ANTLR 还不熟,二来,Digit Mars 上的 D 语言语法介绍,很多左递归,有几个没有定义的过程,两个拼写错误,一个同名不同义的过程等等。在这种情况下,30多K的语法脚本想要很快的就编译通过,是很困难的。
所以,还是决定用 ANTLR 实现一下 Z 编译器。这一次,把 Z 作为 D 的一个子集,语法定义大部分直接从 D 的语法脚本中复制,一来可以熟悉 ANTLR,二来,完成的语法文件,对于 D 来说也是有用的。
作为 D 的子集,现在 Z 也支持一些 D 的风格的语法,比如三种注释方式:
另外,也支持 D 中的带有“_”的数字格式:
这个版本中增加支持了 bool 类型:
也支持 D 语言中的自动类型推导:
其它的一般都是 C 和 D 公有的,比如十六进制数字、八进制数字:
连等赋值:
++、--、+=、-=、*=、/= (++、--只支持左操作符方式):
也增加了 for、while、do-while 循环:
另外,因为语法文件大部分从 D 复制,所以,运算符优先级也和 C/D 一样了(就是上次说的“&&”的优先级高于“||”之类的问题)。负号现在也遵照这种方式放入表达式中,所以,不只没有上一版中必须加空格的问题,而且支持对变量求负:
虽然可以在定义变量的时候使用逗号,但是普通表达式还不支持逗号方式。另外,Z 还是有一个和 D 比较大的不同,就是 bool 类型和 int 类型之间不允许互相转换,否则会引发编译时错误,而 if for while do-while 的条件表达式也必须最终为 bool 类型才可以:
ANTLR 确实对于语法的细节控制能力更强,而且,生成 AST 的能力也很突出。ANTLRWorks 虽然有时候不工作,有时候和实际代码效果有出入,总体来说还是帮助很大。从 AST 生成代码也比上一版中更方便。不过,在我的实现代码里很多异常都是直接用断言实现的,没有打印行号。另外,因为 ANTLR 有很强的错误恢复能力,目前还不知道怎么判断代码分析中是否出现错误……
下面是可执行程序和源代码:
所以,还是决定用 ANTLR 实现一下 Z 编译器。这一次,把 Z 作为 D 的一个子集,语法定义大部分直接从 D 的语法脚本中复制,一来可以熟悉 ANTLR,二来,完成的语法文件,对于 D 来说也是有用的。
作为 D 的子集,现在 Z 也支持一些 D 的风格的语法,比如三种注释方式:
// 行注释 /* 注释 */ /+ 嵌套注释 +/
另外,也支持 D 中的带有“_”的数字格式:
int a = 123_456_789;
这个版本中增加支持了 bool 类型:
bool b = true; b = 30 > 10;
也支持 D 语言中的自动类型推导:
auto a = 1; auto b = true; if(b) write(a);
其它的一般都是 C 和 D 公有的,比如十六进制数字、八进制数字:
int a = 0x83_af; // 十六进制数字 int b = 067; // 八进制数字
连等赋值:
a = b = c = 2;
++、--、+=、-=、*=、/= (++、--只支持左操作符方式):
int n = 10; int a *= ++n;
也增加了 for、while、do-while 循环:
// 1 到 100 的和
// for 循环
int n = 0;
for(int i=1; i<=100; ++i)
n += i;
write(n);
// while 循环
i = 0; n = 0;
while( i < 100 )
n += ++i;
write(n);
// do-while 循环
i = 0; n = 0;
do
n += ++i;
while( i < 100 )
write(n);
另外,因为语法文件大部分从 D 复制,所以,运算符优先级也和 C/D 一样了(就是上次说的“&&”的优先级高于“||”之类的问题)。负号现在也遵照这种方式放入表达式中,所以,不只没有上一版中必须加空格的问题,而且支持对变量求负:
int a = 10; int b=5-3; // 5 - 3 b=5--3; // 5 - (-3); b=7*-a; // 7 * (-a);
虽然可以在定义变量的时候使用逗号,但是普通表达式还不支持逗号方式。另外,Z 还是有一个和 D 比较大的不同,就是 bool 类型和 int 类型之间不允许互相转换,否则会引发编译时错误,而 if for while do-while 的条件表达式也必须最终为 bool 类型才可以:
int n = 1; bool a = n == 0; a = a && n > 10 || n != 3; bool b = n; // error if(b) write(1); if(n) write(2); // error
ANTLR 确实对于语法的细节控制能力更强,而且,生成 AST 的能力也很突出。ANTLRWorks 虽然有时候不工作,有时候和实际代码效果有出入,总体来说还是帮助很大。从 AST 生成代码也比上一版中更方便。不过,在我的实现代码里很多异常都是直接用断言实现的,没有打印行号。另外,因为 ANTLR 有很强的错误恢复能力,目前还不知道怎么判断代码分析中是否出现错误……
下面是可执行程序和源代码:
评论
梁利锋
2008-05-09
@hqs7636
本来想写带智能提示的D的IDE,不过,现在不需要了。
本来想写带智能提示的D的IDE,不过,现在不需要了。
hqs7636
2008-05-08
具体想干什么阿,不懂,想造一个新语言?
梁利锋
2008-01-18
发现注释部分的语法文件有点问题,现已修正。
发表评论
- 浏览: 13615 次
- 性别:

- 来自: 北京

- 详细资料
搜索本博客
最近加入圈子
链接
最新评论
-
Visual Studio 2008 的缺 ...
看了几个自己写的项目,发现cs文件的代码页都是utf-8带签名的,不知道我看到代 ...
-- by 梁利锋 -
导航、权限管理及 Linq 应 ...
PostSharp 很酷,而且效率比 Reflection 高,值得一试。
-- by 梁利锋 -
导航、权限管理及 Linq 应 ...
哦,原来这样。 DynamicProxy 确实不错,通用性很好。
-- by 梁利锋 -
导航、权限管理及 Linq 应 ...
因为对于一些不考虑客户端的web程序来说,似乎没必要自己调用自己的 WCF we ...
-- by oldrev -
导航、权限管理及 Linq 应 ...
@oldrev 为什么感觉效率很低呢? 就我自己的开发经验,感觉效率低,和真的 ...
-- by 梁利锋






评论排行榜