支持减、乘，以及除

发表于 2019-05-23 Disqus：

在上一篇文章中，初步搭建了一个输入Common Lisp代码，输出汇编代码的编译器的骨架，实现了二元整数的加法运算。在这个基础上，要想实现减法、乘法，以及除法就是手到擒来的事情了。只需依葫芦画瓢，补充更多的分支情况即可。

我自己模仿着x64的调用约定，规定四则运算的结果始终放在EAX这个寄存器中。在稍后给出的代码中，对于减法和除法运算，都是把运算符的左操作数放到EAX寄存器中，再从EAX中减去或者除掉右操作数。

在摸索除法的汇编代码怎么生成时，遇到了个费解的问题，最后才知道，原来需要把EAX寄存器的符号扩展到高位的EDX寄存器中去。对于as这个汇编器来说，需要用到CLTD指令。

最后，jjcc2和stringify两个函数被修改为如下的样子

阅读全文 »

Evernote与Leanote

发表于 2019-05-21 Disqus：

最近开始重新用起了Evernote，当然还有Leanote，不过不算是“重新“而已。这两者各有各的优缺点，下面分别列举一下

Evernote的优缺点以及和Leanote的对比

Evernote可以比较灵活地调整文字的字号，如下图所示

阅读全文 »

开发一个trivial的lisp编译器（一）

发表于 2019-05-17 更新于 2019-12-10 Disqus：

序言

我已经记不清写过多少个lisp-like语言的解释器，以及编译成自制字节码的编译器了，但我想这一次依然不会是最后一个。我还记得之所以入坑写第一个解释器，是因为当时正好学了一点Common Lisp，数据结构的课本中又正好提到一种叫做广义表的数据结构，顿时觉得：“这个广义表不是正好可以表达CL中的atom和cons吗？”于是便尝试写一段程序解析输入、创建广义表，并打印成S表达式。在此基础上，又尝试着实现加减乘除等运算功能，一步步地开启了编写解释器的旅程。后来我看了Peter Norvig写的《Paradigms of AI Programming》，里面有两章分别讲了如何编写解释器和编译器——编译到一个自制虚拟机的字节码的那种。在巨擘的指引下，我也开始写起了trivial的编译器。

这次开工的这一款有所不同：它不再将lisp-like代码编译成架空虚拟机的字节码，而是编译成macOS的x64汇编代码，着实是一个不小的挑战。众所周知，lisp-like的语言（Scheme、Common Lisp、Clojure等）都是一些高级语言，它们摆弄着一些高层次的概念：cons、continua、lambda、symbol，等等。这些语言中的概念无法直接对应到x64汇编上，因此我必须填补它们之间的鸿沟；另一方面，我对x86汇编可以说是一窍不通，完全是一边搜索资料一边写，生成的汇编代码的运行效率多半很低。但，管它呢，只要好玩就足够了。

开始来实现一个lisp-like语言到x64汇编的trivial编译器吧。

编译加法运算

如果你看过龙书，或其它经典的编译原理方面的书，那肯定知道编译器是一个很复杂的玩意儿。但我的编译器很简单，它会从一个小小的二元加法计算器开始演化。为了偷懒不写编译器的前端，我会使用Common Lisp来编写这个编译器的代码，也方便我直接从最让人兴奋的、生成汇编代码的环节入手。

首先从最简单的两个小整数的加法运算开始。在lisp家族的语言，比如Common Lisp中，一段加法运算的代码如下

(+ 1 2)

对于寄存器可以容纳的整数的相加，直接输出add指令即可，两个操作数可以暂时随意地存放到寄存器中。按照这个思路，一个简单的、可以编译小整数加法运算的编译器就出来了

(defun jjcc2 (expr)
  "支持两个数的四则运算的编译器"
  (cond ((eq (first expr) '+)
         `((movl ,(second expr) %eax)
           (movl ,(third expr) %ebx)
           (addl %eax %ebx)))))

(defun stringify (asm)
  "根据jjcc2产生的S表达式生成汇编代码字符串"
  (format t "        .section __TEXT,__text,regular,pure_instructions~%")
  (format t "        .globl _main~%")
  (format t "_main:~%")
  (dolist (ins asm)
    (format t "        ~A ~A, ~A~%"
            (first ins)
            (if (numberp (second ins))
                (format nil "$~A" (second ins))
                (second ins))
            (if (numberp (third ins))
                (format nil "$~A" (third ins))
                (third ins))))
  (format t "        movl %ebx, %edi~%")
  (format t "        movl $0x2000001, %eax~%")
  (format t "        syscall~%"))

在 REPL 中运行如下代码

1	(stringify (jjcc2 '(+ 1 2)))

得到如下的汇编代码

        .section __TEXT,__text,regular,pure_instructions
        .globl _main
_main:
        MOVL $1, %EAX
        MOVL $2, %EBX
        ADDL %EAX, %EBX
        movl %ebx, %edi
        movl $0x2000001, %eax
        syscall

将这段代码保存到名为jjcc.s的文件中再运行下列的命令，就得到一个能运行的a.out可执行文件了

as -o jjcc.o jjcc.s
gcc jjcc.o
./a.out
echo $? # 输出3

后记

有了这个基本的框架后，便可以开始扩展出很多功能了。比如除了加法，还可以支持减法、乘法，以及除法；可以支持progn，实现顺序求值多个表达式的效果；可以支持setq，实现变量和赋值的功能，等等。

此外，这一小段代码也有不少问题。比如调用format输出.section的代码来自于gcc -S的结果，可以用更简短的.text代替；生成的汇编代码中，指令助记符和寄存器名字的大小写不统一，等等。之后我会尝试重构，将代码写得更好。

Boostnote及对记笔记的思考

发表于 2019-05-07 更新于 2019-05-14 Disqus：

这篇文章就是在Boostnote 中写成的XD

来龙去脉

有一阵子，我沉迷于“笔记软件狩猎”中——就是不停寻找各种各样的笔记软件，再一个个试用，企图从中选出一个最强大的。回想起来，我尝试过有道云笔记、印象笔记、Quiver、Boostnote、OneNote、Yu Writer、Leanote（在本地搭建），等等。大部分都是浅尝辄止，例如OneNote，当我发现它不支持代码块语法高亮时，就放弃了它。目前仍然在使用的是Boostnote，并且也是最令我满意的。

阅读全文 »

更过程式的let——vertical-let

发表于 2019-03-13 Disqus：

作为一名自诩的non-trivial的Common Lisp程序员，在编码的时候经常会遇到令人不愉快的地方，其中一个便是LET。

一段典型的LET的示例代码如下

1 2	(let ((a 1)) a)

大多数时候，LET不会只有一个绑定。并且，也不会只是绑定一个常量这么简单，而应当是下面这样的

(let ((a (foo x y))
      (b (bar z)))
  (function1 a b)
  (function2 a b))

有时候我会想看看某一个绑定的值——最好是在它计算完毕后立即查看。如果要查看foo函数的返回值，可以这样写

(let ((a (foo x y))
      (b (bar z)))
  (print a)
  (function1 a b)
  (function2 a b))

如果调用foo和bar都顺利的话上面的代码也就够了。比较棘手的情况是，如果a的值不符合预期，会导致b的计算过程出状况（尽管在上面的代码中看似不会）。这种情况多出现在LET*的使用中，如下面所示

(let* ((a (foo x y))
       (b (bar a)))
  (function1 a b)
  (function2 a b))

如果错误的a会导致bar的调用出错，那么在调用function1之前才调用print打印a已经为时过晚了——毕竟调用bar的时候就抛出condition往调用链的上游走了。一种方法是写成下面这样子

(let* ((a (let ((tmp (foo x y)))
            (print tmp)
            tmp))
       (b (bar a)))
  (function1 a b)
  (function2 a b))

这也太丑了！要不然写成下面这样子？

(let ((a (foo x y)))
  (print a)
  (let ((b (bar a)))
    (function1 a b)
    (function2 a b)))

本来一个LET就可以做到的事情，这下子用了两个，还导致缩进更深了一级。如果有十个变量需要打印，就会增加十个LET和十层缩进。如果心血来潮想查看一个变量的值，还要大幅调整代码。

问题大概就出在LET和LET*的语法上。以LET为例，它由截然分开的bindings和forms组成，两者不能互相穿插。因此，如果想在bindings中求值一段表达式，只能将bindings切开，写成两个LET的形式。好像写一个新的宏可以解决这个问题？是的，vertical-let就是。

vertical-let是一个我自己写的宏，源代码在此。其用法如下

1
2
3

(vertical-let
  :with a = 1
  a)

它借鉴了LOOP中绑定变量的方式（即:with和=），绑定变量和用于求值的代码还可以交织在一起，如下

(vertical-let
  :with a = 1
  (print a)
  :with b = 2
  (+ a b))

vertical-let最终会展开为LET，比如上面的代码，会展开为如下的代码

(LET ((A 1))
  (PRINT A)
  (LET ((B 2))
    (+ A B)))

vertical-let的算法很简单。它遍历表达式列表，当遇到:with时就把接下来的三个元素分别视为变量名、等号，以及待求值的表达式，将三者打包进一个列表中，再压栈；当遇到其它值时，就视为待求值的表达式（将会组成LET的forms部分），也放进列表中再压栈（具体方法参见源代码）。

将所有值都遍历并压栈后，接下来要遍历这个栈中的元素。先准备两个空的栈——一个存放bindings，一个存放forms。接着，对于每一个从栈中弹出的元素，分为如下两种情况：

如果表示binding，则直接压入存放bindings的栈，否则；
如果是待求值的表达式，并且上一个出栈的元素是binding，则说明已经有一段完整的LET的内容被集齐。因此，将目前在两个栈中的内容全部弹出，组合为一个LET表达式再压入存放forms的栈中。然后将方才弹出的表达式也压入forms。重复上述过程直至所有元素都被处理，最后将还在两个栈中的内容也组合为一个LET表达式便结束了。

全文完