小打小闹写点bug

在CommonLisp中支持JSON语法

2023-05-23T15:47:22.000Z

在 Lisp 中使用 reader macro 支持 JSON 语法

什么是 reader macro？

Reader macro 是 Common Lisp 提供的众多有趣特性之一，它让语言的使用者能够自定义词法分析的逻辑，使其在读取源代码时，如果遇到了特定的一两个字符，可以调用相应的函数来个性化处理。此处所说的“特定的一两个字符”，被称为 macro character，而“相应的函数”则被称为 reader macro function。举个例子，单引号'就是一个 macro character，可以用函数get-macro-character来获取它对应的 reader macro function。

1
2
3

CL-USER> (get-macro-character #\')
#
NIL

借助单引号，可以简化一些代码的写法，例如表达一个符号HELLO本身可以写成这样。

1 2	CL-USER> 'hello HELLO

而不是下面这种等价但更繁琐的形式。

1 2	CL-USER> (quote hello) HELLO

Common Lisp 中还定义了由两个字符构成的 reader macro，例如用于书写simple-vector字面量的#(。借助它，如果想要表达一个依次由数字 1、2、3 构成的simple-vector类型的对象，不需要显式地调用函数vector并传给它 1、2、3，而是可以写成#(1 2 3)。

支持 JSON 语法后有什么效果？

合法的 JSON 文本不一定是合法的 Common Lisp 源代码。例如，[1, 2, 3]在 JSON 标准看来是一个由数字 1、2、3 组成的数组，但在 Common Lisp 中，这段代码会触发 condition。（condition 就是 Common Lisp 中的“异常”、“出状况”了）

CL-USER> (let ((eof-value (gensym)))
  (with-input-from-string (stream "[1, 2, 3]")
    (block nil
      (loop
        (let ((expr (read stream nil eof-value)))
          (when (eq expr eof-value)
            (return))

          (print expr))))))

[1 ; Evaluation aborted on #.

这是因为按照 Common Lisp 的读取算法，左方括号[和数字 1 都是标准中所指的 constituent character，它们可以组成一个 token，并且最终被解析为一个符号类型的对象。而紧接着的字符是逗号,，它是一个 terminating macro char，按照标准，如果不是在一个反引号表达式中使用它将会是无效的，因此触发了 condition。

假如存在一个由两个字符#J定义的 reader macro、允许开发者使用 JSON 语法来描述紧接着的对象的话，那么就可以写出下面这样的代码。

CL-USER> (progn
           (print #jfalse)
           (print #jtrue)
           (print #j233.666)
           (print #jnull)
           (print #j[1, 2, [3], [4, 5]])
           (print #j{"a": [1, 2, 3]})
           (print (gethash "a" #j{"a": [1, 2, 3]})))

YASON:FALSE 
YASON:TRUE 
233.666d0 
:NULL 
#(1 2 #(3) #(4 5)) 
# 
#(1 2 3) 
#(1 2 3)

显然，用上述语法表示一个哈希表，要比下面这样的代码简单得多

CL-USER> (let ((obj (make-hash-table :test #'equal)))
           (setf (gethash "a" obj) #(1 2 3))
           obj)

#

如何用 reader macro 解析 JSON？

Common Lisp 并没有预置#J这个 reader macro，但这门语言允许使用者定义自己的 macro character，因此前面的示例代码是可以实现的。要自定义出#J这个读取器宏，需要使用函数set-dispatch-macro-character。它的前两个参数分别为构成 macro character 的前两个字符，即#和J——其中J即便是写成了小写，也会被转换为大写后再使用。第三个参数则是 Lisp 的词法解析器在遇到了#J时将会调用的参数。set-dispatch-macro-character会传给这个函数三个参数：

用于读取源代码的字符输入流；
构成 macro character 的第二个字符（即J）；
非必传的、夹在#和J之间的数字。

百闻不如一见，一段能够实现上一个章节中的示例代码的set-dispatch-macro-character用法如下

(set-dispatch-macro-character
 #\#
 #\j
 (lambda (stream char p)
   (declare (ignorable char p))
   (let ((parsed (yason:parse stream
                              :json-arrays-as-vectors t
                              :json-booleans-as-symbols t
                              :json-nulls-as-keyword t)))
     (if (or (symbolp parsed)
             (consp parsed))
         (list 'quote parsed)
         parsed))))

在set-dispatch-macro-character的回调函数中，我是用了开源的第三方库yason提供的函数parse，从输入流stream中按照 JSON 语法解析出一个值。函数parse的三个关键字参数的含义参见这里，此处不再赘述。由于 reader macro 的结果会被用于构造源代码的表达式，因此如果函数parse返回了符号或者cons类型，为了避免被编译器求值，需要将它们“引用”起来，因此将它们放到第一元素为quote的列表中。其它情况下，直接返回parse的返回值即可，因此它们是“自求值”的，求值结果是它们自身。

尾声

本文我借助了现成的库yason来解析 JSON 格式的字符串，如果你对如何从零开始实现这样的 reader macro 感兴趣的话，可以参考这篇文章。

全文完。

使用 call/cc 实现计数循环

2023-05-07T08:52:26.000Z

使用 call/cc 实现计数循环

什么是计数循环

计数循环就是从一个数字$i$开始一直遍历到另一个数字$j$为止的循环过程。例如，下面的 Python 代码就会遍历从 0 到 9 这 10 个整数并逐个打印它们

1 2	for i in range(10): print(i)

如果是在 C 语言中实现同样的功能，代码会更显著一些

#include 

int main(int argc, char *argv[])
{
  for (int i = 0; i < 10; i++) {
    printf("%d\n", i);
  }

  return 0;
}

在 C 语言的例子中，显式地指定了计数器变量i从 0 开始并且在等于 10 的时候结束循环，比之 Python 版本更有循环的味道。

拆开循环计数的语法糖

使用 C 语言的while语句同样可以实现计数循环，示例代码如下

#include 

int main(int argc, char *argv[])
{
  int i = 0;
  while (i < 10) {
    printf("%d\n", i);
    i++;
  }

  return 0;
}

如果将while也视为if和goto的语法糖的话，可以进一步将计数循环写成更原始的形式

#include 

int main(int argc, char *argv[])
{
  int i = 0;
label0:
  if (i >= 10) {
    goto label1;
  }
  printf("%d\n", i);
  i++;
  goto label0;
label1:

  return 0;
}

Common Lisp 中的 go 与续延

在 Common Lisp 中也有与 C 语言的goto特性相近的 special form，那就是tagbody和go。使用它们可以将 C 代码直白地翻译为对应的 Common Lisp 版本

(let ((i 0))
  (tagbody
   label0
     (when (>= i 10)
       (go label1))

     (format t "~D~%" i)
     (incf i)
     (go label0)
   label1))

聪明的你一定已经发现了，此处的第二个符号label1其实是丝毫不必要的，只要写成下面的形式即可

(let ((i 0))
  (tagbody
   label0
     (when (< i 10)
       (format t "~D~%" i)
       (incf i)
       (go label0))))

这个形式不仅仅是更简单了，而且它暴露出了一个事实：label0所表示的，其实就是在将变量i绑定为 0之后要执行的代码的位置。换句话说，它标识了一个续延（continuation）。

用 call/cc 重新实现计数循环

如果你用的语言中支持 first-class 的续延，那么便可以用来实现计数循环，例如233-lisp。在 233-lisp 中，提供了特殊操作符call/cc来捕捉当前续延对象，这个名字借鉴自 Scheme。借助这个操作符，即便没有tagbody和go，也可以实现计数循环。

在上面的代码中，call/cc捕捉到的续延就是“赋值给局部变量i”。在将这个续延k保存到变量next之后，用 0 初始化变量i。之后只要i还小于 10，就将它打印到标准输出，并启动保存在了变量next中的续延，回到给变量i赋值的地方。此时传递给续延的参数为(+ i 1)，就实现了变量i的自增操作。当(< i 10)不再成立时，也就不会启动续延“回到过去”了，至此，进程结束。

在 233-lisp 中，将dotimes作为一个内置的宏用call/cc实现了一遍，参见这里，其代码如下

(defun expand-dotimes-to-call/cc (expr)
  "将 DOTIMES 语句 EXPR 编译为等价的 CALL/CC 语句。"
  (assert (eq (first expr) 'dotimes))
  (destructuring-bind ((var count-form) &rest statements)
      (rest expr)
    (let ((a (gensym))
          (count-form-result (gensym))
          (next (gensym)))
      `(let ((,count-form-result ,count-form)) ; 由于目前 LET 只支持一个绑定，因此这里要写多个 LET。
         (let ((,next 0))               ; 由于 233-lisp 中尚未支持 NIL，因此这里填个 0。
           (let ((,var (call/cc (k)
                                (progn
                                  (setf ,next k)
                                  0))))     ; 计数循环从 0 开始。
             (if (< ,var ,count-form-result)
                 (progn
                   ,@statements
                   (,next (+ ,var 1)))
                 0)))))))                  ; 由于目前没有 NIL，因此返回一个数字 0 来代替。

变量count-form-result和next分别表示在宏展开后的代码中的计数上限和被捕捉的续延。之所以让它们以(gensym)的方式来命名，是为了避免多次求值count-form表达式，以及避免存储续延的变量名恰好出乎意料地与statements中的变量名冲突了，这也算是编写 Common Lisp 的宏时的最佳实践了。

后记

直接用call/cc来一个个实现 Common Lisp 中的各种控制流还是太繁琐了，更好的方案是用call/cc先实现tagbody和go，然后再用后两者继续实现do，最后用do分别实现dolist和dotimes。当然了，这些都是后话了。

如何在CommonLisp中解析命令行参数

2022-08-21T07:27:55.000Z

clingon

clingon 是一个 Common Lisp 的命令行选项的解析器，它可以轻松地解析具有复杂格式的命令行选项。例如，下面的代码可以打印给定次数的打招呼信息

#!/bin/sh
#|-*- mode:lisp -*-|#
#|
exec ros -Q -- $0 "$@"
|#
(progn ;;init forms
  (ros:ensure-asdf)
  #+quicklisp(ql:quickload '(clingon) :silent t)
  )

(defpackage :ros.script.hello.3868869124
  (:use :cl
        :clingon))
(in-package :ros.script.hello.3868869124)

(defun top-level/handler (cmd)
  (check-type cmd clingon:command)
  (let ((count (clingon:getopt cmd :count))
        (name (first (clingon:command-arguments cmd))))
    (dotimes (_ count)
      (declare (ignorable _))
      (format t "Hello ~A!~%" name))))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "hello"
              :options (list
                        (clingon:make-option
                         :integer
                         :description "number of greetings"
                         :initial-value 1
                         :key :count
                         :long-name "count")))))
    (clingon:run app argv)))
;;; vim: set ft=lisp lisp:

稍微做一些解释。首先执行命令ros init hello生成上面的代码的雏形——加载依赖、包定义，以及空的函数main。为了加载 clingon，将其作为函数ql:quickload的参数。然后分别定义一个command、handler，以及option。

在 clingon 中，类clingon:command的实例对象表示一个可以在 shell 中被触发的命令，它们由函数clingon:make-command创建。每一个命令起码要有三个要素：

:handler，负责使用命令行选项、实现业务逻辑的函数；
:name，命令的名字，一般会被展示在命令的用法说明中；
:options，该命令所接受的选项。

此处的:handler就是函数top-level/handler，它会被函数clingon:run调用（依赖注入的味道），并将一个合适的clingon:command对象传入。:options目前只承载了一个选项的定义，即

(clingon:make-option
 :integer
 :description "number of greetings"
 :initial-value 1
 :key :count
 :long-name "count")

它定义了一个值为整数的选项，在命令行中通过--count指定。如果没有传入该选项，那么在使用函数clingon:getopt取值时，会获得默认值 1。如果要从一个命令对象中取出这个选项的值，需要以它的:key参数的值作为参数来调用函数clingon:getopt，正如上面的函数top-level/handler所示。

子命令

clingon 也可以实现诸如git add、git branch这样的子命令特性。像add、branch这样的子命令，对于 clingon 而言仍然是类clingon:command的实例对象，只不过它们不会传递给函数clingon:run调度，而是传递给函数clingon:make-command的参数:sub-command，如下列代码所示

(defun top-level/handler (cmd)
  (declare (ignorable cmd)))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "cli"
              :sub-commands (list
                             (clingon:make-command
                              :handler #'(lambda (cmd)
                                           (declare (ignorable cmd))
                                           (format t "Dropped the database~%"))
                              :name "dropdb")
                             (clingon:make-command
                              :handler #'(lambda (cmd)
                                           (declare (ignorable cmd))
                                           (format t "Initialized the database~%"))
                              :name "initdb")))))
    (clingon:run app argv)))

选项与参数

在 clingon 中通过命令行传递给进程的信息分为选项和参数两种形态，选项是通过名字来引用，而参数则通过它们的下标来引用。例如在第一个例子中，就定义了一个名为--count的选项，它在解析结果中被赋予了:count这个关键字，可以通过函数clingon:getopt来引用它的值；与之相反，变量name是从命令行中解析了选项后、剩余的参数中的第一个，它是以位置来标识的。clingon 通过函数clingon:make-option来定义选项，它提供了丰富的控制能力。

选项名称

选项有好几种名字，一种叫做:key，是在程序内部使用的名字，用作函数clingon:getopt的参数之一；一种叫做:long-name，一般为多于一个字符的字符串，如"count"，在命令行该名称需要带上两个连字符的前缀来使用，如--count 3；最后一种叫做:short-name，为一个单独的字符，如#\v，在命令行中带上一个连字符前缀来使用，如-v。

必要性与默认值

通过传入参数:required t给函数clingon:make-option，可以要求一个选项为必传的。例如下面的命令的选项--n就是必传的

(defun top-level/handler (cmd)
  (dotimes (i (clingon:getopt cmd :n))
    (declare (ignorable i))
    (format t ".")))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "dots"
              :options (list
                        (clingon:make-option
                         :integer
                         :description "打印的英文句号的数量"
                         :key :n
                         :long-name "n"
                         :required t)))))
    (clingon:run app argv)))

如果不希望在一些最简单的情况下也要繁琐地编写--n 1这样的命令行参数，可以用:initial-value 1来指定。除此之外，也可以让选项默认读取指定的环境变量中的值，使用:env-vars指定环境变量名即可

(defun top-level/handler (cmd)
  (format t "Hello ~A~%" (clingon:getopt cmd :username)))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "greet"
              :options (list
                        (clingon:make-option
                         :string
                         :description "用户名"
                         :env-vars '("GREETER_USERNAME")
                         :key :username
                         :long-name "username")))))
    (clingon:run app argv)))

可多次使用的选项

像curl中的选项-H就是可以多次使用的，每指定一次就可以在请求中添加一个 HTTP 头部，如下图所示

在 clingon 中可以通过往函数clingon:make-option传入:list来实现。当用clingon:getopt取出类型为:list的选项的值时，得到的是一个列表，其中依次存放着输入的值的字符串。

(defun top-level/handler (cmd)
  (let ((messages (clingon:getopt cmd :message)))
    (format t "~{~A~^~%~}" messages)))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "commit"
              :options (list
                        (clingon:make-option
                         :list
                         :description "提交的消息"
                         :key :message
                         :long-name "message"
                         :short-name #\m)))))
    (clingon:run app argv)))

另一种情况是尽管没有值，但仍然多次使用同一个选项。例如命令ssh的选项-v，使用的次数越多（最多为 3 次），则ssh打印的调试信息也就越详细。这种类型的选项在 clingon 中称为:counter。

(defun top-level/handler (cmd)
  (format t "Verbosity: ~D~%" (clingon:getopt cmd :verbose)))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "log"
              :options (list
                        (clingon:make-option
                         :counter
                         :description "啰嗦程度"
                         :key :verbose
                         :long-name "verbose"
                         :short-name #\v)))))
    (clingon:run app argv)))

信号选项

有一些选项只需要区分【有】和【没有】两种情况就可以了，而不需要在意这个选项的值——或者这类选项本身就不允许有值，例如docker run命令的选项-d和--detach。这种选项的类型为:boolean/true，如果指定了这个选项，那么取出来的值始终为t。与之相反，类型:boolean/false取出来的值始终为nil。

(defun top-level/handler (cmd)
  (let ((rv (software-type)))
    (when (clingon:getopt cmd :shout)
      (setf rv (concatenate 'string (string-upcase rv) "!!!!111")))

    (format t "~A~%" rv)))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "info"
              :options (list
                        (clingon:make-option
                         :boolean/true
                         :description "大喊"
                         :key :shout
                         :long-name "shout")))))
    (clingon:run app argv)))

选择型选项

如果一个选项尽管接受的是字符串，但并非所有输入都是有意义的，例如命令dot的选项-T。从dot的 man 文档可以看到，它所支持的图片类型是有限的，如ps、pdf、png等。比起声明一个:string类型的选项，让 clingon 代劳输入值的有效性检查来得更轻松，这里可以使用:choice类型

(defun top-level/handler (cmd)
  (format t "~A~%" (clingon:getopt cmd :hash-type)))

(defun main (&rest argv)
  (let ((app (clingon:make-command
              :handler #'top-level/handler
              :name "digest"
              :options (list
                        (clingon:make-option
                         :choice
                         :description "哈希类型"
                         :items '("MD5" "SHA1")
                         :key :hash-type
                         :long-name "hash-type")))))
    (clingon:run app argv)))

自己动手打印整数

2022-05-02T03:14:03.000Z

在 Common Lisp 中，打印整数一般用函数format。例如，上面的代码会往标准输出中打印出233这个数字：

1	(format t "~D" 233)

除此之外，format还可以控制打印内容的宽度、填充字符、是否打印正负号等方面。例如，要控制打印的内容至少占据6列的话，可以用如下代码

1	(format t "~6D" 233)

如果不使用字符串形式的 DSL，而是以关键字参数的方式来实现一个能够达到同样效果的函数format-decimal，代码可能如下：

(defun format-decimal (n
                       &key
                         mincol)
  "打印整数 N 到标准输出。

MINCOL 如果不为 NIL，则表示所打印的内容至少要占据的列数。"
  ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
  (let ((digits '()))
    (cond ((zerop n)
           (push 0 digits))
          (t
           (do ((n n (truncate n 10)))
               ((zerop n))
             (push (rem n 10) digits))))
    ;; 打印出填充用的空格。
    (when (and (integerp mincol) (> mincol (length digits)))
      (dotimes (i (- mincol (length digits)))
        (declare (ignorable i))
        (princ #\Space)))

    (dolist (digit digits)
      (princ (code-char (+ digit (char-code #\0)))))))

(format-decimal 233 :mincol 6)

如果要求用数字0而不是空格来填充左侧的列，用format的写法如下：

1	(format t "~6,'0D" 233)

format-decimal想要做到同样的事情，可以这么写：

(defun format-decimal (n
                       &key
                         mincol
                         (padchar #\Space))
  "打印整数 N 到标准输出。

MINCOL 如果不为 NIL，则表示所打印的内容至少要占据的列数。
PADCHAR 表达式为了填充多余的列时所用的字符。"
  (check-type mincol (or integer null))
  (check-type padchar character)
  ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
  (let ((digits '()))
    (cond ((zerop n)
           (push 0 digits))
          (t
           (do ((n n (truncate n 10)))
               ((zerop n))
             (push (rem n 10) digits))))
    ;; 打印出填充用的空格。
    (when (and (integerp mincol) (> mincol (length digits)))
      (dotimes (i (- mincol (length digits)))
        (declare (ignorable i))
        (princ padchar)))

    (dolist (digit digits)
      (princ (code-char (+ digit (char-code #\0)))))))

(format-decimal 233 :mincol 6 :padchar #\0)

-D默认是不会打印非负整数的符号的，可以用修饰符@来修改这个行为。例如，(format t "~6,'0@D" 233)会打印出00+233。稍微修改一下就可以在format-decimal中实现同样的功能

(defun format-decimal (n
                       &key
                         mincol
                         (padchar #\Space)
                         signed)
  "打印整数 N 到标准输出。

MINCOL 如果不为 NIL，则表示所打印的内容至少要占据的列数。
PADCHAR 表达式为了填充多余的列时所用的字符。"
  (check-type mincol (or integer null))
  (check-type padchar character)
  (flet ((to-digits (n)
           ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
           (let ((digits '()))
             (cond ((zerop n)
                    (push #\0 digits))
                   (t
                    (do ((n n (truncate n 10)))
                        ((zerop n))
                      (push (code-char (+ (rem n 10) (char-code #\0))) digits))))
             digits)))
    ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
    (let ((digits (to-digits (abs n))))
      (when (or signed (< n 0))
        (push (if (< n 0) #\- #\+) digits))
      ;; 打印出填充用的空格。
      (when (and (integerp mincol) (> mincol (length digits)))
        (dotimes (i (- mincol (length digits)))
          (declare (ignorable i))
          (princ padchar)))

      (dolist (digit digits)
        (princ digit)))))

(format-decimal 233 :mincol 6 :padchar #\0 :signed t)

除了@之外，:也是一个~D的修饰符，它可以让format每隔3个数字就打印出一个逗号，方便阅读比较长的数字。例如，下列代码会打印出00+23,333：

1	(format t "~9,'0@:D" 23333)

为此，给format-decimal新增一个关键字参数comma-separated来控制这一行为。

(defun format-decimal (n
                       &key
                         comma-separated
                         mincol
                         (padchar #\Space)
                         signed)
  "打印整数 N 到标准输出。

COMMA-SEPARATED 如果为 T，则每打印3个字符就打印一个逗号。
MINCOL 如果不为 NIL，则表示所打印的内容至少要占据的列数。
PADCHAR 表示填充多余的列时所用的字符。
SIGNED 控制是否显示非负整数的加号。"
  (check-type comma-separated boolean)
  (check-type mincol (or integer null))
  (check-type padchar character)
  (check-type signed boolean)
  (flet ((to-digits (n)
           ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
           (let ((digits '()))
             (cond ((zerop n)
                    (push #\0 digits))
                   (t
                    (do ((count 0 (1+ count))
                         (n n (truncate n 10)))
                        ((zerop n))
                      (when (and comma-separated (> count 0) (zerop (rem count 3)))
                        (push #\, digits))
                      (push (code-char (+ (rem n 10) (char-code #\0))) digits))))
             digits)))
    ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
    (let ((digits (to-digits (abs n))))
      (when (or signed (< n 0))
        (push (if (< n 0) #\- #\+) digits))
      ;; 打印出填充用的空格。
      (when (and (integerp mincol) (> mincol (length digits)))
        (dotimes (i (- mincol (length digits)))
          (declare (ignorable i))
          (princ padchar)))

      (dolist (digit digits)
        (princ digit)))))

(format-decimal -23333 :comma-separated t :mincol 9 :padchar #\0 :signed t)

事实上，打印分隔符的步长，以及作为分隔符的逗号都是可以定制的。例如，可以改为每隔4个数字打印一个连字符

1	(format t "~9,'0,'-,4@:D" 23333)

对于format-decimal来说这个修改现在很简单了

(defun format-decimal (n
                       &key
                         (commachar #\,)
                         (comma-interval 3)
                         comma-separated
                         mincol
                         (padchar #\Space)
                         signed)
  "打印整数 N 到标准输出。

COMMACHAR 表示当需要打印分隔符时的分隔符。
COMMA-INTERVAL 表示当需要打印分隔符时需要间隔的步长。
COMMA-SEPARATED 如果为 T，则每打印3个字符就打印一个逗号。
MINCOL 如果不为 NIL，则表示所打印的内容至少要占据的列数。
PADCHAR 表示填充多余的列时所用的字符。
SIGNED 控制是否显示非负整数的加号。"
  (check-type commachar character)
  (check-type comma-interval integer)
  (check-type comma-separated boolean)
  (check-type mincol (or integer null))
  (check-type padchar character)
  (check-type signed boolean)
  (flet ((to-digits (n)
           ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
           (let ((digits '()))
             (cond ((zerop n)
                    (push #\0 digits))
                   (t
                    (do ((count 0 (1+ count))
                         (n n (truncate n 10)))
                        ((zerop n))
                      (when (and comma-separated (> count 0) (zerop (rem count comma-interval)))
                        (push commachar digits))
                      (push (code-char (+ (rem n 10) (char-code #\0))) digits))))
             digits)))
    ;; 通过取余的方式得到 N 的每一位并逐个入栈，之后出栈的顺序就是从左到右打印的顺序了。
    (let ((digits (to-digits (abs n))))
      (when (or signed (< n 0))
        (push (if (< n 0) #\- #\+) digits))
      ;; 打印出填充用的空格。
      (when (and (integerp mincol) (> mincol (length digits)))
        (dotimes (i (- mincol (length digits)))
          (declare (ignorable i))
          (princ padchar)))

      (dolist (digit digits)
        (princ digit)))))


(format-decimal -23333 :commachar #\- :comma-interval 4 :comma-separated t :mincol 9 :padchar #\0 :signed t)

全文完。

为什么管Java叫单派发以及什么是多派发

2021-10-15T15:43:05.000Z

众所周知，在 Java 语言中支持基于子类型的多态，例如某百科全书中就给了一个基于Animal及其两个子类的例子（代码经过我微微调整）

abstract class Animal {
  abstract String talk();
}

class Cat extends Animal {
  String talk() {
    return "Meow!";
  }
}

class Dog extends Animal {
  String talk() {
    return "Woof!";
  }
}

public class Example {
  static void letsHear(final Animal a) {
    System.out.println(a.talk());
  }

  public static void main(String[] args) {
    letsHear(new Cat());
    letsHear(new Dog());
  }
}

基于子类型的多态要求在程序的运行期根据参数的类型，选择不同的具体方法——例如在上述例子中，当方法letsHear中调用了参数a的方法talk时，是依照变量a在运行期的类型（第一次为Cat，第二次为Dog）来选择对应的talk方法的实例的，而不是依照编译期的类型Animal。

但在不同的语言中，在运行期查找方法时，所选择的参数的个数是不同的。对于 Java 而言，它只取方法的第一个参数（即接收者），这个策略被称为 single dispatch。

Java 的 single dispatch

要演示为什么 Java 是 single dispatch 的，必须让示例代码中的方法接收两个参数（除了方法的接收者之外再来一个参数）

// 演示 Java 是 single dispatch 的。
abstract class Shape {}

class Circle extends Shape {}

class Rectangle extends Shape {}

class Triangle extends Shape {}

abstract class AbstractResizer 
{
public abstract void resize(Circle c);
public abstract void resize(Rectangle r);
public abstract void resize(Shape s);
public abstract void resize(Triangle t);
}

class Resizer extends AbstractResizer
{
public void resize(Circle c) { System.out.println("缩放圆形"); }
public void resize(Rectangle r) { System.out.println("缩放矩形"); }
public void resize(Shape s) { System.out.println("缩放任意图形"); }
    public void resize(Triangle t) { System.out.println("缩放三角形"); }
}

public class Trial1
{
public static void main(String[] args)
{
AbstractResizer resizer = new Resizer();
Shape[] shapes = {new Circle(), new Rectangle(), new Triangle()};
for (Shape shape : shapes)
{
resizer.resize(shape);
}
}
}

显然，类Resizer的实例方法resize就是接收两个参数的——第一个为Resizer类的实例对象，第二个则可能是Shape及其三个子类中的一种类的实例对象。假如 Java 的多态策略是 multiple dispatch 的，那么应当分别调用不同的三个版本的resize方法，但实际上并不是

通过 JDK 中提供的程序javap可以看到在main方法中调用resize方法时究竟用的是类Resizer中的哪一个版本，运行命令javap -c -l -s -v Trial1，可以看到调用resize方法对应的 JVM 字节码为invokevirtual

翻阅 JVM 规格文档可以找到对invokevirtual 指令的解释

显然，由于在 JVM 的字节码中，invokevirtual所调用的方法的参数类型已经解析完毕——LShape表示是一个叫做Shape的类，因此在方法接收者，即类Resizer中查找的时候，也只会命中resize(Shape s)这个版本的方法。变量s的运行期类型在查找方法的时候，丝毫没有派上用场，因此 Java 的多态是 single dispatch 的。

想要依据参数的运行期类型来打印不同内容也不难，简单粗暴的办法可以选择instanceOf

abstract class AbstractResizer 
{
public abstract void resize(Shape s);
}

class Resizer extends AbstractResizer
{
public void resize(Shape s) { 
    if (s instanceof Circle) {
      System.out.println("缩放圆形");
    } else if (s instanceof Rectangle) {
      System.out.println("缩放矩形");
    } else if (s instanceof Triangle) {
      System.out.println("缩放三角形");
    } else {
      System.out.println("缩放任意图形");
    }
  }
}

或者动用 Visitor 模式。

什么是 multiple dispatch？

我第一次知道 multiple dispatch 这个词语，其实就是在偶然间查找 CLOS 的相关资料时看到的。在 Common Lisp 中，定义类和方法的语法与常见的语言画风不太一样。例如，下列代码跟 Java 一样定义了四个类

(defclass shape ()
  ())

(defclass circle (shape)
  ())

(defclass rectangle (shape)
  ())

(defclass triangle (shape)
  ())

(defclass abstract-resizer ()
  ())

(defclass resizer (abstract-resizer)
  ())

(defgeneric resize (resizer shape))

(defmethod resize ((resizer resizer) (shape circle))
  (format t "缩放圆形~%"))

(defmethod resize ((resizer resizer) (shape rectangle))
  (format t "缩放矩形~%"))

(defmethod resize ((resizer resizer) (shape shape))
  (format t "缩放任意图形~%"))

(defmethod resize ((resizer resizer) (shape triangle))
  (format t "缩放三角形~%"))

(let ((resizer (make-instance 'resizer))
      (shapes (list
               (make-instance 'circle)
               (make-instance 'rectangle)
               (make-instance 'triangle))))
  (dolist (shape shapes)
    (resize resizer shape)))

执行上述代码会调用不同版本的resize方法来打印内容

由于defmethod支持给每一个参数都声明对应的类这一做法是在太符合直觉了，以至于我丝毫没有意识到它有一个专门的名字叫做 multiple dispatch，并且在大多数语言中是不支持的。

后记

聪明的你应该已经发现了，在上面的 Common Lisp 代码中，其实与 Java 中的抽象类AbstractResizer对应的类abstract-resizer是完全没有必要的，defgeneric本身就是一种用来定义抽象接口的手段。

此外，在第三个版本的resize方法中，可以看到标识符shape同时作为了参数的名字和该参数所属的类的名字——没错，在 Common Lisp 中，一个符号不仅仅可以同时代表一个变量和一个函数，同时还可以兼任一个类型，它不仅仅是一门通常所说的 Lisp-2 的语言。

直观地了解自己每天在吃上面的开销

2021-10-06T14:45:06.000Z

~~众所周知，~~我用Emacs的ledger-mode来记账（参见以前的文章《程序员的记账工具——ledger与ledger-mode》）。作为一个出色的命令行报表工具，ledger的命令balance和register足以涵盖大部分的使用场景：

balance可以生成所有帐号的余额的报表，用于每天与各个账户中的真实余额进行比较；
register可以生成给定帐号的交易明细，用于在余额不一致时与真实账户的流水一条条核对；

美中不足的是，ledger的报表不够直观，因为它们是冷冰冰的文字信息，而不是振奋人心的统计图形。好在，正如ledger不存储数据，而只是一份份.ledger文件中的交易记录的搬运工一样，gnuplot也是这样的工具——它不存储数据，它只负责将存储在文本文件的数据以图形的形态呈现出来。

如何运用`gnuplot`

gnuplot是很容易使用的。以最简单的情况为例，首先将如下内容保存到文件/tmp/data.csv中

1
2
3

-1 -1
0 0
1 1

然后在命令行中启动gnuplot，进入它的 REPL 中，并执行如下命令

1	plot "/tmp/data.csv"

即可得到这三组数据的展示

三组数据分别是坐标为(-1, -1)、(0, 0)，以及(1, 1)的点。

因此要让gnuplot绘制开销的图形，首先就是从账本中提取出要绘制的数据，再决定如何用gnuplot绘制即可。

用`ledger`提取开销记录

尽管ledger的子命令register可以打印出给定帐号的交易明细，但此处更适合使用csv子命令。例如，下列的命令可以将最早的10条、吃的方面的支出记录，都以 CSV 格式打印出来

➜  Accounting ledger --anon --head 10 -f 2021.ledger csv 'Expense:Food'
"2019/09/10","","32034acc","efe2a5b9:c720f278:58a3cd91:0dc07b7b","A","20","",""
"2019/09/11","","a61b6164","5d45e249:fe84ca06:778d1855:daf61ede","A","5","",""
"2019/09/11","","674ec19f","5d018df1:ebf020db:29d43aba:d0c84127","A","15","",""
"2019/09/11","","e55ff018","370ca545:7d3aa2d0:86f5f330:1379261b","A","20","",""
"2019/09/12","","f6aa675c","08315491:4c8f1ee7:5eeaddf3:f879914e","A","10.5","",""
"2019/09/12","","139b790f","a137e4ee:9bc8ee49:7d7ccd8b:472d6007","A","23.9","",""
"2019/09/12","","b24b716d","de348971:5364622c:b2144d94:01e74ff3","A","148","",""
"2019/09/13","","e7c066fa","b418a3b2:a3e21e87:a32ee8ac:8716a847","A","3","",""
"2019/09/13","","9eb044fe","702a13e9:3de7f1bd:9b20a278:1d20668d","A","24","",""
"2019/09/13","","ba301270","d2b7eeb3:381f9473:54f86a33:391a8662","A","36","",""

--anon选项可以将交易明细中的敏感信息（如收款方、帐号）等匿名处理。

尽管ledger打印出的内容有很多列，但只有第一列的日期，以及第六列的金额是我所需要的。同时，由于一天中可能会有多次吃的方面的开销，因此同一天的交易也会有多笔，在绘图之前，需要将同一天之中的开销累加起来，只留下一个数字。这两个需求，都可以用csvsql来满足。

用`csvsql`聚合数据

以前文中的10条记录为例，用如下的命令可以将它们按天聚合在一起

1	ledger --anon --head 10 -f 2021.ledger csv 'Expense:Food' \| csvsql -H --query 'SELECT `a`, SUM(`f`) FROM `expense` GROUP BY `a` ORDER BY `a` ASC' --tables 'expense'

其中：

选项-H让csvsql知道从管道中输入的数据没有标题行。后续处理时，csvsql会默认使用a、b、c等作为列名；
选项--query用于提交要执行的 SQL 语句；
选项--tables用于指定表的名字，这样在--query中才能用 SQL 对其进行处理；

结果如下

➜  Accounting ledger --anon --head 10 -f 2021.ledger csv 'Expense:Food' | csvsql -H --query 'SELECT `a`, SUM(`f`) FROM `expense` GROUP BY `a` ORDER BY `a` ASC' --tables 'expense'
a,SUM(`f`)
2019-09-10,20
2019-09-11,40
2019-09-12,182.4
2019-09-13,63

用`gnuplot`读取数据并绘图

用重定向将csvsql的输出结果保存到文件/tmp/data.csv中，然后就可以用gnuplot将它们画出来

➜  Accounting ledger --anon --head 10 -f 2021.ledger csv 'Expense:Food' | csvsql -H --query 'SELECT `a`, SUM(`f`) FROM `expense` GROUP BY `a` ORDER BY `a` ASC' --tables 'expense' | tail -n '+2' > /tmp/data.csv
➜  Accounting cat /tmp/plot_expense.gplot
set format x '%y-%m-%d'
set style data boxes
set terminal png font '/System/Library/Fonts/Hiragino Sans GB.ttc'
set title '吃的开销'
set output '/tmp/xyz.png'
set timefmt '%Y-%m-%d'
set xdata time
set xlabel '日期'
set xrange ['2019-09-10':'2019-09-13']
set ylabel '金额(¥)'
set yrange [0:200]
set datafile separator comma
plot '/tmp/data.csv' using 1:2
➜  Accounting gnuplot /tmp/plot_expense.gplot

生成的图片文件/tmp/xyz.png如下

在脚本文件/tmp/plot_expense.gplot中用到的命令都可以通过gnuplot的在线手册查阅到：

set format命令用于设置坐标轴的刻度的格式。set format x "%y-%m-%d"意味着设置 X 轴的刻度为形如19-09-10的格式；
set style data命令设置数据的绘制风格。set style data box表示采用空心柱状图；
set terminal命令用于告诉gnuplot该生成什么样的输出。set terminal png font '/System/Library/Fonts/Hiragino Sans GB.ttc'表示输出结果为 PNG 格式的图片，并且采用给定的字体；
set title命令控制输出结果顶部中间位置的标题文案；
set output命令用于将原本输出到屏幕上的内容重定向到文件中；
set timefmt命令用于指定输入的日期时间数据的格式。set timefmt '%Y-%m-%d'意味着输入的日期时间数据的为形如2019-09-10的格式；
set xdata命令控制gnuplot如何理解属于 X 轴的数据。set xdata time表示 X 轴上的均为时间型数据；
set xlabel命令控制 X 轴的含义的文案。set ylabel与其类似，只是作用在 Y 轴上；
set xrange命令控制gnuplot所绘制的图形中 X 轴上的展示范围；
set datafile separator命令控制gnuplot读取数据文件时各列间的分隔符，comma表示分隔符为逗号。

想要按周统计怎么办

假设我要查看的是2021年每一周在吃的方面的总开支，那么需要在csvsql中将数据按所处的是第几周进行聚合

➜  Accounting ledger -b '2021-01-01' -f 2021.ledger csv 'Expense:Food' | csvsql -H --query 'SELECT strftime("%W", `a`) AS `week`, SUM(`f`) FROM `expense` GROUP BY `week` ORDER BY `a` ASC' --tables 'expense' | tail -n '+2' > /tmp/expense_dow.csv
➜  Accounting head /tmp/expense_dow.csv
00,633.6
01,437.3
02,337.5
03,428.4
04,191.5
05,330.4
06,154.6
07,621.4
08,485.6
09,375.73

同时也需要调整gnuplot的脚本

set terminal png font '/System/Library/Fonts/Hiragino Sans GB.ttc'
set title '吃的开销'
set output '/tmp/xyz2.png'
set xlabel '第几周'
set xrange [0:54]
set ylabel '金额(¥)'
set yrange [0:1000]
set datafile separator comma
plot '/tmp/expense_dow.csv' using 1:2 with lines

结果如下

想要同时查看两年的图形怎么办

gnuplot支持同时绘制多条曲线，只要使用数据文件中不同的列作为纵坐标即可。假设我要对比的是2020年和2021年，那么先分别统计两年的开支到不同的文件中

1
2

➜  Accounting ledger -b '2020-01-01' -e '2021-01-01' -f 2021.ledger csv 'Expense:Food' | csvsql -H --query 'SELECT strftime("%W", `a`) AS `week`, SUM(`f`) FROM `expense` GROUP BY `week` ORDER BY `a` ASC' --tables 'expense' | tail -n '+2' > /tmp/expense_2020.csv
➜  Accounting ledger -b '2021-01-01' -f 2021.ledger csv 'Expense:Food' | csvsql -H --query 'SELECT strftime("%W", `a`) AS `week`, SUM(`f`) FROM `expense` GROUP BY `week` ORDER BY `a` ASC' --tables 'expense' | tail -n '+2' > /tmp/expense_2021.csv

再将处于同一周的数据合并在一起

1	➜ Accounting csvjoin -H -c a /tmp/expense_2020.csv /tmp/expense_2021.csv \| tail -n '+2' > /tmp/expense_2years.csv

最后，再让gnuplot一次性绘制两条折线

set terminal png font '/System/Library/Fonts/Hiragino Sans GB.ttc'
set title '吃的开销'
set output '/tmp/xyz2years.png'
set xlabel '第几周'
set xrange [0:54]
set ylabel '金额(¥)'
set yrange [0:1000]
set datafile separator comma
plot '/tmp/expense_2years.csv' using 1:2 with lines title "2020", '/tmp/expense_2years.csv' using 1:3 with lines title "2021"

结果如下

后记

其实仍然是非常不直观的，因为最终生成的是一张静态的图片，并不能做到将鼠标挪到曲线上时就给出所在位置的纵坐标的效果。

git-log很好，你也可以写一个

2021-09-04T09:29:17.000Z

序言

作为一个天天都在用的工具，各位同行想必都非常熟悉 Git 的基本用法，例如：

用git-blame找出某一行 bug 是哪一位同事引入的，由他背锅；
用git-merge把别人的代码合进自己完美无瑕的分支中，然后发现单元测试无法跑通；
用git-push -f把团队里其他人的提交通通覆盖掉。

除此之外，Git 其实还是一个带版本功能的键值数据库：

所有提交的内容都存储在目录.git/objects/下；
有存储文件内容的blob对象、存储文件元数据的tree对象，还有存储提交记录的commit对象等；
Git 提供了键值风格的读写命令git-cat-file和git-hash-object。

读过我以前的文章《当我们git merge的时候到底在merge什么》的朋友们应该都知道，如果一次合并不是fast-forward的，那么会产生一个新的commit类型的对象，并且它有两个父级commit对象。以知名的 Go 语言 Web 框架gin的仓库为例，它的哈希值为e38955615a14e567811e390c87afe705df957f3a的提交是一次合并产生的，这个提交的内容中有两行parent

➜  gin git:(master) git cat-file -p 'e38955615a14e567811e390c87afe705df957f3a'
tree 93e5046e502847a6355ed26223a902b4de2de7c7
parent ad087650e9881c93a19fd8db75a86968aa998cac
parent ce26751a5a3ed13e9a6aa010d9a7fa767de91b8c
author Javier Provecho Fernandez  1499534953 +0200
committer Javier Provecho Fernandez  1499535020 +0200

Merge pull request #520 from 178inaba/travis-import_path

通过一个提交的parent属性，所有的提交对象组成了一个有向无环图。但聪明的你应该发现了，git-log的输出结果是线性的，所以 Git 用到了某种图的遍历算法。

查阅man git-log，可以在Commit Ordering一节中看到

By default, the commits are shown in reverse chronological order.

聪明的你想必已经知道该如何实现这个图的遍历算法了。

自己动手写一个`git-log`

解析`commit`对象

要想以正确的顺序打印commit对象的信息，得先解析它。我们不需要从零开始自己打开文件、读取字节流，以及解压文件内容，只需要像上文那样调用git-cat-file即可。git-cat-file打印的内容中，有一些是需要提取备用的：

以parent开头的行。这一行的哈希值要用于定位到有向无环图中的一个节点；
以committer开头的行。这一行的 UNIX 时间戳将会作为决定谁是“下一个节点”的排序依据。

可以随手写一个 Python 中的类来解析一个commit对象

class CommitObject:
    """一个Git中的commit类型的对象解析后的结果。"""
    def __init__(self, *, commit_id: str) -> None:
        self.commit_id = commit_id

        file_content = self._cat_file(commit_id)
        self.parents = self._parse_parents(file_content)
        self.timestamp = self._parse_commit_timestamp(file_content)

    def _cat_file(self, commit_id: str) -> str:
        cmd = ['git', 'cat-file', '-p', commit_id]
        return subprocess.check_output(cmd).decode('utf-8')

    def _parse_commit_timestamp(self, file_content: str) -> int:
        """解析出提交的UNIX时间戳。"""
        lines = file_content.split('\n')
        for line in lines:
            if line.startswith('committer '):
                m = re.search('committer .+ <[^ ]+> ([0-9]+)', line.strip())
                return int(m.group(1))

    def _parse_parents(self, file_content: str) -> List[str]:
        lines = file_content.split('\n')
        parents: List[str] = []
        for line in lines:
            if line.startswith('parent '):
                m = re.search('parent (.*)', line.strip())
                parent_id = m.group(1)
                parents.append(parent_id)
        return parents

遍历`commit`组成的有向无环图——大根堆

恭喜你，你学过的数据结构可以派上用场了。

假设用上面的类CommitObject解析了gin中哈希值为e38955615a14e567811e390c87afe705df957f3a的提交，那么它的parents属性中会有两个字符串：

ad087650e9881c93a19fd8db75a86968aa998cac；
ce26751a5a3ed13e9a6aa010d9a7fa767de91b8c。

其中：

哈希值为ad087650e9881c93a19fd8db75a86968aa998cac的提交的时间为Sat Jul 8 12:31:44；
哈希值为ce26751a5a3ed13e9a6aa010d9a7fa767de91b8c的提交时间为Jan 28 02:32:44。

显然，按照反转的时间先后顺序（reverse chronological）打印日志的话，下一个打印的节点应当是是ad087650e9881c93a19fd8db75a86968aa998cac——用git-log命令可以确认这一点。

打印完ad087650e9881c93a19fd8db75a86968aa998cac之后，又要从它的父级提交和ce26751a5a3ed13e9a6aa010d9a7fa767de91b8c中，挑选出下一个要打印的提交对象。显然，这是一个循环往复的过程：

从待打印的commit对象中，找出提交时间戳最大的一个；
打印它的消息；
将commit的所有父级提交加入到待打印的对象池中，回到第1个步骤；

这个过程一直持续到没有待打印的commit对象为止，而所有待打印的commit对象组成了一个优先级队列——可以用一个大根堆来实现。

然而，我并不打算在这短短的演示当中真的去实现一个堆数据结构——我用插入排序来代替它。

class MyGitLogPrinter():
    def __init__(self, *, commit_id: str, n: int) -> None:
        self.commits: List[CommitObject] = []
        self.times = n

        commit = CommitObject(commit_id=commit_id)
        self._enqueue(commit)

    def run(self):
        i = 0
        while len(self.commits) > 0 and i < self.times:
            commit = self.commits.pop(0)

            for parent_id in commit.parents:
                parent = CommitObject(commit_id=parent_id)
                self._enqueue(parent)

            print('{} {}'.format(commit.commit_id, commit.timestamp))
            i += 1

    def _enqueue(self, commit: CommitObject):
        for comm in self.commits:
            if commit.commit_id == comm.commit_id:
                return
        # 插入排序，先找到一个待插入的下标，然后将从i到最后一个元素都往尾部移动，再将新节点插入下标i的位置。
        i = 0
        while i < len(self.commits):
            if commit.timestamp > self.commits[i].timestamp:
                break
            i += 1
        self.commits = self.commits[0:i] + [commit] + self.commits[i:]

最后再提供一个启动函数就可以体验一番了

@click.command()
@click.option('--commit-id', required=True)
@click.option('-n', default=20)
def cli(commit_id: str, n: int):
    MyGitLogPrinter(commit_id=commit_id, n=n).run()


if __name__ == '__main__':
    cli()

真假美猴王对比

为了看看上面的代码所打印出来的commit对象的顺序是否正确，我先将它的输出内容重定向到一个文件中

1	➜ gin git:(master) python3 ~/SourceCode/python/my_git_log/my_git_log.py --commit-id 'e38955615a14e567811e390c87afe705df957f3a' -n 20 > /tmp/my_git_log.txt

再用git-log以同样的格式打印出来

1	➜ gin git:(master) git log --pretty='format:%H %ct' 'e38955615a14e567811e390c87afe705df957f3a' -n 20 > /tmp/git_log.txt

最后让diff命令告诉我们这两个文件是否有差异

➜  gin git:(master) diff /tmp/git_log.txt /tmp/my_git_log.txt
20c20
< 2521d8246d9813d65700650b29e278a08823e3ae 1499266911
\ No newline at end of file
---
> 2521d8246d9813d65700650b29e278a08823e3ae 1499266911

可以说是一模一样了。

这方面Python还是比Lisp略逊一筹

2021-08-12T15:08:37.000Z

序言

众所周知，Python 支持向函数传递关键字参数。比如 Python 的内置函数max就接受名为key的关键字参数，以决定如何获取比较两个参数时的依据

1	max({'v': 1}, {'v': 3}, {'v': 2}, key=lambda o: o['v']) # 返回值为{'v': 3}

自定义一个运用了关键字参数特性的函数当然也不在话下。例如模仿一下 Common Lisp 中的函数string-equal

def string_equal(string1, string2, *, start1=None, end1=None, start2=None, end2=None):
    if not start1:
        start1 = 0
    if not end1:
        end1 = len(string1) - 1
    if not start2:
        start2 = 0
    if not end2:
        end2 = len(string2) - 1
    return string1[start1:end1 + 1] == string2[start2:end2 + 1]

再以关键字参数的形式向它传参

1	string_equal("Hello, world!", "ello", start1=1, end1=4) # 返回值为True

~~秉承 Python 之禅中的There should be one-- and preferably only one --obvious way to do it.理念，~~ 我甚至可以花里胡哨地、用关键字参数的语法向string1和string2传参

1	string_equal(string1='Goodbye, world!', string2='ello') # 返回值为False

但瑜不掩瑕，Python 的关键字参数也有其不足。

Python 的不足

Python 的关键字参数特性的缺点在于，同一个参数无法同时以：

具有自身的参数名，以及；
可以从**kwargs中取得，

两种形态存在于参数列表中。

举个例子，我们都知道 Python 有一个知名的第三方库叫做 requests，提供了~~用于开发爬虫牢底坐穿的~~发起 HTTP 请求的功能。它的类requests.Session的实例方法request有着让人忍不住运用 Long Parameter List 对其重构的、长达 16 个参数的参数列表。（你可以移步request方法的文档观摩）

为了便于使用，requests 的作者贴心地提供了requests.request，这样只需要一次简单的函数调用即可

1	requests.request('GET', 'http://example.com')

requests.request函数支持与requests.Session#request（请允许我借用 Ruby 对于实例方法的写法）相同的参数列表，这一切都是通过在参数列表中声明**kwargs变量，并在函数体中用相同的语法向后者传参来实现的。（你可以移步request 函数的源代码观摩）

这样的缺陷在于，requests.request函数的参数列表丢失了大量的信息。要想知道使用者能往kwargs中传入什么参数，必须：

先知道requests.request是如何往requests.Session#request中传参的——将kwargs完全展开传入是最简单的情况；
再查看requests.Session#request的参数列表中排除掉method和url的部分剩下哪些参数。

如果想在requests.request的参数列表中使用参数自身的名字（例如params、data、json等），那么调用requests.Session#request则变得繁琐起来，不得不写成

1 2	with sessions.Session() as session: return session.request(method=method, url=url, params=params, data=data, json=data, **kwargs)

的形式——果然人类的本质是复读机。

一个优雅的解决方案，可以参考隔壁的 Common Lisp。

Common Lisp 的优越性

Common Lisp 第一次面世是在1984年，比 Python 的1991年要足足早了7年。但据悉，Python 的关键字参数特性借鉴自 Modula-3，而不是~~万物起源的~~ Lisp。Common Lisp 中的关键字参数特性与 Python 有诸多不同。例如，根据 Python 官方手册中的说法，**kwargs中只有多出来的关键字参数

If the form “**identifier” is present, it is initialized to a new ordered mapping receiving any excess keyword arguments

而在 Common Lisp 中，与**kwargs对应的是&rest args，它必须放置在关键字参数之前（即左边），并且根据 CLHS 中《A specifier for a rest parameter》的说法，args中含有所有未经处理的参数——也包含了位于其后的关键字参数

(defun foobar (&rest args &key k1 k2)
  (list args k1 k2))

(foobar :k1 1 :k2 3)  ;; 返回值为((:K1 1 :K2 3) 1 3)

如果我还有另一个函数与foobar有着相似的参数列表，那么也可以轻松将所有参数传递给它

(defun foobaz (a &rest args &key k1 k2)
  (declare (ignorable k1 k2))
  (cons a
        (apply #'foobar args)))

(foobaz 1 :k1 2 :k2 3)  ;; 返回值为(1 (:K1 2 :K2 3) 2 3)

甚至于，即使在foobaz中支持的关键字参数比foobar要多，也能轻松地处理，因为 Common Lisp 支持向被调用的函数传入一个特殊的关键字参数:allow-other-keys即可

(defun foobaz (a &rest args &key k1 k2 my-key)
  (declare (ignorable k1 k2))
  (format t "my-key is ~S~%" my-key)
  (cons a
        (apply #'foobar :allow-other-keys t args)))

(foobaz 1 :k1 2 :k2 3 :my-key 4)  ;; 打印my-key is 4，并返回(1 (:ALLOW-OTHER-KEYS T :K1 2 :K2 3 :MY-KEY 4) 2 3)

回到 HTTP 客户端的例子。在 Common Lisp 中我一般用drakma这个第三方库来发起 HTTP 请求，它导出了一个http-request函数，用法与requests.request差不多

1	(drakma:http-request "http://example.com" :method :get)

如果我想要基于它来封装一个便捷地发出 GET 请求的函数http-get的话，可以这样写

1 2	(defun http-get (uri &rest args) (apply #'drakma:http-request uri :method :get args))

如果我希望在http-get的参数列表中直接暴露出一部分http-request支持的关键字参数的话，可以这样写

1
2
3

(defun http-get (uri &rest args &key content)
  (declare (ignorable content))
  (apply #'drakma:http-request uri :method :get args))

更进一步，如果我想在http-get中支持解析Content-Type为application/json的响应结果的话，还可以这样写

(ql:quickload 'jonathan)
(ql:quickload 'str)
(defun http-get (uri &rest args &key content (decode-json t))
  ;; http-request并不支持decode-json这个参数，但依然可以将整个args传给它。
  (declare (ignorable content))
  (multiple-value-bind (bytes code headers)
      (apply #'drakma:http-request uri
             :allow-other-keys t
             :method :get
             args)
    (declare (ignorable code))
    (let ((content-type (cdr (assoc :content-type headers)))
          (text (flexi-streams:octets-to-string bytes)))
      (if (and decode-json
               (str:starts-with-p "application/json" content-type))
          (jonathan:parse text)
          text))))

不愧是~~Dio~~ Common Lisp，轻易就做到了我们做不到的事情。

题外话

曾几何时，Python 程序员还会津津乐道于 Python 之禅中的There should be one-- and preferably only one --obvious way to do it.，但其实 Python 光是在定义一个函数的参数方面就有五花八门的写法了。甚至在写这篇文章的过程中，我才知道原来 Python 的参数列表中可以通过写上/来使其左侧的参数都成为 positional-only 的参数。

def foo1(a, b): pass
def foo2(a, /, b): pass


foo1(a=1, b=2)
foo2(a=1, b=2)  # 会抛出异常，因为a只能按位置来传参。

屠龙术——如何运用整洁架构

2021-08-02T15:13:45.000Z

序言

或许是为了显摆，也或许是虚心学习，总之我在去年年初花了大约两个月读完了《架构整洁之道》。但读过后也仅仅就是读了而已，尽管书中描绘了一个名为整洁架构的软件架构，但我并没有理解并应用到实际的开发中去。书中的诸多理念最终都蛰伏在了我的脑海深处。

今年年初的时候我换了工作。新的单位给每人都配备了办公用的电脑，从此我也不用背着2公斤重的MacBook Pro通勤了。美中不足的地方是，我和cuckoo之间的联系被斩断了，因为cuckoo是个单机程序，要在私人电脑和办公电脑上各装一份太不方便了。于是乎，我决定开两个新的项目，将cuckoo拆分为客户端和服务端两部分。

正好，这给了我在实际的项目中践行整洁架构的机会。

什么是整洁架构

不像数学领域的概念往往有一个精确的定义，书中甚至没有道出整洁架构是什么。相对的，只有一副引人入胜的架构示意图（图片摘自作者博客的这篇文章）

在作者的文章中，对图中的四个层次给出了响应的解释：

Entities封装了企业范围内的业务规则。如果你没有经营一个企业，仅仅是开发一款应用，那么Entities就是应用的业务对象，它们封装了应用内最通用、上层的规则。

Use Cases包含了与应用相关的业务规则。它封装并实现了系统的所有用例。

这一层负责将最方便entities和use cases的数据转换为最方便外部系统使用的格式。在这一层以内都是抽象的，对外界诸如MVC、GUI、数据库等均是无感知的。此外，这一层也负责与外部服务通信。
Frameworks & Drivers，顾名思义，这一层包含了与框架相关的代码，或者像C语言中的main函数这样的入口函数代码；

如何应用整洁架构

实际项目的例子

前文提到，为了满足新需求，我需要将cuckoo改造为C/S模型。但比起缓缓地将cuckoo拆解为两部分，我更乐于大刀阔斧地从头开发开发这两个程序，于是便诞生了：

服务端程序为nest，负责管理任务、计划等实体对象，并提供基于HTTP协议的API；
客户端程序为fledgling，负责与nest通信，并在客户机上触发通知（如macOS的右上角弹出通知）。

它们都是我依照自己对整洁架构的理解来编写的。

从架构理念到具体决策

正如REST仅仅是一种软件结构风格而不是具体的设计指南一样，整洁架构也并没有规定示意图中的分层结构该如何运用一门语言的特性来实现，这需要开发者自己去摸索。下文我给出自己在nest和fledgling项目中的做法。

如何安排代码目录结构

在程序的代码结构中，最接近于架构示意图的分层架构的，当属代码仓库的目录结构了。模仿整洁架构中的四层结构，我在nest中也安排了相似的目录结构

(venv) ➜  nest git:(master) tree -I '__pycache__' -d ./nest
./nest
├── app
│   ├── entity
│   └── use_case
├── cli
│   ├── command
│   └── config
├── infra
├── repository
│   └── DDL
└── web
    ├── config
    ├── controller
    └── presenter

13 directories

`nest/app/entity/`目录

nest/app/entity/目录下的各个文件分别定义了系统中的各个实体类型

1 2	(venv) ➜ nest git:(master) ls nest/app/entity __pycache__ certificate.py location.py plan.py task.py user.py

例如：

task.py中定义了类Task，表示一个任务；
plan.py中定义了类Plan，表示任务的一次触发计划，等等。

entity/目录下的各个文件中，还定义了管理各种实体对象生命期的仓库对象，例如：

task.py中定义了类ITaskRepository，它负责增（add方法）删（clear、remove方法）查（find、find_by_id方法）改（同样是add方法）任务对象；
plan.py中定义了类IPlanRepository，同样能够增（add方法）删（clear、remove方法）查（find_as_queue、find_by_id、find_by_task_id方法）改（同样是add方法）计划对象，等等。

实体类型都是充血模型，它们实现了系统核心的业务规则，例如：

类Plan有方法is_repeated用于检查是否为重复性任务；
有方法is_visible用于检查该计划在当前时间是否可见；
有方法rebirth用于生成一个新的、下一次触发的计划，等等。

这个目录下的内容相当于整洁架构中的Entities层。

`nest/app/use_case/`目录

nest/app/use_case/目录下的各个文件分别定义了系统所提供的功能

1
2
3

(venv) ➜  nest git:(master) ls nest/app/use_case
__init__.py        authenticate.py    change_task.py     create_plan.py     delete_plan.py     get_location.py    get_task.py        list_plan.py       login.py           registration.py
__pycache__        change_plan.py     create_location.py create_task.py     delete_task.py     get_plan.py        list_location.py   list_task.py       pop_plan.py

例如：

authenticate.py定义了系统如何认证发送当前请求的用户；
change_task.py定义了系统如何修改一个任务对象，等等。

每一个处于该目录下的文件，只会依赖nest/app/entity/中的代码，并且它们都是抽象的。例如，authenticate.py中的类AuthenticateUseCase的构造方法中，要求其：

参数certificate_repository必须是类ICertificateRepository或其子类的实例；
参数params必须是类IParams或其子类的实例。

然而ICertificateRepository和IParams其实都是抽象基类ABC的子类，并且它们都有被装饰器abstractmethod装饰的抽象方法，因此并不能直接实例化。

该目录相当于整洁架构中的Use Cases层。

其它目录

顾名思义，cli和web目录分别是与命令行程序、基于HTTP的API相关的代码，它们实现了处理来自命令行和HTTP协议的输入，以及打印到终端和返回HTTP响应的功能。repository目录下的各个文件实现了entity目录中各个抽象的仓库类的具体子类

1 2	(venv) ➜ nest git:(master) ls nest/repository DDL __init__.py __pycache__ certificate.py db_operation.py location.py plan.py task.py user.py

例如：

certificate.py中实现了entity/目录下的同名文件中的抽象类ICertificateRepository——一个基于内存的子类MemoryCertificateRepository，以及一个基于Redis的子类RedisCertificateRepository；
location.py中实现了entity/目录下的同名文件中的抽象类ILocationRepository——基于MySQL的子类DatabaseLocationRepository，等等。

需要注意的是，除了app外的这些目录，并不能与整洁架构示意图中的外面两层严格对应起来。例如，尽管cli和web的名字一下子就让人认为它们处于Frameworks & Drivers层，但web/presenter/目录下的内容其实与框架并无联系。反倒是从命名上看处于Interface Adapters层的web/controller/目录，其中的代码依赖于Flask框架。

如何往`Use Cases`层传入数据

在鲍勃大叔的文章中，提到了关于如何在层之间传递数据的原则

Typically the data that crosses the boundaries is simple data structures. You can use basic structs or simple Data Transfer objects if you like. Or the data can simply be arguments in function calls. Or you can pack it into a hashmap, or construct it into an object.

在nest/app/use_case/目录下的所有用例采用的都是这里提到的construct it into an object的方式。以create_task.py为例：

class IParams(ABC):
    @abstractmethod
    def get_brief(self) -> str:
        pass

    @abstractmethod
    def get_keywords(self) -> List[str]:
        pass

    @abstractmethod
    def get_user_id(self) -> int:
        pass

用内置模块abc中的抽象基类ABC、装饰器abstractmethod，以及类CreateTaskUseCase中的assert一起模拟类似Java中的interface的效果；
用方法而不是成员变量来获取不同的输入参数：
- get_brief获取任务的简述；
- get_keywords获取关键字列表；
- get_user_id获取创建该任务的用户的ID。

聪明的盲生已经发现了华点：明明只需要在类CreateTaskUseCase的构造方法中定义brief、keywords，以及user_id三个参数即可，为什么要用方法这么麻烦呢？答案是因为方法更灵活。

当你采用构造方法参数的方案时，本质上是立了一个假设：

~~在所有惯性系中，物理定律有相同的表达形式~~先完成所有参数的获取；
再执行用例中的业务逻辑。

如果是一个基于HTTP协议的API，那么这个假设是成立的——用户在客户端发送的HTTP请求到达服务端后，便无法再补充参数了。但有一种场景，用户能够在用例执行业务逻辑的过程中，持续地与应用交互，那便是命令行程序。

我在fledgling项目中给了一个用户在用例执行过程中，交互式地输入的例子。在文件fledgling/app/use_case/delete_task.py中，实现了删除指定任务的用例。它要求输入两个参数

class IParams(ABC):
    @abstractmethod
    def get_confirmation(self) -> bool:
        """获取用户是否要删除该任务的确认。"""
        pass

    @abstractmethod
    def get_task_id(self) -> int:
        pass

在文件fledgling/cli/command/delete_task.py中实现了IParams类的命令行形态。当没有从命令行参数中获取到任务的ID时，便会使用第三方库PyInquirer询问用户输入任务ID，并进一步确认

class Params(IParams):
    def __init__(self, *, task_id: Optional[int]):
        self.task_id = task_id

    def get_confirmation(self) -> bool:
        if self.task_id:
            return True
        questions = [
            {
                'message': '确定删除该任务',
                'name': 'confirmation',
                'type': 'confirm',
            }
        ]
        answers = prompt(questions)
        return answers['confirmation']

    def get_task_id(self) -> int:
        if self.task_id:
            return self.task_id
        questions = [
            {
                'message': '输入要删除的任务的ID',
                'name': 'task_id',
                'type': 'input',
            }
        ]
        answers = prompt(questions)
        return answers['task_id']

而这一切~~煮不在乎~~DeleteTaskUseCase并不会感知到，它独立于用户界面。

在哪一层维护业务规则

在《架构整洁之道》第20章中，鲍勃大叔给出了业务规则的定义

Strictly speaking, business rules are rules or procedures that make or save
the business money. Very strictly speaking, these rules would make or save the business money, irrespective of whether they were implemented on a computer. They would make or save money even if they were executed manually.

业务规则往往不是独立存在的，它们需要作用在一些数据上

Critical Business Rules usually require some data to work with. For example, our loan requires a loan balance, an interest rate, and a payment schedule.

而整洁架构中的实体就是包含了一部分业务规则及其操作的数据的对象。以nest中的计划实体为例，在类Plan中包含了几种业务规则——尽管这些规则不能为我赚钱或者省钱：

一个计划的持续时长（如果有的话）不会是负的秒数——由duration的setter保障；
周期性计划必须指定周期——由new方法维护；
一个计划是重复的，当且仅当它有指定重复类型——由is_repeated方法维护；
一个计划是可见的，当且仅当它：
- 要么没有指定可见的小时，要么当且时间处于指定的小时中，并且；
- 要么没有指定星期几可见，要么今天是指定的weekday——由is_visible方法维护。

但在整洁架构的示意图中，Use Cases层也是有维护规则的，它维护的是应用的业务规则（Application Business Rules）。与Entities层所维护的业务规则不同，Use Cases层的业务规则取决于应用提供的功能。例如，在nest项目修改一个计划的用例ChangePlanUseCase类的方法run中，会：

检查指定的计划是否存在——显然，实体没法检查自己是否存在；
检查计划是否能被修改；
检查新的地点的ID是否指向真实存在的地点对象——显然，Plan对象不会去检查Location存在与否；

# 文件nest/app/use_case/change_plan.py
class ChangePlanUseCase:
    # 省略__init__的定义
    def run(self):
        # 省略一些无关要紧的代码
        params = self.params
        plan_id = params.get_plan_id()
        plan = self.plan_repository.find_by_id(plan_id)
        if plan is None:  # 上面第1点
            raise PlanNotFoundError(plan_id=plan_id)
        if not plan.is_changeable():  # 上面第2点
            raise UnchangeableError()

        found, location_id = params.get_location_id()
        if found:
            if location_id:
                location = self.location_repository.get(id_=location_id)
                if not location:  # 上面第3点
                    raise LocationNotFoundError(location_id=location_id)
            plan.location_id = location_id

聪明的你一定发现了：is_changeable为什么不作为Enterpries Business Rules，在Plan对象内自行检查呢？答案是因为这样写更简单。

试想一下，如果要让Plan自己禁止在is_changeable为False时被修改，那么必须：

先为所有可修改的属性设置setter；
在每一个setter中都调用is_changeable进行检查。

之所以要这么做，是因为一个实体对象（在这里是指Plan的实例对象）是外部的时间流动是无感知的。它不知道外层（此处是Use Cases层）会先调用哪一个方法，后调用哪一个方法。因此，要想保持“终止状态的计划不能修改”，就必须在每一处setter都检查。

与之相反，在用例中有编排，因此它可以感知时间的流动。用例可以让Plan的is_changeable方法在其它任何方法之前被调用，因此免除了繁琐地在每一个setter中检查is_changeable的必要。

如何获取`Use Cases`层的处理结果

正如往Use Cases层中输入参数可以采用：

直接在__init__中传入对应类型的参数，或；
在__init__中传入一个能根据方法提取参数的对象。

两种方案一样，获取Use Cases层的计算结果同样有两种方案：

获取run方法的返回值，捕捉它的异常，或；
在__init__中传入一个能够接受不同结果并处理的对象。

在nest这样的仅仅提供HTTP API的应用中，第1种方案便已经足够了。例如，在文件nest/web/controller/create_plan.py中，类CreatePlanUseCase的run方法的返回值为创建的计划对象，如果run调用成功，这个controller会借助于PlanPresenter，将计划对象转换为JSON对象格式的字符串，返回给调用方；如果调用失败，那么controller中也会捕捉异常（如InvalidRepeatTypeError）并以另一种格式返回给调用方。

def create_plan(certificate_repository, repository_factory):
    # 省略了不必要的代码
    params = HTTPParams()
    use_case = CreatePlanUseCase(
        location_repository=repository_factory.location(),
        params=params,
        plan_repository=repository_factory.plan(),
        task_repository=repository_factory.task(),
    )
    try:
        plan = use_case.run()
        presenter = PlanPresenter(plan=plan)
        return {  # 成功的情形
            'error': None,
            'result': presenter.format(),
            'status': 'success',
        }, 201
    except InvalidRepeatTypeError as e:  # 失败的情形
        return {
            'error': {
                'message': '不支持的重复类型：{}'.format(e.repeat_type),
            },
            'result': None,
            'status': 'failure',
        }, 422

如果想要更高的灵活性并且也有施展的空间，那么可以考虑第2种方案。例如fledgling项目中文件fledgling/app/use_case/list_plan.py中，就定义了一个接口IPresenter

class IPresenter(ABC):
    @abstractmethod
    def on_find_location(self):
        pass

    @abstractmethod
    def on_find_task(self):
        pass

    @abstractmethod
    def on_invalid_location(self, *, error: InvalidLocationError):
        pass

    @abstractmethod
    def show_plans(self, *, count: int, plans: List[Plan]):
        pass

并且在用例的执行过程中，会多次向self.presenter传递数据

class ListPlanUseCase:
    # 省略__init__方法
    def run(self):
        location_id = None
        location_name = self.params.get_location_name()
        no_location = self.params.get_no_location()
        if not no_location and location_name is not None:
            locations = self.location_repository.find(name=location_name)
            if len(locations) == 0:
                self.presenter.on_invalid_location(error=InvalidLocationError(name=location_name))  # 第1次，触发无效地点的错误
                return

            location_id = locations[0].id

        page = self.params.get_page()
        per_page = self.params.get_per_page()
        criteria = {
            'page': page,
            'per_page': per_page,
        }
        if location_id is not None:
            criteria['location_id'] = location_id
        plans, count = self.plan_repository.list(**criteria)
        location_ids = [plan.location_id for plan in plans]
        self.presenter.on_find_location()  # 第2次交互，通知presenter开始查找地点的事件
        locations = self.location_repository.find(
            ids=location_ids,
            page=1,
            per_page=len(location_ids),
        )
        task_ids = [plan.task_id for plan in plans]
        self.presenter.on_find_task()  # 第3次交互，通知presenter开始查找任务的事件
        tasks = self.task_repository.list(
            page=1,
            per_page=len(task_ids),
            task_ids=task_ids,
        )
        for plan in plans:
            location_id = plan.location_id
            location = [location for location in locations if location.id == location_id][0]
            plan.location = location
            task_id = plan.task_id
            task = [task for task in tasks if task.id == task_id][0]
            plan.task = task

        # 第4次，也是最后一次，传入用例的处理结果
        self.presenter.show_plans(
            count=count,
            plans=plans,
        )
        return

在构造方法中注入presenter的缺点在于用例的run方法中需要显式地return，否则用例会继续执行下去。

Python语言特性的运用

模拟接口——`abstractmethod`v.s.`NotImplementedError`

整洁架构的每一层都只会依赖于内层，而内层又对外层一无所知，负责解耦两者的便是编程语言的接口特性。但Python并不像Java那般有interface关键字，因此我利用它的其它一系列特性来模拟出接口：

用class代替interface，这些类继承自内置模块abc的抽象基类ABC；
除此之外，这些类中的方法还用同一模块中的abstractmethod装饰，使它们必须由该类的子类全部定义；
在使用这个接口的位置（例如Use Cases层）用断言assert约束输入参数的类型。

nest中的大部分需要接口的位置我都是用这种手法来做的，但这种方式会给编写单元测试用例带来一些不便：

因为代码中用assert来检查参数类型，导致传入的参数只能是这个接口或其子类的实例；
因为接口类继承自ABC，所以必须定义所有被abstractmethod装饰的方法，否则在实例化时就会抛出异常。

例如，在nest项目的文件tests/use_case/task/test_list.py中，作为白盒测试的人员，我确切地知道类ListTaskUseCase的run方法只会调用它的task_repository的find方法，但在类MockTaskRepository中依然不得不定义基类的每一个方法——尽管它们只有一行pass语句。

如果愿意放弃一点点的严谨性，那么可以弱化一下上面的接口方案：

不使用abstractmethod，而是在本应为抽象方法的方法中只留下一句raise NotImplementedError；
不使用assert检查类型，而是在参数中写上type hint。

有了第1点，那么在测试用例中就不需要为测试路径上不会调用的方法写多余的定义了。而有了第2点，也就不需要为测试路径上不会引用的属性创建对象了，大可直接传入一个None。选择哪一种都无妨，取决于开发者或团队的口味。

金坷垃整洁架构的好处都有啥

在《架构整洁之道》的第20章，作者给出了整洁架构的五种优秀特性：

独立于框架。例如，我可以花不是很大的力气，将nest从Flask迁移到Bottle上，尽管并不会无缘无故或频繁地这么做；
容易测试。例如，在nest项目的目录tests/use_case下的测试用例不需要有任何外部系统的依赖就可以编写并运行；
独立于用户界面。例如，在nest项目中同一个用例RegistrationUseCase就有HTTP API和命令行两种用户界面：
- 在文件nest/web/controller/registration.py中是HTTP API形态；
- 在文件nest/cli/command/register.py中则是命令行形态。
独立于数据库。例如，就像更换Web框架一样，我也可以从MySQL迁移到PostgreSQL中，这对于Entities和Use Cases层的代码而言别无二致；
独立于外部系统。例如，在fledgling项目中，尽管也定义了一个接口ITaskRepository，但不同于nest中基于数据库的实现子类DatabaseTaskRepository，在fledgling中实现的是基于网络传输的类TaskRepository。但究竟是基于单机数据库，还是身处一个分布式系统（C/S模型）中，Entities和Use Cases层对此是无感知的。

甘瓜苦蒂——整洁架构的不足

渗入内层的I/O

模拟小于运算符的短路特性

2021-06-26T03:02:53.000Z

~~忆往昔峥嵘岁月稠~~在Python的语言标准的Comparisions章节中提到

Also unlike C, expressions like a < b < c have the interpretation that is conventional in mathematics

也就是说，在C语言中要写成a < b && b < c的表达式，在Python中可以写成a < b < c。并且，标准中还提到

Comparisons can be chained arbitrarily, e.g., x < y <= z is equivalent to x < y and y <= z, except that y is evaluated only once (but in both cases z is not evaluated at all when x < y is found to be false).

一般将这种性质成为短路。因此，像2 < 1 < (1 / 0)这样的表达式在Python中不会引发异常，而是返回False。

Python的小于号能拥有短路特性，是因为它并非一个普通函数，而是有语言层面加持的操作符。而在Common Lisp（下称CL）中，小于号仅仅是一个普通函数，就像Haskell中的小于号也是一个函数一般。不同的是，CL的小于号能接受多于两个的参数

1	(< 1 2 3 -1) ; 结果为NIL

但它并没有短路特性

1	(< 1 2 3 -1 (/ 1 0)) ; 引发名为DIVISION-BY-ZERO的错误

要想模拟出具有短路特性的小于号，必须借助于宏的力量。

想生成什么样的代码

要想写出一个宏，必须先设想出它的语法，以及它会展开成什么样的代码。姑且为这个宏起名为less-than，它的语法应当为

1
2
3

(defmacro less-than (form &rest more-forms)
  ; TBC
  )

至于它的展开结果可以有多种选择。例如，可以(less-than 2 1 (/ 1 0))展开为自身具有短路特性的and形式

1	(and (< 2 1) (< 1 (/ 1 0)))

但就像在C语言中用宏朴素地实现计算二者最大值的MAX宏一样，上面的展开方式在一些情况下会招致重复求值

1	(less-than 1 (progn (print 'hello) 2) 3)

因此，起码要展开为and和let的搭配

(let ((g917 1)
      (g918 (progn (print 'hello) 2)))
  (and (< g917 g918)
       (let ((g919 3))
         (< g918 g919))))

要想展开为这种结构，可以如这般实现less-than

(defmacro less-than (form &rest more-forms)
  (labels ((aux (lhs forms)
             "LHS表示紧接着下一次要比较的、小于号的左操作数。"
             (unless forms
               (return-from aux))
             (let* ((rhs (gensym))
                    (rv (aux rhs (rest forms))))
               (if rv
                   `(let ((,rhs ,(first forms)))
                      (and (< ,lhs ,rhs)
                           ,rv))
                   `(< ,lhs ,(first forms))))))
    (cond ((null more-forms)
           `(< ,form))
          (t
           (let ((lhs (gensym)))
             `(let ((,lhs ,form))
                ,(aux lhs more-forms)))))))

用上面的输入验证一下是否会导致重复求值

CL-USER> (macroexpand-1 '(less-than 1 (progn (print 'hello) 2) 3))
(LET ((#:G942 1))
  (LET ((#:G943 (PROGN (PRINT 'HELLO) 2)))
    (AND (< #:G942 #:G943) (< #:G943 3))))
T

优化一下

显然less-than可以优化，只需要简单地运用递归的技巧即可

(defmacro less-than (form &rest more-forms)
  (cond ((<= (length more-forms) 1)
         `(< ,form ,@more-forms))
        (t
         (let ((lhs (gensym))
               (rhs (gensym)))
           `(let ((,lhs ,form)
                  (,rhs ,(first more-forms)))
              (and (< ,lhs ,rhs)
                   (less-than ,rhs ,@(rest more-forms))))))))

展开后的代码简短得多

CL-USER> (macroexpand-1 '(less-than 1 (progn (print 'hello) 2) 3))
(LET ((#:G955 1) (#:G956 (PROGN (PRINT 'HELLO) 2)))
  (AND (< #:G955 #:G956) (LESS-THAN #:G956 3)))
T

从AOP到method-combination

2021-06-14T12:28:28.000Z

“实战Elisp”系列旨在讲述我使用Elisp定制Emacs的经验，抛砖引玉，还请广大Emacs同好不吝赐教——如果真的有广大Emacs用户的话，哈哈哈。

Emacs的org-mode用的是一门叫Org的标记语言，正如大部分的标记语言那样，它也支持无序列表和检查清单——前者以-（一个连字符、一个空格）为前缀，后者以- [ ]或- [x]为前缀（比无序列表多了一对方括号及中间的字母x）

此外，org-mode还为编辑这两种列表提供了快速插入新一行的快捷键M-RET（即按住alt键并按下回车键）。如果光标位于无序列表中，那么新的一行将会自动插入-前缀。遗憾的是，如果光标位于检查清单中，那么新一行并没有自动插入一对方括号

每次都要手动敲入[ ]还挺繁琐的。好在这是Emacs，它是可扩展的、可定制的。只需敲几行代码，就可以让Emacs代劳输入方括号了。

Emacs的AOP特性——`advice-add`

借助Emacs的describe-key功能，可以知道在一个org-mode的文件中按下M-RET时，Emacs会调用到函数org-insert-item上。要想让M-RET实现自动追加方括号的效果，马上可以想到简单粗暴的办法：

定义一个新的函数，并将M-RET绑定到它身上；
重新定义org-insert-item函数，使其追加方括号；

但不管是上述的哪一种，都需要连带着重新实现插入连字符、空格前缀的已有功能。有一种更温和的办法可以在现有的org-insert-item的基础上扩展它的行为，那就是Emacs的advice特性。

advice是面向切面编程范式的一种，使用Emacs的advice-add函数，可以在一个普通的函数被调用前或被调用后捎带做一些事情——比如追加一对方括号。对于这两个时机，分别可以直接用advice-add的:before和:after来实现，但用在这里都不合适，因为：

检测是否位于检查清单中，需要在调用org-insert-item前做；
追加一对方括号，则需要在org-insert-item之后做。

因此，正确的做法是使用:around来修饰原始的org-insert-item函数

(cl-defun lt-around-org-insert-item (oldfunction &rest args)
  "在调用了org-insert-item后识时务地追加 [ ]这样的内容。"
  (let ((is-checkbox nil)
        (line (buffer-substring-no-properties (line-beginning-position) (line-end-position))))
    ;; 检查当前行是否为checkbox
    (when (string-match-p "- \\[.\\]" line)
      (setf is-checkbox t))
    ;; 继续使用原来的org-insert-item插入文本
    (apply oldfunction args)
    ;; 决定要不要追加“ [ ]”字符串
    (when is-checkbox
      (insert "[ ] "))))

(advice-add 'org-insert-item :around #'lt-around-org-insert-item)

这下子，M-RET对检查清单也一视同仁了

Common Lisp的`method combination`

advice-add的:after、:around，以及:before在Common Lisp中有着完全同名的等价物，只不过不是用一个叫advice-add的函数，而是喂给一个叫defmethod的宏。举个例子，用defmethod可以定义出一个多态的len函数，对不同类型的入参执行不同的逻辑

(defgeneric len (x))

(defmethod len ((x string))
  (length x))

(defmethod len ((x hash-table))
  (hash-table-count x))

然后为其中参数类型为字符串的特化版本定义对应的:after、:around，以及:before修饰过的方法

(defmethod len :after ((x string))
  (format t "after len~%"))

(defmethod len :around ((x string))
  (format t "around中调用len前~%")
  (prog1
      (call-next-method)
    (format t "around中调用len后~%")))

(defmethod len :before ((x string))
  (format t "before len~%"))

这一系列方法的调用规则为：

先调用:around修饰的方法；
由于上述方法中调用了call-next-method，因此再调用:before修饰的方法；
调用不加修饰的方法（在CL中这称为primary方法）；
再调用:after修饰的方法；
最后，又回到了:around中调用call-next-method的位置。

咋看之下，Emacs的advice-add支持的修饰符要多得多，实则不然。在CL中，:after、:around，以及:before同属于一个名为standard的method combination，而CL还内置了其它的method combination。在《Other method combinations》一节中，作者演示了progn和list的例子。

如果想要模拟Emacs的advice-add所支持的其它修饰符，那么就必须定义新的method combination了。

可编程的编程语言——`define-method-combination`

曾经我以为，defmethod只能接受:after、:around，以及:before，认为这三个修饰符是必须在语言一级支持的特性。直到有一天我闯入了LispWorks的define-method-combination词条中，才发现它们也是三个平凡的修饰符而已。

(define-method-combination standard ()
  ((around (:around))
   (before (:before))
   (primary () :required t)
   (after (:after)))
  (flet ((call-methods (methods)
           (mapcar #'(lambda (method)
                       `(call-method ,method))
                   methods)))
    (let ((form (if (or before after (rest primary))
                    `(multiple-value-prog1
                         (progn ,@(call-methods before)
                                (call-method ,(first primary)
                                             ,(rest primary)))
                       ,@(call-methods (reverse after)))
                    `(call-method ,(first primary)))))
      (if around
          `(call-method ,(first around)
                        (,@(rest around)
                           (make-method ,form)))
          form))))

秉持“柿子要挑软的捏”的原则，让我来尝试模拟出advice-add的:after-while和:before-while的效果吧。

:after-while和:before-while的效果还是很容易理解的

Call function after the old function and only if the old function returned non-nil.
Call function before the old function and don’t call the old function if function returns nil.

因此，由define-method-combination生成的form中（犹记得伞哥在《PCL》中将它翻译为形式），势必要：

检查是否有被:before-while修饰的方法；
如果有，检查调用了被:before-while修饰的方法后的返回值是否为NIL；
如果没有，或者被:before-while修饰的方法的返回值为非NIL，便调用primary方法；
如果有被:after-while修饰的方法，并且primary方法的返回值不为NIL，就调用这些方法；
返回primary方法的返回值。

为了简单起见，尽管after-while和before-while变量指向的是多个“可调用”的方法，但这里只调用“最具体”的一个。

给这个新的method combination取名为emacs-advice，其具体实现已是水到渠成

(define-method-combination emacs-advice ()
  ((after-while (:after-while))
   (before-while (:before-while))
   (primary () :required t))
  (let ((after-while-fn (first after-while))
        (before-while-fn (first before-while))
        (result (gensym)))
    `(let ((,result (when ,before-while-fn
                      (call-method ,before-while-fn))))
       (when (or (null ,before-while-fn)
                 ,result)
         (let ((,result (call-method ,(first primary))))
           (when (and ,result ,after-while-fn)
             (call-method ,after-while-fn))
           ,result)))))

call-method（以及它的搭档make-method）是专门用于在define-method-combination中调用传入的方法的宏。

用一系列foobar方法来验证一番

(defgeneric foobar (x)
  (:method-combination emacs-advice))

(defmethod foobar (x)
  'hello)

(defmethod foobar :after-while (x)
  (declare (ignorable x))
  (format t "for side effect~%"))

(defmethod foobar :before-while (x)
  (evenp x))

(foobar 1) ;; 返回NIL
(foobar 2) ;; 打印“fo side effect”，并返回HELLO

后记

尽管我对CL赏识有加，但越是琢磨define-method-combination，就越会发现编程语言的能力是有极限的~~，除非超越编程语言~~。比如Emacs的advice-add所支持的:filter-args和:filter-return就无法用define-method-combination优雅地实现出来——并不是完全不行，只不过需要将它们合并在由:around修饰的方法之中。

非递归遍历二叉树到底有什么用

2021-05-03T03:58:11.000Z

准备过互联网公司的服务端岗位面试的人，对于二叉树的三种遍历方式想必是如数家珍。假设以类BinaryTree定义一棵二叉树

class BinaryTree:
    def __init__(self, left, right, value):
        self.left = left
        self.right = right
        self.value = value

实现一个前序遍历的算法便是信手拈来的事情

def preorder_traversal(tree, func):
    """前序遍历二叉树的每个节点。"""
    if tree is None:
        return
    func(tree.value)
    preorder_traversal(tree.left, func)
    preorder_traversal(tree.right, func)

随着行业曲率的增大，要求写出不使用递归的版本也没什么过分的

def iterative_preorder_traversal(tree, func):
    nodes = [tree]
    while len(nodes) > 0:
        node = nodes.pop()
        func(node)
        if node.left is not None:
            nodes.append(node.right)
        if node.left is not None:
            nodes.append(node.left)

一直以来，我觉得这种用一个显式的栈来代替递归过程中隐式的栈的做法就是镜花水月。但最近却找到了它的一个用武之地——用于实现iterator。

`iterator`是个啥？

这年头，iterator已经不是什么新鲜事物了，许多语言中都有支持，维基百科上有一份清单列出了比较知名的语言的iterator特性。按照Python官方的术语表中的定义，iterator表示一个数据流，反复调用其__next__方法可以一个接一个地返回流中的下一项数据。将内置函数iter作用于list、str、tuple类型的对象，可以获得相应的迭代器

$ cat get_iter.py
# -*- coding: utf8 -*-
if __name__ == '__main__':
    values = [
        [1, 2, 3],
        'Hello, world!',
        (True, None),
    ]
    for v in values:
        print('type of iter({}) is {}'.format(v, type(iter(v))))
$ python get_iter.py
type of iter([1, 2, 3]) is 
type of iter(Hello, world!) is 
type of iter((True, None)) is

写一个前序遍历的`iterator`

一个iterator对象必须要实现__iter__和__next__方法：

__iter__只需要返回iterator对象自身即可；
顾名思义，__next__负责返回下一个元素。

仔细观察一下前文中的iterative_preorder_traversal函数可以看出：

nodes = [tree]属于初始化逻辑；
len(nodes) > 0用于判断是应当抛出StopIteration，还是应当继续返回下一个值（nodes.pop()）；
最后四行就是负责填充nodes，好让它可以在下一次调用__next__的时候有值可以返回的。

到这里，iterator的具体实现代码已经呼之欲出了

class BinaryTreePreorderIterator:
    def __init__(self, root):
        nodes = []
        if root is not None:
            nodes.append(root)
        self.nodes = nodes

    def __iter__(self):
        return self

    def __next__(self):
        if len(self.nodes) == 0:
            raise StopIteration
        node = self.nodes.pop()
        if node.right is not None:
            self.nodes.append(node.right)
        if node.left is not None:
            self.nodes.append(node.left)
        return node.value

构造一棵这样的满二叉树

用BinaryTreePreorderIterator可以正确地打印出每一个节点的值

if __name__ == '__main__':
    tree = BinaryTree(
        BinaryTree(
            BinaryTree(None, None, 1), 
            BinaryTree(None, None, 3), 
            2,
        ),
        BinaryTree(
            BinaryTree(None, None, 5), 
            BinaryTree(None, None, 7), 
            6,
        ),
        4,
    )
    for n in BinaryTreePreorderIterator(tree):
        print('{}\t'.format(n), end='')
# 打印内容为：4213657

`iterator`的优势

显然，iterator比起preorder_traversal更为灵活——很容易在for-in循环内添加各种各样的控制逻辑：用continue跳过一些值，或者用break提前结束遍历过程。这些在函数preorder_traversal中做起来会比较别扭。

聪明的你应该已经发现了，大可不必将preorder_traversal拆解到一个构造方法和一个__next__方法中。用generator写起来明明更加直观

def preorder_generator(tree):
    """返回一个能够以前序遍历的次序遍历二叉树节点的generator。"""
    nodes = [tree]
    while len(nodes) > 0:
        node = nodes.pop()
        yield node.value
        if node.left is not None:
            nodes.append(node.right)
        if node.left is not None:
            nodes.append(node.left)

但是，很多语言并不支持generator。与之相比，iterator要亲民得多，更容易移植。例如，即使是Common Lisp这种一穷二白的语言，也可以实现和Python的iterator以及for类似的效果

(in-package #:cl-user)

(defpackage #:com.liutos.binary-tree
  (:use #:cl))

(in-package #:com.liutos.binary-tree)

(defclass preorder-iterator ()
  ((nodes
    :initform nil)
   (tree
    :initarg :tree))
  (:documentation "前序遍历二叉树的迭代器"))

(defmethod initialize-instance :after ((instance preorder-iterator) &key)
  (with-slots (nodes tree)
      instance
    (when tree
      (push tree nodes))))

(defgeneric next (iterator)
  (:documentation "返回迭代器的下一个值。"))

(define-condition stop-iteration (error)
  ()
  (:documentation "Python中StopIteration异常的等价物。"))

(defmethod next ((iterator preorder-iterator))
  (with-slots (nodes) iterator
    (when (null nodes)
      (error 'stop-iteration))

    (let ((node (pop nodes)))
      ;; 一个节点的结构为：(值 左子树 右子树)
      (when (third node)
        (push (third node) nodes))
      (when (second node)
        (push (second node) nodes))
      (first node))))

(defmacro for-in (var iterator &body forms)
  "将iterator中的值逐个绑定到变量var上，并执行forms中的表达式。"
  (let ((iter (gensym)))
    `(let ((,iter ,iterator))
       (handler-case
           (loop
              (let ((,var (next ,iter)))
                ,@forms))
         (stop-iteration (c)
           (declare (ignorable c)))))))

(defparameter *tree*
  '(4 (2 (1 nil nil) (3 nil nil)) (6 (5 nil nil) (7 nil nil))))

(defun test-preorder-iterator ()
  "测试前序遍历迭代器。"
  (for-in n (make-instance 'preorder-iterator
                           :tree *tree*)
    (format t "~D~C" n #\Tab)))

后记

中序遍历和后序遍历也可以写成迭代器，证明略。

当你SET的时候，Redis到底在SET些什么

2021-04-17T07:09:24.000Z

准备过互联网公司的服务端岗位面试的人，对Redis中的5种数据类型想必是如数家珍。而网上很多面试题里也会出现这道题目

随着行业曲率的增大，光是知道有这些数据类型已经不够了，还得知道同一个类型也有不同的底层数据结构。例如同样是string类型，不同内容或不同长度会采用不同的编码方式：

127.0.0.1:6379> SET key1 "1"
OK
127.0.0.1:6379> SET key2 "value"
OK
127.0.0.1:6379> SET key3 "Any sufficiently complicated C or Fortran program contains an ad hoc, informally-specified, bug-ridden, slow implementation of half of Common Lisp."
OK
127.0.0.1:6379> TYPE key1
string
127.0.0.1:6379> TYPE key2
string
127.0.0.1:6379> TYPE key3
string
127.0.0.1:6379> OBJECT ENCODING key1
"int"
127.0.0.1:6379> OBJECT ENCODING key2
"embstr"
127.0.0.1:6379> OBJECT ENCODING key3
"raw"

而hash类型也有两种底层实现

127.0.0.1:6379>  HSET myhash field1 "Hello"
(integer) 1
127.0.0.1:6379>  HSET myhash2 field1 "Any sufficiently complicated C or Fortran program contains an ad hoc, informally-specified, bug-ridden, slow implementation of half of Common Lisp."
(integer) 1
127.0.0.1:6379> OBJECT ENCODING myhash
"ziplist"
127.0.0.1:6379> OBJECT ENCODING myhash2
"hashtable"

不知道你是否曾经好奇过，上文中的key1、key2、key3、myhash，以及myhash2这些键，与它们各自的值（前三个为string，后两个为hash）之间的关系又是存储在什么数据结构中的呢？

答案在意料之外，情理之中：键与值的关系，也是存储在一张哈希表中的，并且正是上文中的hashtable。

求证的办法当然是阅读Redis的源代码。

Redis命令的派发逻辑

阅读Redis的源码是比较轻松愉快的，一是因为其源码由简单易懂的C语言编写，二是因为源码仓库的README.md中对内部实现做了一番高屋建瓴的介绍。在README.md的server.c一节中，道出了有关命令派发的两个关键点

call() is used in order to call a given command in the context of a given client.

The global variable redisCommandTable defines all the Redis commands, specifying the name of the command, the function implementing the command, the number of arguments required, and other properties of each command.

位于文件src/server.c中的变量redisCommandTable定义了所有可以在Redis中使用的命令——为什么一个C语言项目里要用camelCase这种格格不入的命名风格呢——它的元素的类型为struct redisCommand，其中：

name存放命令的名字；
proc存放实现命令的C函数的指针；

比如高频使用的GET命令在redisCommandTable中就是这样定义的

1
2
3

{"get",getCommand,2,
 "read-only fast @string",
 0,NULL,1,1,1,0,0,0},

身为一名老解释器爱好者，对这种套路的代码当然是不会陌生的。我也曾在写过的、跑不起来的玩具解释器上用过类似的手法

Redis收到一道需要执行的命令后，根据命令的名字用lookupCommand找到一个命令（是个struct redisCommand类型的结构体），然后call函数做的事情就是调用它的proc成员所指向的函数而已

1	c->cmd->proc(c);

那么接下来，就要看看SET命令对应的C函数究竟做了些什么了。

`SET`命令的实现

redisCommonTable中下标为2的元素正是SET命令的定义

/* Note that we can't flag set as fast, since it may perform an
 * implicit DEL of a large key. */
{"set",setCommand,-3,
 "write use-memory @string",
 0,NULL,1,1,1,0,0,0},

其中函数setCommand定义在文件t_string.c中，它根据参数中是否有传入NX、XX、EX等选项计算出一个flags后，便调用setGenericCommand——顾名思义，这是一个通用的SET命令，它同时被SET、SETNX、SETEX，以及PSETEX四个Redis命令的实现函数所共用。

setGenericCommand调用了genericSetKey，后者定义在文件db.c中。尽管该函数上方的注释写着

All the new keys in the database should be created via this interface.

但~~人生不如意事十之八九~~事实并非如此。例如在命令RPUSH的实现函数rpushCommand中，调用了pushGenericCommand，后者直接调用了dbAdd往Redis中存入键和列表对象的关系。

言归正传。根据键存在与否，genericSetKey会调用dbAdd或dbOverwrite。而在dbAdd中，最终调用了dictAdd将键与值存入数据库中。

/* Add an element to the target hash table */
int dictAdd(dict *d, void *key, void *val)
{
    dictEntry *entry = dictAddRaw(d,key,NULL);

    if (!entry) return DICT_ERR;
    dictSetVal(d, entry, val);
    return DICT_OK;
}

现在我们知道了，使用SET命令时传入的key和value，是存储在一个dict类型的数据结构中。

`HSET`命令的实现

依葫芦画瓢，Redis的HSET命令由位于文件t_hash.c中的函数hsetCommand实现，它会尝试转换要操作的hash值的编码方式。

1	hashTypeTryConversion(o,c->argv,2,c->argc-1);

如果hashTypeTryConversion发现要写入哈希表的任何一个键或者值的长度超过了server.hash_max_ziplist_value所规定的值，就会将hash类型的编码从ziplist转换为hashtable。server.hash_max_ziplist_value的值在文件config.c中通过宏设置，默认值为64——这正是上文中myhash2所对应的值的编码为hashtable的原因。

将思绪拉回到函数hsetCommand中。做完编码的转换后，它调用函数hashTypeSet，在编码为hashtable的世界线中，同样调用了dictAdd实现往哈希表中写入键值对。

殊途同归

结论

因此，在Redis中用以维持每一个键与其对应的值——这些值也许是string，也许是list，也许是hash——的关系的数据结构，与Redis中的一系列操作哈希表的命令——也许是HSET、也许HGET，也许是HDEL——所用的数据结构，不能说是毫不相关，起码是一模一样。

多重返回值的阵营九宫格

2021-03-14T07:52:34.000Z

通常在糊业务代码的时候，不管是函数、方法，还是宏，都只会有一个返回值。比如在C语言用于检查一个字符是否为阿拉伯数字的isdigit函数就只会返回是（1）或否（0）

#include 
#include 

int
main(int argc, char *argv[])
{
    char c = 'a';
    printf("isdigit('%c') is %d\n", c, isdigit(c));
    return 0;
}

但有时候如果一个函数、方法，或宏可以返回多个值的话会更加方便。例如，在Python中dict类型有一个实例方法get，它可以取得dict实例中与给定的键对应的值。但如果有一个键在字典中的值为None，那么光凭get的返回值无法准确判断这个键是否存在——除非你给它一个非None的默认值

# -*- coding: utf8 -*-
def test(d, key):
    print("d.get('{0}') is {1}\t'{0}' in d is {2}".format(key, d.get(key), key in d))

if __name__ == '__main__':
    d = {
        'foo': 'bar',
        'baz': None,
    }
    test(d, 'foo')
    test(d, 'baz')

发展了这么多年的编程语言，又怎么会连一次调用、多值返回这么简单的事情都做不到呢。事实上，有各种各样、各显神通的返回多个值的方法，我给其中的一些做了个分类

Lisp的`multiple-value-bind`

Common Lisp（简称为CL）的多重返回值当之无愧是其中最正统、最好用的实现方式。以它的内置函数truncate为例，它的第一个返回值为第一个参数除以第二个参数的商，第二个返回值为对应的余数

1
2
3

CL-USER> (truncate 10 3)
3
1

如果不加修饰地调用truncate，就像其它只返回一个值的函数一样，也只会拿到一个返回值

1
2
3

CL-USER> (let ((q (truncate 10 3)))
           (format t "q = ~D~%" q))
q = 3

除非用multiple-value-bind来捕获一个函数产生的所有返回值

CL-USER> (multiple-value-bind (q r)
             (truncate 10 3)
           (format t "q = ~D~8Tr = ~D~%" q r))
q = 3   r = 1

CL的方案的优点在于它十分灵活。即使将一个函数从返回单个值改为返回多个值，也不会导致原本调用该函数的位置要全部修改一遍——对修改封闭，对扩展开放（误）。

Go的多重返回值

踩在C语言肩膀上的Go也能够从函数中返回多个值。在io/ioutil包的官方文档中有大量的例子，比如用ReadAll方法从字符串衍生的流中读取全部内容，就会返回两个值

package main

import (
"fmt"
"io/ioutil"
"log"
"strings"
)

func main() {
s := "Hello, world!"
reader := strings.NewReader(s)
bytes, err := ioutil.ReadAll(reader)
if err != nil {
log.Fatal(err)
}
fmt.Printf("bytes is %s", bytes)
}

Go以这种方式取代了C语言中用返回值表达成功与否、再通过指针传出读到的数据的风格。由于这个模式在有用的Go程序中到处出现，因此Gopher们用的都是定制的键盘（误）

不同于前文的multiple-value-bind，如果一个函数或方法返回多个值，那么调用者必须捕获每一个值，否则编译无法通过

➜  try cat try_read_all_ignore_err.go
package main

import (
"fmt"
"io/ioutil"
"strings"
)

func main() {
s := "Hello, world!"
reader := strings.NewReader(s)
bytes := ioutil.ReadAll(reader)
fmt.Printf("bytes is %s", bytes)
}
➜  try go build try_read_all_ignore_err.go
# command-line-arguments
./try_read_all_ignore_err.go:12:8: assignment mismatch: 1 variable but ioutil.ReadAll returns 2 values

这一要求也是合理的，毕竟多重返回值机制主要用于向调用者传递出错原因——既然可能出错，那么就必须要检查一番。

Python和Rust的解构

就像CL的truncate函数一样，Python中的函数divmod也可以同时返回两个数相除的商和余数，并且咋看之下也是返回多个值的形式

# -*- coding: utf8 -*-
if __name__ == '__main__':
    q, r = divmod(10, 3)
    print('q = {}\tr = {}'.format(q, r))

但本质上，这是因为Python支持解构，同时divmod返回的是一个由商和余数组成的元组。这样的做法与CL的真·奥义·多重返回值的差异在于，如果只想要divmod的第一个值，那么等号左侧也要写成对应的结构

# -*- coding: utf8 -*-
if __name__ == '__main__':
    q, _ = divmod(10, 3)
    print('q = {}'.format(q))

在支持解构的语言中都可以模仿出多重返回值，例如Rust

fn divmod(a: u32, b: u32) -> (u32, u32) {
    (a / b, a % b)
}

fn main() {
    let (q, r) = divmod(10, 3);
    println!("q = {}\tr = {}", q, r);
}

Prolog的归一

到了Prolog这里，画风就有点不一样了。首先Prolog既没有函数，也没有方法，更没有宏。在Prolog中，像length/2和member/2这样的东西叫做functor，它们之于Prolog中的列表，就犹如CL的length和member之于列表、Python的len函数和in操作符之于列表，JavaScript的length属性和indexOf方法之于数组……

其次，Prolog并不“返回”一个functor的“调用结果”，它只是判断输入的查询是否成立，以及给出使查询成立的变量值。在第一个查询中，length/2的第二个参数为变量L，因此Prolog给出了使这个查询成立的L的值4；第二个查询中没有变量，Prolog只是简单地给出查询是否成立；第三个查询中，Prolog给出了四个能够使查询成立的变量X的值。

由于Prolog会给出查询中每一个变量的值，可以用这个特性来模拟多重返回值。例如，可以让Prolog一次性给出两个数字的和、差、积，和商

麻烦之处在于就算只想要得到两数之和，也必须用占位符填在后三个参数上：jjcc(10, 3, S, _, _, _)。

作弊的指针与全局变量

尽管在开篇的时候提到了C语言中的函数无法返回多个值，但如果像上文的Prolog那般允许修改参数的话，C语言也是可以做到的，谁让它有指针这个强力特性呢。例如，stat(2)函数就会将关于一个文件的信息填充到参数中所指向的结构体的内存中

#include 
#include 

int
main(int argc, char *argv[])
{
    char *path = "./try_stat.c";
    struct stat buf;
    stat(path, &buf);
    printf("inode's number of %s is %llu\n", path, buf.st_ino);
    return 0;
}

查看man 2 stat可以知道struct stat类型中有非常多的内容，这显然也是一种多重返回值。同样的手法，在Go中也可以运用，例如用于把从数据库中读取出来的行的数据写入目标数据结构的Scan方法。

最后，如果只要能让调用者感知就行，那么全局变量未尝不是一种通用的多重返回值机制。例如在C语言中的strtol函数，就会在无法转换出任何数字的时候返回0并设置errno，因此检查errno是必须的步骤

#include 
#include 
#include 

void try_conversion(const char *str)
{
    long num = strtol(str, NULL, 10);
    if (errno == EINVAL || errno == ERANGE)
    {
        char message[64];
        snprintf(message, sizeof(message), "strtol(\"%s\")", str);
        perror(message);
        return;
    }
    printf("strtol(\"%s\") is %ld\n", str, num);
}

int
main(int argc, char *argv[])
{
    try_conversion("233");
    try_conversion("0");
    try_conversion("lisp");
    return 0;
}

鉴于errno是一个全局变量，strtol的使用者完全有可能忘记要检查。相比之下，Go的strconv包的函数都将转换过程中的错误以第二个参数的形式返回给调用者，用起来更安全。

后记

按照《代码写得不好，不要总觉得是自己抽象得不好》这篇文章的说法，代码写成什么样子完全是由产品经理决定的。但产品经理又怎么会在意你用的技术是怎么实现多重返回值的呢。综上所述，这个特性没用（误）。

全文完。

终端看片指日可待

2021-02-27T06:54:55.000Z

序言

在旧文《如何写一个命令行的秒表》中，借助命令tput，我实现了“原地更新”所输出的时分秒的效果

其中用到的是ASCII转义序列\x1b[8D和\x1b[0K。除此之外，ASCII转义序列还有许多其它功能。例如，可以用来定制输出内容的前景色

将转义序列中的参数38改为48，可以定制输出内容的背景色

将打印内容改为两个空格，看起来就像是在一块黑色的画布上涂了一个红色的方块

既然如此，只要尺寸合适，就可以在终端打印出一张图片，只需要将每一个像素的颜色作为背景色，在坐标对应的行列上输出两个空格即可。如果能抹掉输出的内容并在同样的位置上打印一张不同的图片，甚至可以实现动画的效果。

百闻不如一见，下面我用Python演示一番。

把GIF装进终端

要想用前文的思路在终端中显示一张GIF图片，必须先得到GIF图片每一帧的每个像素的颜色才行。在Python中使用名为Pillow的库可以轻松地解析GIF文件，先安装这个库

➜  /tmp rmdir show_gif
➜  /tmp mkdir show_gif
➜  /tmp cd show_gif
➜  show_gif python3 -m venv ./venv
➜  show_gif . ./venv/bin/activate
(venv) ➜  show_gif pip install Pillow
Collecting Pillow
  Using cached Pillow-8.1.0-cp39-cp39-macosx_10_10_x86_64.whl (2.2 MB)
Installing collected packages: Pillow
Successfully installed Pillow-8.1.0
WARNING: You are using pip version 20.2.3; however, version 21.0.1 is available.
You should consider upgrading via the '/private/tmp/show_gif/venv/bin/python3 -m pip install --upgrade pip' command.

接着便可以让它读入并解析一张GIF图片

import sys

from PIL import Image, ImageSequence

if __name__ == '__main__':
    path = sys.argv[1]
    im = Image.open(path)
    for frame in ImageSequence.Iterator(im):
        pass

然后将每一帧都转换为RGB模式再遍历其每一个像素

import sys

from PIL import Image, ImageSequence

if __name__ == '__main__':
    path = sys.argv[1]
    im = Image.open(path)
    for frame in ImageSequence.Iterator(im):
        rgb_frame = frame.convert('RGB')
        pixels = rgb_frame.load()
        for y in range(0, rgb_frame.height):
            for x in range(0, rgb_frame.width):
                pass

调用Image类的实例方法load得到的是一个PixelAccess类的实例，它可以像二维数组一般用坐标获取每一个像素的颜色值，颜色值则是一个长度为3的tuple类型的值，其中依次是像素的三原色的分量。

从ANSI escape code词条的24-bit小节中得知，使用参数为48;2;的转义序列，再接上以分号分隔的三原色分量即可设置24位的背景色

import sys

from PIL import Image, ImageSequence

if __name__ == '__main__':
    path = sys.argv[1]
    im = Image.open(path)
    for frame in ImageSequence.Iterator(im):
        rgb_frame = frame.convert('RGB')
        pixels = rgb_frame.load()
        for y in range(0, rgb_frame.height):
            for x in range(0, rgb_frame.width):
                colors = pixels[x, y]
                print('\x1b[48;2;{};{};{}m  \x1b[0m'.format(*colors), end='')
            print('')

在每次二重循环遍历了所有像素后，还必须清除输出的内容，并将光标重置到左上角才能再次打印，这可以用ASCII转义序列来实现。查阅VT100 User Guide可以知道，用ED命令可以擦除显示的字符，对应的转义序列为\x1b[2J；用CUP命令可以移动光标的位置到左上角，对应的转义序列为\x1b[0;0H。在每次开始打印一帧图像前输出这两个转义序列即可

import sys

from PIL import Image, ImageSequence

if __name__ == '__main__':
    path = sys.argv[1]
    im = Image.open(path)
    for frame in ImageSequence.Iterator(im):
        rgb_frame = frame.convert('RGB')
        pixels = rgb_frame.load()
        print('\x1b[2J\x1b[0;0H', end='')
        for y in range(0, rgb_frame.height):
            for x in range(0, rgb_frame.width):
                colors = pixels[x, y]
                print('\x1b[48;2;{};{};{}m  \x1b[0m'.format(*colors), end='')
            print('')

最后，只需要在每次打印完一帧后，按GIF文件的要求睡眠一段时间即可。每一帧的展示时长可以从info属性的键duration中得到，单位是毫秒

import sys
import time

from PIL import Image, ImageSequence

if __name__ == '__main__':
    path = sys.argv[1]
    im = Image.open(path)
    for frame in ImageSequence.Iterator(im):
        rgb_frame = frame.convert('RGB')
        pixels = rgb_frame.load()
        print('\x1b[2J\x1b[0;0H', end='')
        for y in range(0, rgb_frame.height):
            for x in range(0, rgb_frame.width):
                colors = pixels[x, y]
                print('\x1b[48;2;{};{};{}m  \x1b[0m'.format(*colors), end='')
            print('')
        time.sleep(rgb_frame.info['duration'] / 1000)

现在可以看看效果了。我准备了一张测试用的GIF图片，宽度和高度均为47像素，共34帧

让它在终端中显示出来吧

一点微小的改进

你可能留意到了，前文的演示效果中有明显的闪烁，这是因为打印ASCII转义序列的速度不够快导致的。既然如此，可以将一整行的转义序列先生成出来，再一次性输出到终端。改动不复杂

import sys
import time

from PIL import Image, ImageSequence

if __name__ == '__main__':
    path = sys.argv[1]
    im = Image.open(path)
    for frame in ImageSequence.Iterator(im):
        rgb_frame = frame.convert('RGB')
        pixels = rgb_frame.load()
        print('\x1b[2J\x1b[0;0H', end='')
        for y in range(0, rgb_frame.height):
            last_colors = None
            line = ''
            for x in range(0, rgb_frame.width):
                colors = pixels[x, y]
                if colors != last_colors:
                    line += '\x1b[0m\x1b[48;2;{};{};{}m  '.format(*colors)
                else:
                    line += '  '
                last_colors = colors
            print('{}\x1b[0m'.format(line))
        time.sleep(rgb_frame.info['duration'] / 1000)

但效果却很显著

全文完

此数绵绵无绝期——欧拉计划第66题

2021-02-11T07:21:32.000Z

仅以此文膜拜八年前的自己

序言

欧拉计划（Project Euler）就像LeetCode，是一个编程答题的网站。不同于LeetCode的是，欧拉计划只要求用户提交最终答案即可（一般是一个数字），而不需要完整代码。因此，可以尽情地使用自己喜欢的编程语言——不少题目甚至光靠笔和纸便能解决。

欧拉计划的第66题非常有意思，它的题目很简单，就是要求找出在不大于1000的整数中，以哪一个数字为丢番图方程的系数，可以得到所有最小解中的最大值。

可以很容易地看出方程有一个直观的暴力算法：让y从1开始递增，对于每一个y，计算公式Dy^2+1的值。如果该值为平方数，那么它的平方根就是最小的x解。再依照这个算法求解所有D不大于1000的方程，便可以求出题目的答案。很容易用Python写出这个算法

# -*- coding: utf8 -*-
import math

def is_square(num: int) -> bool:
    return math.isqrt(num) ** 2 == num

def find_x(D: int) -> int:
    """
    求出给定D时，满足题目所给的丢番图方程的最小的x。
    """
    assert not is_square(D)
    y = 1
    while True:
        candidate = D * y * y + 1
        if is_square(candidate):
            return math.isqrt(candidate)
        y += 1

def solve_66(limit):
    """
    找出不大于limi的D中，使find_x的返回值最大的那一个数字。
    """
    max_D = None
    max_x = None
    D = 2
    while D <= limit:
        if is_square(D):
            D += 1
            continue
        x = find_x(D)
        if max_x is None or x > max_x:
            max_D = D
            max_x = x
        D += 1
    return max_D, max_x

if __name__ == '__main__':
    D, x = solve_66(7)
    print('D is {} and x is {}'.format(D, x))

但如果将上限limit提升为1000，这个算法在有生之年是算不出结果的。

要想解决这一题，需要借助数学的力量。

佩尔方程

八年前第一次做这一题的时候，经过一番搜索，我从这篇文章中知道了题目中的方程叫做佩尔方程。它有标准的解法，但需要用到连分数。那么什么是连分数呢？

连分数不是一种新的数系，只是小数的另一种写法。例如可以把分数45除以16写成下面的形式

就像定义递归的数据结构一样，可以给连分数一个递归的定义。连分数要么是一个整数，要么是一个整数加上另一个连分数的倒数。除了上面的形式，连分数也可以写成更节省篇幅的样子。比如把45除以16写成[2;1,4,3]，即把原本的式子中所有的整数部分按顺序写在一对方括号之间。这种记法，看起来就像是编程语言中的数组一般。

如果用数组[2;1,4,3]的不同前缀来构造分式，那么结果依次为2/1、3/1、14/5。它们是这个连分数的渐进连分数，而佩尔方程的一组解，就来自于渐进连分数的分子和分母。

以系数为7的佩尔方程为例，先计算出根号7的连分数，然后依次尝试它的渐进连分数。前三个分别为2/1、3/1、5/2，都不是方程的解。第四个渐进连分数8/3才是方程的解。如果继续提高连分数的精度，还会找到第二个解127/48。继续找，还有更多，而8则是其中最小的x。

所以，想要快速算出佩尔方程的解，最重要的是找到计算一个数的平方根的连分数的算法。

计算平方根的连分数的错误方法

要计算一个数字的连分数，最重要的便是要算出所有的整数部分（a0、a2、a2等）。它们都可以依据定义直接计算

推广到一半情况，如果用变量n存储开平方的数字，用numbers存储所有已知的整数，那么用Python可以写出下面的算法来计算出下一个整数

# 计算连分数数列的下一个数字
import math

def compute_next_integer_part(n, numbers):
    v = math.sqrt(n)
    for a in numbers:
        v = 1 / (v - a)
    return int(v)

if __name__ == '__main__':
    n = 14
    numbers = [3, 1, 2, 1]
    v = compute_next_integer_part(n, numbers)
    print('下一个数字为{}'.format(v))

遗憾的是，这个算法算出来的数字会因为计算上的精度误差而导致失之毫厘谬以千里。

计算平方根的连分数的正确方法

要想计算出正确的结果，就需要尽可能地消除在计算1 / (v - a)的时候引入的误差，因此必须把浮点数从分母中除去。

在这个网站中，作者以计算根号14的连分数为例，列出了一个表格

可以看到x1、x2，以及x3都是形如(sqrt(n)+a)/b这样的格式，这样的式子更利于控制误差。那么是否每一个待计算的x都符合这种格式呢？答案是肯定的，可以用数学归纳法予以证明（为了方便写公式，用LaTeX写好后截了图）

在这个证明过程中，还得到了分子中的a以及分母中的b的递推公式，现在可以写出正确的计算连分数整数部分的代码了。

用Common Lisp实现上述算法

为了在实现这个算法的同时还要写出优雅的代码，我会用上Common Lisp的面向对象特性。首先是定义一个类来表示一个可以不断提高精度的连分数

(defpackage #:com.liutos.cf
  (:use #:cl))

(in-package #:com.liutos.cf)

(defclass  ()
  ((a
    :documentation "数学归纳法中、分子中与平方根相加的数"
    :initform 0)
   (b
    :documentation "数学归纳法中的分母"
    :initform 1)
   (numbers
    :documentation "连分数中的整数部分依次组成的数组。"
    :initform nil)
   (origin
    :documentation "被开平方的数字"
    :initarg :origin))
  (:documentation "表示整数ORIGIN的平方根的连分数。"))

接着再定义这个类需要实现的“接口”

(defgeneric advance (cf)
  (:documentation "让连分数CF提高到下一个精度。"))

(defgeneric into-rational (cf)
  (:documentation "将连分数CF转换为有理数类型的值。"))

最后来实现上述两个接口

(defmethod advance ((cf ))
  "根据递推公式计算出下一批a、b，以及连分数的整数部分。"
  (let* ((a (slot-value cf 'a))
         (b (slot-value cf 'b))
         (n (slot-value cf 'origin))
         (m (truncate (+ (sqrt n) a) b)))
    (let ((a (- (* b m) a))
          (b (/ (- n (expt (- a (* b m)) 2)) b)))
      (setf (slot-value cf 'a) a
            (slot-value cf 'b) b
            (slot-value cf 'numbers) (append (slot-value cf 'numbers) (list m))))
    (values)))

(defmethod into-rational ((cf ))
  (let* ((numbers (reverse (slot-value cf 'numbers)))
         (v (first numbers)))
    (dolist (n (rest numbers))
      (setf v
            (+ n (/ 1 v))))
    v))

在实现into-rational方法上，Common Lisp的有理数数值类型给我带来了极大的便利，它使我不必担心计算(/ 1 v)的时候会引入误差，代码写起来简单直白。

解题

乘胜追击，用Common Lisp解答第66题

(defun find-min-x (D)
  (let ((cf (make-instance ' :origin D)))
    (loop
       (advance cf)
       (let* ((ratio (into-rational cf))
              (x (numerator ratio))
              (y (denominator ratio)))
         (when (= (- (* x x) (* D y y)) 1)
           (return-from find-min-x x))))))

(defun square-p (n)
  (let ((rt (sqrt n)))
    (= rt (truncate rt))))

(defun pro66 (&optional (bnd 1000))
  (let ((target-d)
(max-x 0))
    (loop :for i :from 2 :to bnd
       :when (not (square-p i))
       :do (let ((x (find-min-x i)))
     (if (> x max-x)
 (setf target-d i
       max-x x))))
    (values target-d max-x)))

答案的D是多少就不说了，不过作为答案的x是16421658242965910275055840472270471049。有兴趣的读者可以试一下暴力解法要花多久才能算到这个数字。

全文完。

format，不只是格式化

2021-01-29T15:05:51.000Z

《实战Common Lisp》系列主要讲述在使用Common Lisp时能派上用场的小函数，希望能为Common Lisp的复兴做一些微小的贡献。MAKE COMMON LISP GREAT AGAIN。

序言

写了一段时间的Python后，总觉得它跟Common Lisp（下文简称CL）有亿点点像。例如，Python和CL都支持可变数量的函数参数。在Python中写作

1 2	def foo(* args): print(args)

而在CL中则写成

1 2	(defun foo (&rest args) (print args))

Python的语法更紧凑，而CL的语法表意更清晰。此外，它们也都支持关键字参数。在Python中写成

1 2	def bar(*, a=None, b=None): print('a={}\tb={}'.format(a, b))

而在CL中则是

1 2	(defun bar (&key (a nil) (b nil)) (format t "a=~A~8Tb=~A~%" a b))

尽管CL的&key仍然更清晰，但声明参数默认值的语法确实是Python更胜一筹。

细心的读者可能发现了，在Python中有一个叫做format的方法（属于字符串类），而在CL则有一个叫做format的函数。并且，从上面的例子来看，它们都负责生成格式化的字符串，那么它们有相似之处吗？

答案是否定的，CL的format简直就是格式化打印界的一股泥石流。

`format`的基本用法

不妨从上面的示例代码入手介绍CL中的format（下文在不引起歧义的情况下，简称为format）的基本用法。首先，它需要至少两个参数：

第一个参数控制了format将会把格式化后的字符串打印到什么地方。t表示打印到标准输出；
第二个参数则是本文的主角，名为控制字符串（control-string）。它指导format如何格式化。

听起来很神秘，但其实跟C语言的fprintf也没什么差别。

在控制字符串中，一般会有许多像占位符一般的命令（directive）。正如Python的format方法中，有各式各样的format_spec能够格式化对应类型的数据，控制字符串中的命令也有很多种，常见的有：

打印二进制数字的~B，例如(format t "~B" 5)会打印出101；
打印八进制数字的~O，例如(format t "~O" 8)会打印出10；
打印十进制数字的~D；
打印十六进制数字的~X，例如(format t "~X" 161)会打印出A1；
打印任意一种类型的~A，一般打印字符串的时候会用到。

另外，format的命令也支持参数。在Python中，可以用下列代码打印右对齐的、左侧填充字符0的、二进制形式的数字5

1	print('{:0>8b}'.format(5))

format函数也可以做到同样的事情

1	(format t "~8,'0B" 5)

到这里为止，你可能会觉得format的控制字符串，不过就是将花括号去掉、冒号换成波浪线，以及参数语法不一样的format方法的翻版罢了。

接下来，让我们进入format的黑科技领域。

`format`的高级用法

进制转换

前面列举了打印二、八、十，以及十六进制的命令，但format还支持其它的进制。使用命令~R搭配参数，format可以打印数字从2到36进制的所有形态。

(format t "~3R~%" 36)   ; 以 3进制打印数字36，结果为1100
(format t "~5R~%" 36)   ; 以 5进制打印数字36，结果为 121
(format t "~7R~%" 36)   ; 以 7进制打印数字36，结果为  51
(format t "~11R~%" 36)  ; 以11进制打印数字36，结果为  33
(format t "~13R~%" 36)  ; 以13进制打印数字36，结果为  2A
(format t "~17R~%" 36)  ; 以17进制打印数字36，结果为  22
(format t "~19R~%" 36)  ; 以19进制打印数字36，结果为  1H
(format t "~23R~%" 36)  ; 以23进制打印数字36，结果为  1D
(format t "~29R~%" 36)  ; 以29进制打印数字36，结果为  17
(format t "~31R~%" 36)  ; 以31进制打印数字36，结果为  15

之所以最大为36进制，是因为十个阿拉伯数字，加上二十六个英文字母正好是三十六个。那如果不给~R加任何参数，会使用0进制吗？非也，format会把数字打印成英文单词

1	(format t "~R~%" 123) ; 打印出one hundred twenty-three

甚至可以让format打印罗马数字，只要加上@这个修饰符即可

1	(format t "~@R~%" 123) ; 打印出CXXIII

天晓得为什么要内置这么冷门的功能。

大小写转换

你，作为一名细心的读者，可能留意到了，format的~X只能打印出大写字母，而在Python的format方法中，{:x}可以输出小写字母的十六进制数字。即使你在format函数中使用~x也是无效的，因为命令是大小写不敏感的（case insensitive）。

那要怎么实现打印小写字母的十六进制数字呢？答案是使用新的命令~(，以及它配套的命令~)

1	(format t "~(~X~)~%" 26) ; 打印1a

配合:和@修饰符，一共可以实现四种大小写风格

(format t "~(hello world~)~%")   ; 打印hello world
(format t "~:(hello world~)~%")  ; 打印Hello World
(format t "~@(hello world~)~%")  ; 打印Hello world
(format t "~:@(hello world~)~%") ; 打印HELLO WORLD

对齐控制

在Python的format方法中，可以控制打印出的内容的宽度，这一点在“format的基本用法”中已经演示过了。如果设置的最小宽度（在上面的例子中，是8）超过了打印的内容所占据的宽度（在上面的例子中，是3），那么还可以控制其采用左对齐、右对齐，还是居中对齐。

在CL的format函数中，不管是~B、~D、~O，还是~X，都没有控制对齐方式的选项，数字总是右对齐。要控制对齐方式，需要用到~<和它配套的~>。例如，下面的CL代码可以让数字在八个宽度中左对齐

1	(format t "\|~8<~B~;~>\|" 5)

打印内容为|101 |。~<跟前面提到的其它命令不一样，它不消耗控制字符串之后的参数，它只控制~<和~>之间的字符串的布局。这意味着，即使~<和~>之间是字符串常量，它也可以起作用。

1	(format t "\|~8,,,'-<~;hello~>\|" 5)

上面的代码运行后会打印出|---hello|：8表示用于打印的最小宽度；三个逗号（,）之间为空，表示忽略~<的第二和第三个参数；第四个参数控制着打印结果中用于填充的字符，由于-不是数字，因此需要加上单引号前缀；~;是内部的分隔符，由于它的存在，hello成了最右侧的字符串，因此会被右对齐。

如果~<和~>之间的内容被~;分隔成了三部分，还可以实现左对齐、居中对齐，以及右对齐的效果

1	(format t "\|~24\|") ; 打印出\|left middle right\|

跳转

通常情况下，控制字符串中的命令会消耗参数，比如~B和~D等命令。也有像~<这样不消耗参数的命令。但有的命令甚至可以做到“一参多用”，那就是~*。比如，给~*加上冒号修饰，就可以让上一个被消耗的参数重新被消耗一遍

1	(format t "~8D~:*~8D~8D~%" 1 2) ; 打印出 1 1 2

在~8D消耗了参数1之后，~:*让下一个被消耗的参数重新指向了1，因此第二个~8D拿到的参数仍然是1，最后一个拿到了2。尽管控制字符串中看起来有三个~D命令而参数只有两个，却依然可以正常打印。

在format的文档中一个不错的例子，就是让~*和~P搭配使用。~P可以根据它对应的参数是否大于1，来打印出字母s或者什么都不打印。配合~:*就可以实现根据参数打印出单词的单数或复数形式的功能

1 2	(format t "~D dog~:~P~%" 1) ; 打印出1 dog (format t "~D dog~:~P~%" 2) ; 打印出2 dogs

甚至你可以组合一下前面的毕生所学

1	(format t "~@(~R dog~:*~P~)~%" 2) ; 打印出Two dogs

条件打印

命令~[和~]也是成对出现的，它们的作用是选择性打印，不过比起编程语言中的if，更像是取数组某个下标的元素

1
2
3

(format t "~[~;one~;two~;three~]~%" 1) ; 打印one
(format t "~[~;one~;two~;three~]~%" 2) ; 打印two
(format t "~[~;one~;two~;three~]~%" 3) ; 打印three

但这个特性还挺鸡肋的。想想，你肯定不会无缘无故传入一个数字来作为下标，而这个作为下标的数字很可能本身就是通过position之类的函数计算出来的，而position就要求传入待查找的item和整个列表sequence，而为了用上~[你还得把列表中的每个元素硬编码到控制字符串中，颇有南辕北辙的味道。

给它加上冒号修饰符之后倒是有点用处，比如可以将CL中的真（NIL以外的所有对象）和假（NIL）打印成单词true和false

1	(format t "~:[false~;true~]" nil) ; 打印false

循环打印

圆括号和方括号都用了，又怎么能少了花括号呢。没错，~{也是一个命令，它的作用是遍历列表。例如，想要打印出一个列表中的每个元素，并且两两之间用逗号和空格分开的话，可以用下列代码

1	(format t "~{~D~^, ~}" '(1 2 3)) ; 打印出1, 2, 3

~{和~}之间也可以有不止一个命令，例如下列代码中每次会消耗列表中的两个元素

1	(format t "{~{\"~A\": ~D~^, ~}}" '(:a 3 :b 2 :c 1))

打印结果为{"A": 3, "B": 2, "C": 1}。如果把这两个format表达式拆成用循环写的、不使用format的等价形式，大约是下面这样子

; 与(format t "~{~D~^, ~}" '(1 2 3))等价
(progn
  (do ((lst '(1 2 3) (cdr lst)))
      ((null lst))
    (let ((e (car lst)))
      (princ e)
      (when (cdr lst)
        (princ ", "))))
  (princ #\Newline))

; 与(format t "{~{\"~A\": ~D~^, ~}}" '(:a 3 :b 2 :c 1))等价
(progn
  (princ "{")
  (do ((lst '(:c 3 :b 2 :a 1) (cddr lst)))
      ((null lst))
    (let ((key (car lst))
          (val (cadr lst)))
      (princ "\"")
      (princ key)
      (princ "\": ")
      (princ val)
      (when (cddr lst)
        (princ ", "))))
  (princ "}")
  (princ #\Newline))

这么看来，~{确实可以让使用者写出更紧凑的代码。

参数化参数

在前面的例子中，尽管用~R搭配不同的参数可以将数字打印成不同进制的形式，但毕竟这个参数是固化在控制字符串中的，局限性很大。例如，如果我想要定义一个函数print-x-in-base-y，使得参数x可以打印为y进程的形式，那么也许会这么写

1
2
3

(defun print-x-in-base-y (x y)
  (let ((control-string (format nil "~~~DR" y)))
    (format t control-string x)))

但format的灵活性，允许使用者将命令的前缀参数也放到控制字符串之后的列表中，因此可以写成如下更简练的实现

1 2	(defun print-x-in-base-y (x y) (format t "~VR" y x))

而且不只一个，你可以把所有参数都写成参数的形式

(defun print-x-in-base-y (x
                          &optional y
                          &rest args
                          &key mincol padchar commachar commainterval)
  (declare (ignorable args))
  (format t "~V,V,V,V,VR"
          y mincol padchar commachar commainterval x))

恭喜你重新发明了~R，而且还不支持:和@修饰符。

自定义命令

要在CL中打印形如2021-01-29 22:43这样的日期和时间字符串，是一件比较麻烦的事情

(multiple-value-bind (sec min hour date mon year)
    (decode-universal-time (get-universal-time))
  (declare (ignorable sec))
  (format t "~4D-~2,'0D-~2,'0D ~2,'0D:~2,'0D~%"
          year mon date hour min))

谁让CL没有内置像Python的datetime模块这般完善的功能呢。不过，借助format的~/命令，我们可以在控制字符串中写上要调用的自定义函数，来深度定制打印出来的内容。以打印上述格式的日期和时间为例，首先定义一个后续要用的自定义函数

(defun yyyy-mm-dd-HH-MM (dest arg is-colon-p is-at-p &rest args)
  (declare (ignorable args is-at-p is-colon-p))
  (multiple-value-bind (sec min hour date mon year)
      (decode-universal-time arg)
    (declare (ignorable sec))
    (format dest "~4D-~2,'0D-~2,'0D ~2,'0D:~2,'0D~%"
            year mon date hour min)))

然后便可以直接在控制字符串中使用它的名字

1	(format t "~/yyyy-mm-dd-HH-MM/" (get-universal-time))

在我的机器上运行的时候，打印内容为2021-01-29 22:51。

后记

format可以做的事情还有很多，CL的HyperSpec中有关于format函数的详细介绍，CL爱好者一定不容错过。

最后，其实Python跟CL并不怎么像。每每看到Python中的__eq__、__ge__，以及__len__等方法的巧妙运用时，身为一名Common Lisp爱好者，我都会流露出羡慕的神情。纵然CL被称为可扩展的编程语言，这些平凡的功能却依旧无法方便地做到呢。

年轻人的第一个VSCode扩展

2021-01-02T08:18:34.000Z

序言

入坑VS Code前，我已经是一名久经考验的Emacs老用户了，因此开始正式使用VS Code后，我第一时间启用了它的Emacs Keymap。但不久我便发现，这套键映射缺少一个重要的快捷键——ctrl-l。

在Emacs中，ctrl-l对应的命令是recenter-top-bottom，它用于将光标所在的行轮替地滚动到可视区域（即Emacs中的window）的中间、顶部，以及底部（如下图所示）

这是我高频使用的一个功能，尤其是跳转到函数的定义的首行后，我习惯于连按两次，将其滚动到window的顶部以便在一屏中看到尽量多的内容。

为了避免重复发明轮子，我先搜索了一番，找到了一个宣称实现了该功能的扩展Recenter Top Bottom。可惜的是，安装后并不生效。

难道只能委屈自己用鼠标小心翼翼地将光标所在行滚到顶部了吗？当然不是。既然没有开箱即用的，那便自己写一个VS Code的扩展实现这个功能吧。

年轻人的第一个VS Code扩展

创建VS Code扩展的项目

要想入门VS Code扩展的开发，官方便提供了一份不错的教程。一个扩展有许多的“八股文”代码，可以用yo和generator-code来快速生成

1 2	npm install -g yo generator-code yo code

到这里，便得到了一个名为helloworld的目录了。用VS Code打开它，接下来要在其中大展身手。

实现将光标所在行垂直居中的功能

VS Code扩展的核心逻辑定义在文件src/extension.ts中。在yo生成的示例代码中，用registerCommand注册了一个名为helloworld.helloWorld的命令，其逻辑是简单地在右下角弹出一句Hello VS Code from HelloWorld!。这个回调函数，便是业务逻辑的落脚点。

要想实现将光标所在行滚动到中间的功能，首先要知道VS Code为开发者提供了哪些支持。在摸索了一通从VS Code的API文档后，我有了以下的线索：

通过vscode.window.activeTextEditor可以取得当前聚焦的编辑器——其值可能为空（undefined）；
TextEditor实例的属性.selection.active可以取得当前光标的位置；
TextEditor实例有一个方法revealRange可以滚动文本来改变展示的范围，它需要一个vscode.Range类的实例，以及一个vscode.TextEditorRevealType类型的枚举值；
vscode.TextEditorRevealType.InCenter的效果是将所给定的范围展示在中间，vscode.TextEditorRevealType.AtTop则是置顶。

有了这些知识储备，实现这样的一个回调函数便是信手拈来的事情了

function recenterTop() {
  const editor = vscode.window.activeTextEditor;
  if (!editor) {
    return;
  }
  const cursorPosition = editor.selection.active;
  editor.revealRange(new vscode.Range(cursorPosition, cursorPosition), vscode.TextEditorRevealType.InCenter);
}

由于暂时没有配置该命令的快捷键，只能用VS Code的命令面板来调用

实现将光标所在行置顶的功能

接下来我将实现连续调用两次helloworld.helloWorld命令，把光标所在行滚动到顶部的效果。在Emacs中，可以很轻松地知道一个命令是否被连续运行——Emacs有一个名为last-command的变量存储着上一个命令的名称，只需要检查其是否等于recenter-top-bottom即可。但VS Code没有暴露这么强大的功能，只能另辟蹊径。

我的策略是，如果调用helloworld.helloWorld时光标的位置，与上一次调用该命令时的位置相同，就认为是连续调用。为此，需要两个在函数recenterTop之外定义的变量：

previousPosition负责记录上一次调用recenterTop时光标的位置，它的初始值为null；
revealType存储着上一次调整展示范围时传递给TextEditor实例的revealRange方法的第二个参数的值，它的初始值也为null。

我的目标是尽量模拟Emacs中的recenter-top-bottom所具备的、交替使用居中、置顶效果的特点，因此：

如果revealType为null，意味着这是第一次调用recenterTop，那么效果便是居中。否则；
如果这一次与上一次的光标位置不同，意味着在上一次调用recenterTop后调用过其它命令，效果依然是居中。否则；
如果revealType已经是居中了，就改为置顶。否则；
将revealType改为居中。

Talk is cheap. Show me the code.

let previousPosition: null|vscode.Position = null;
let revealType: null|vscode.TextEditorRevealType = null;

function recenterTop() {
  const editor = vscode.window.activeTextEditor;
  if (!editor) {
    return;
  }
  const cursorPosition = editor.selection.active;
  if (!revealType) {
    revealType = vscode.TextEditorRevealType.InCenter;
  } else if (previousPosition && !cursorPosition.isEqual(previousPosition)) {
    revealType = vscode.TextEditorRevealType.InCenter;
  } else if (revealType === vscode.TextEditorRevealType.InCenter) {
    revealType = vscode.TextEditorRevealType.AtTop;
  } else {
    revealType = vscode.TextEditorRevealType.InCenter;
  }
  previousPosition = cursorPosition;
  editor.revealRange(new vscode.Range(cursorPosition, cursorPosition), revealType);
}

定义快捷键

通过命令面板来使用不是我的最终目标，通过快捷键才是。根据VS Code的文档可以知道，只要在package.json的contributes对象中，新增名为keybindings的属性，并定义命令及按键序列即可。

{
  // 此处省略其它不必要的属性
  "contributes": {
    "keybindings":{ // 新增属性
      "command": "helloworld.helloWorld",
      "key": "ctrl+l"
    }
  }
}

后记

如果看过我之前的文章《手指疼，写点代码缓解一下》的读者应当会记得，我已经从Emacs Keymap“叛逃”到了Vim Keymap了。所以，我并没有真正用上上述的VS Code扩展。相反，目前高频使用的是Vim Keymap内置的z-.以及z-↵了——前者用于垂直居中，后者用于置顶。

爱护手指，从使用Vim Keymap做起。

自己动手丰衣足食——用Hammerspoon控制Emacs的窗口

2020-12-20T13:00:07.000Z

有一天，我用Homebrew安装了一些软件——因为已经是一个月前的事情了，所以已经记不清是安装了什么。安装后并没有立即出现什么问题，只是又过了两天我重新启动电脑后，发现同样是由Homebrew安装的Emacs不由分说地无法启动了。这下可麻烦了，毕竟我是org-mode的重度使用者，还需要偶尔用SLIME写点Common Lisp的代码，而它们都运行在Emacs中。

直觉告诉我，也许重新安装一下Emacs，一切就可以恢复正常。重装了Emacs后，又遇到了别的问题——用BetterTouchTools在Touch Bar中添加的按钮，无法在Emacs已经启动的情况下，切换到它的窗口上。

非要说，问题其实也不大，毕竟很多时候是将MacBook Pro合上盖子当主机用的，Touch Bar在工作时的使用频率并不高。此外，糊Node.js等语言的代码时也用不到Emacs——还是VSCode更合适。

但这就是令人不爽，因此我决定要解决它——用Hammerspoon。

Hammerspoon是什么？

Hammerspoon的官网很好地说明了这款工具的定位和原理

This is a tool for powerful automation of OS X. At its core, Hammerspoon is just a bridge between the operating system and a Lua scripting engine. What gives Hammerspoon its power is a set of extensions that expose specific pieces of system functionality, to the user.

它运行在OS X上——现在应该叫macOS；
它是用来自动化操作的——就像系统内置的Automator或第三方的Alfred Workflow那样；
它的原理是将操作系统的功能封装成了可以用Lua代码调用的模块；

例如下面的代码

1
2
3

hs.hotkey.bind({"cmd", "alt", "ctrl"}, "E", function()
  hs.alert.show("Hello World!")
end)

就可以让使用者在按下组合键⌘⌥⌃e的时候，在屏幕正中间显示Hello World!这段文本

为什么用Hammerspoon？

Hammerspoon正好可以解决我的问题，它的hs.window模块既可以让使用者遍历所有打开的窗口（用hs.window.allWindows函数），也可以聚焦到指定的窗口上（用focus方法）。有了它们，将Emacs调到最前面（front-most）来也就是水到渠成的事情了：

调用函数hs.window.allWindows函数，获得所有窗口的列表；
逐个检查列表中的窗口对象，如果属于Emacs的，就调用窗口的方法focus，并跳出循环。

剩下的两个问题便是：

Emacs的bundle ID是什么；
如何知道一个窗口对象的bundle ID。

Emacs的bundle ID

Bundle ID可以在macOS中独一无二地标识一个应用。要想知道Emacs的bundle ID是什么，只需要打开文件/Applications/Emacs.app/Contents/Info.plist，看看其中键为CFBundleIdentifier的值即可。

➜  Contents grep -A 1 'CFBundleIdentifier' Info.plist
CFBundleIdentifier
org.gnu.Emacs
➜  Contents

可以看到，Emacs的bundle ID是org.gnu.Emacs。

来点Lua代码吧

有了Emacs的bundle ID，接下来就可以在Hammerspoon中定义快捷键了。由于最后会通过Touch Bar上的按钮来触发这组快捷键，复杂点也不要紧，因此我直接沿用了Hammerspoon的入门指引中作为例子的⌘⌥⌃w

1 2	hs.hotkey.bind({"cmd", "alt", "ctrl"}, "W", function() end)

为了在一个循环中逐个遍历窗口对象，将hs.window.allWindows的返回值保存到一个局部变量中

1
2
3

hs.hotkey.bind({"cmd", "alt", "ctrl"}, "W", function()
      local windows = hs.window.allWindows()
end)

照着简书上的这篇文章，依葫芦画瓢地用for和pairs来遍历变量windows

hs.hotkey.bind({"cmd", "alt", "ctrl"}, "W", function()
      local windows = hs.window.allWindows()
      -- 在Lua中遍历表的方法：https://www.jianshu.com/p/de5a4b132918
      for _, win in pairs(windows) do
      end
end)

窗口自身没有bundle ID，为此需要先获取窗口所属的应用。查看文档可以知道，有一个application方法正是用来获取应用对象的

hs.hotkey.bind({"cmd", "alt", "ctrl"}, "W", function()
      local windows = hs.window.allWindows()
      -- 在Lua中遍历表的方法：https://www.jianshu.com/p/de5a4b132918
      for _, win in pairs(windows) do
         local app = win:application()
      end
end)

调用allWindows时使用的是英文句号（.），调用application则是用冒号（:），这正是Lua中调用函数与方法时语法上的差异。

再用应用的bundleID方法获得它的bundle ID

hs.hotkey.bind({"cmd", "alt", "ctrl"}, "W", function()
      local windows = hs.window.allWindows()
      -- 在Lua中遍历表的方法：https://www.jianshu.com/p/de5a4b132918
      for _, win in pairs(windows) do
         local app = win:application()
         local bundleID = app:bundleID()
      end
end)

现在，只要变量bundleID等于Emacs的bundle ID就可以聚焦到当前遍历的窗口上了

hs.hotkey.bind({"cmd", "alt", "ctrl"}, "W", function()
      local windows = hs.window.allWindows()
      -- 在Lua中遍历表的方法：https://www.jianshu.com/p/de5a4b132918
      for _, win in pairs(windows) do
         local app = win:application()
         local bundleID = app:bundleID()
         if bundleID == "org.gnu.Emacs" then
            win:focus()
         end
      end
end)

让Touch Bar按钮触发这一切

只需要在BetterTouchTools中配置一下即可

这个方法比此前唤起/Applications/Emacs.app的方式更好，因为它只依赖于Emacs逻辑上亘古不变的东西——bundle ID，而不依赖于其物理上的安装位置。

一箭双雕——org-mode中的ID和CUSTOM_ID字段

2020-11-18T13:44:36.000Z

“实战Elisp”系列旨在讲述我使用Elisp定制Emacs的经验，抛砖引玉，还请广大Emacs同好不吝赐教——如果真的有广大Emacs用户的话，哈哈哈。

在org-mode中，一个条目（entry）可以设置多个属性（Properties）。有的属性是org-mode内置的，有它们的特殊用途。有的属性是自定义的，用在一些插件或仅仅用于记录信息。CUSTOM_ID属于前者，而ID属性后者。

CUSTOM_ID

CUSTOM_ID用于跳转。org-mode支持丰富的外部链接格式，其中之一便是链接到指定.org文件的指定CUSTOM_ID的条目。

比如在一个.org文件中有file:/Users/liutos/Dropbox/gtd/roles/writer.org::#d1bdc978-a8ce-4266-9ffa-b6041f818431这么一段文本，那么当光标置于这个文本中时，按下快捷键C-c C-o，Emacs便会打开文件/Users/liutos/Dropbox/gtd/roles/writer.org，并将光标对应的条目上。

ID

ID用于联系两个条目。一个名叫org-edna的第三方插件能够实现两个条目间的依赖，其中一个要素便是条目的ID属性。

比如我有一个讲解Ada语言的任务（以一个条目的形式存在），同时也有一个学习Ada语言的任务（另一个条目）。显然，必须先学习一番才能讲给他人听，所以第一个条目依赖于第二个条目，于是我先给学习Ada语言的条目设置一个ID属性，值为905fc2f4-4e28-4966-84fa-84c9e6bae96c，然后再为讲解Ada语言的条目中设置一个BLOCKER属性，值为ids(905fc2f4-4e28-4966-84fa-84c9e6bae96c)。如此一来，当讲解Ada语言的条目出现在*Org Agenda*中时，Emacs会将其置灰显示，代表它处于阻塞的状态，必须先处理它的依赖才行。

自动填充CUSTOM_ID和ID

建立依赖和跳转都是很常用的功能，因此我会给每一个条目都设置CUSTOM_ID和ID属性。为了免除每次都手动设置的麻烦，我用org-mode的capture-template特性来实现自动填充。

capture-template是org-mode的又一项利器，用于生成条目间共性的内容，比如行首的星号、关键字，以及写入到哪一个文件的哪一个层级中。org-mode的官网便有一个例子

(setq org-capture-templates
      '(("t" "Todo" entry (file+headline "~/org/gtd.org" "Tasks")
         "* TODO %?\n  %i\n  %a")
        ("j" "Journal" entry (file+datetree "~/org/journal.org")
         "* %?\nEntered on %U\n  %i\n  %a")))

在capture-template中除了可以用预置的占位符（比如上文的%U、%i，以及%a），还可以调用任意的Elisp函数——这正适合填充ID和CUSTOM_ID这类不重复，并且有一定的格式要求的属性。ID属性的值可以用来自于第三方插件uuidgen的uuidgen-4函数来生成

1
2
3

(setq org-capture-templates
      '(("t" "Todo" entry (file+headline "~/org/gtd.org" "Tasks")
         "* TODO %?  :PROPERTIES:\n  :CUSTOM_ID: %(uuidgen-4)\n  :ID: %(uuidgen-4)\n  :END:")))

美中不足的是，CUSTOM_ID和ID的值是不同的，因为uuidgen-4每次都会返回不同的字符串。有没有什么办法能够让它们一样的呢？答案是肯定的。

一式两份

既然两次调用uuidgen-4的结果不同，那么就将第一次调用后的结果保存起来，然后重复使用即可。思路很简单，实现代码也很直白

(let (lt-org-capture--uuid)
  (defun lt-org-capture-uuidgen ()
    "生成一个UUID并填充到词法作用域的变量中。"
    (setf lt-org-capture--uuid (uuidgen-4))
    lt-org-capture--uuid)
  (defun lt-org-capture-uuidclr ()
    "返回生成好的UUID并清空它。"
    lt-org-capture--uuid))

capture-template也是水到渠成的

1
2
3

(setq org-capture-templates
      '(("t" "Todo" entry (file+headline "~/org/gtd.org" "Tasks")
         "* TODO %?  :PROPERTIES:\n  :CUSTOM_ID: %(lt-org-capture-uuidgen)\n  :ID: %(lt-org-capture-uuidclr)\n  :END:")))

后记

在上面的函数定义中，我试图利用词法作用域特性，使得lt-org-capture--uuid只能被lt-org-capture-uuidgen和lt-org-capture-uuidclr读写。遗憾的是，Elisp并不支持词法作用域，lt-org-capture--uuid实际上是一个全局变量——完全可以用C-h v来审视它。

全文完。

小打小闹写点bug

在CommonLisp中支持JSON语法

在 Lisp 中使用 reader macro 支持 JSON 语法

什么是 reader macro？

支持 JSON 语法后有什么效果？

如何用 reader macro 解析 JSON？

尾声

使用 call/cc 实现计数循环

使用 call/cc 实现计数循环

什么是计数循环

拆开循环计数的语法糖

Common Lisp 中的 go 与续延

用 call/cc 重新实现计数循环

后记

如何在CommonLisp中解析命令行参数

clingon

子命令

选项与参数

选项名称

必要性与默认值

可多次使用的选项

信号选项

选择型选项

自己动手打印整数

为什么管Java叫单派发以及什么是多派发

Java 的 single dispatch

什么是 multiple dispatch？

后记

直观地了解自己每天在吃上面的开销

如何运用gnuplot

用ledger提取开销记录

用csvsql聚合数据

用gnuplot读取数据并绘图

想要按周统计怎么办

想要同时查看两年的图形怎么办

后记

git-log很好，你也可以写一个

序言

自己动手写一个git-log

解析commit对象

遍历commit组成的有向无环图——大根堆

真假美猴王对比

这方面Python还是比Lisp略逊一筹

序言

Python 的不足

Common Lisp 的优越性

题外话

屠龙术——如何运用整洁架构

序言

什么是整洁架构

如何应用整洁架构

实际项目的例子

从架构理念到具体决策

如何安排代码目录结构

nest/app/entity/目录

nest/app/use_case/目录

其它目录

如何往Use Cases层传入数据

在哪一层维护业务规则

如何获取Use Cases层的处理结果

Python语言特性的运用

模拟接口——abstractmethodv.s.NotImplementedError

金坷垃整洁架构的好处都有啥

甘瓜苦蒂——整洁架构的不足

渗入内层的I/O

模拟小于运算符的短路特性

想生成什么样的代码

优化一下

从AOP到method-combination

Emacs的AOP特性——advice-add

Common Lisp的method combination

可编程的编程语言——define-method-combination

后记

非递归遍历二叉树到底有什么用

iterator是个啥？

写一个前序遍历的iterator

iterator的优势

后记

当你SET的时候，Redis到底在SET些什么

Redis命令的派发逻辑

如何运用`gnuplot`

用`ledger`提取开销记录

用`csvsql`聚合数据

用`gnuplot`读取数据并绘图

自己动手写一个`git-log`

解析`commit`对象

遍历`commit`组成的有向无环图——大根堆

`nest/app/entity/`目录

`nest/app/use_case/`目录

如何往`Use Cases`层传入数据

如何获取`Use Cases`层的处理结果

模拟接口——`abstractmethod`v.s.`NotImplementedError`

Emacs的AOP特性——`advice-add`

Common Lisp的`method combination`

可编程的编程语言——`define-method-combination`

`iterator`是个啥？

写一个前序遍历的`iterator`

`iterator`的优势

`SET`命令的实现

`HSET`命令的实现

Lisp的`multiple-value-bind`

`format`的基本用法

`format`的高级用法