翻译 | 一行 JavaScript 代码的逆向工程

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 2699 天前的主题，其中的信息可能已经有所发展或是发生改变。

原文地址：Reverse Engineering One Line of JavaScript
原文作者：Alex Kras
译者：李波
校对者：冬青、小萝卜

几个月前，我看到一个邮件问：有没有人可以解析这一行 JavaScript 代码

<pre id=p><script>n=setInterval("for(n+=7,i=k,P='p.\\n';i-=1/k;P+=P[i%2?(i%2*j-j+n/k^j)&1:2])j=k/i;p.innerHTML=P",k=64)</script>

这一行代码会被渲染成下图的效果。你可以在这里用浏览器打开来观看。这是 Mathieu ‘ p01 ’ Henri 写的，你还可以在作者的网站www.p01.org里看到更多很酷的例子。

好的！我决定接受挑战

第一步：让代码变得可读

第一件事，让 HTML 文件里只有 HTML 代码，然后把 JavaScript 代码放到 code.js 文件里。我还用 id="p" 来包装 pre 标签。

index.html

<script src="code.js"></script>
<pre id="p"></pre>

我注意到变量 k 只是一个常量，所以把它移出来，然后重命名为 delay。

code.js

var delay = 64;
var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var n = setInterval(draw, delay);

接下来，因为 setInterval 可以接收一个函数或者字符串来执行，字符串 var draw 会被 setInterval 用 eval 来解析并执行。所以我把它移到一个新建的函数体内。然后保留旧的那行代码，以供参考。

我注意到的另一个点，变量 p 指向了存在于 HTML 的 DOM 结构里 id 为 p 的标签，就是那个之前我包装过的 pre 标签。事实上，元素标签可以通过他们的 id 用 JavaScript 来获取，只要 id 仅由字母数字组成。这里，我通过 document.getElementById("p") 来让它更加直观。

var delay = 64;
var p = document.getElementById("p"); // < --------------
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    for (n += 7, i = delay, P = 'p.\n'; i -= 1 / delay; P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2]) {
        j = delay / i; p.innerHTML = P;
    }
};
var n = setInterval(draw, delay);

下一步，我声明了变量 i、p 和 j，然后把他们放在函数的顶部。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay; // < ---------------
    var P ='p.\n';
    var j;
    for (n += 7; i > 0 ;P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2]) {
        j = delay / i; p.innerHTML = P;
        i -= 1 / delay;
    }
};
var n = setInterval(draw, delay);

我把 for 循环分解成 while 循环。只保留了 for 的 CHECK_EVERY_LOOP 部分（ for 的三个部分分别是 RUNS_ONCE_ON_INIT; CHECK_EVERY_LOOP; DO_EVERY_LOOP ），然后分别把其他的代码移到循环的内外部。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) { // <----------------------
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;
        P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2];
    }
};
var n = setInterval(draw, delay);

接着我将会展开 P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2] 中的三元操作（判断条件？ true 时运行：false 时运行）

i % 2 是用来检测 i 是奇数还是偶数，如果 i 是偶数，则返回 2。如果是奇数，则返回 (i % 2 * j - j + n / delay ^ j) & 1 的计算结果（更多的是这种情况）。

最终，这个返回值被当作索引，被用于获取字符串 P 的某个字符，因此它可以写成 P += P[index]。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) {
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;

        let index;
        let iIsOdd = (i % 2 != 0); // <---------------

        if (iIsOdd) { // <---------------
            index = (i % 2 * j - j + n / delay ^ j) & 1;
        } else {
            index = 2;
        }

        P += P[index];
    }
};
var n = setInterval(draw, delay);

下一步，我会把 index = (i % 2 * j - j + n / delay ^ j) & 1 里的 & 1 分解到另外的 if 表达式里。

这是一种聪明的方法来检测括号内的值是奇数还是偶数，如果是偶数则返回 0，反之返回 1.& 是与的位运算符。与的逻辑如下：

1 & 1 = 1
0 & 1 = 0

因此 something & 1 则可以看成把“ something ”转化成二进制，接着在 1 的前面填充对应数量的 0，从而保持和 something 的长度一致，然后仅仅返回与运算的最后一位。例如，5 的二进制是 101。如果我们和 1 进行与运算，将会得到如下结果：

    101
AND 001
    001

或者说，5 是一个奇数，5 & 1 的结果是 1。用 JavaScript 的控制台很容易可以证明下面这个逻辑。

0 & 1 // 0 - even return 0
1 & 1 // 1 - odd return 1
2 & 1 // 0 - even return 0
3 & 1 // 1 - odd return 1
4 & 1 // 0 - even return 0
5 & 1 // 1 - odd return 1

注意，我将上述 index 的剩余部分重命名为 magic。因此这些代码加上展开 & 1 后的代码看起来是下面这样的。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) {
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;

        let index;
        let iIsOdd = (i % 2 != 0);

        if (iIsOdd) {
            let magic = (i % 2 * j - j + n / delay ^ j);
            let magicIsOdd = (magic % 2 != 0); // &1 < --------------------------
            if (magicIsOdd) { // &1 <--------------------------
                index = 1;
            } else {
                index = 0;
            }
        } else {
            index = 2;
        }

        P += P[index];
    }
};
var n = setInterval(draw, delay);

接下来，我将会分解 P += P[index] 到一个 switch 表达式里。现在我们可以很清晰的知道 index 的值只可能为 0、1 和 2 中的一个。也可以知道 P 的初始化总是 var P ='p.\n'，index 为 0 时指向 p，为 1 时指向 .，为 2 时指向 \n —— 新的一行字符串。

var delay = 64;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
var draw = function() {
    var i = delay;
    var P ='p.\n';
    var j;
    n += 7;
    while (i > 0) {
        //Update HTML
        p.innerHTML = P;

        j = delay / i;
        i -= 1 / delay;

        let index;
        let iIsOdd = (i % 2 != 0);

        if (iIsOdd) {
            let magic = (i % 2 * j - j + n / delay ^ j);
            let magicIsOdd = (magic % 2 != 0); // &1
            if (magicIsOdd) { // &1
                index = 1;
            } else {
                index = 0;
            }
        } else {
            index = 2;
        }

        switch (index) { // P += P[index]; <-----------------------
            case 0:
                P += "p"; // aka P[0]
                break;
            case 1:
                P += "."; // aka P[1]
                break;
            case 2:
                P += "\n"; // aka P[2]
        }
    }
};

var n = setInterval(draw, delay);

我将简化 var n = setInterval(draw, delay)。setInterval 会返回一个从 1 开始的整数，并且每次执行完 setInterval 之后返回值都会递增。这个整数可以在 clearInterval 方法里面用到（用来取消定时器）。在我们的代码里， setInterval 仅仅只会执行一次，所以 n 可以简单的设置为 1.

我还把 delay 重命名为 DELAY 让它看起来是一个常量。

最后但并非不重要的一点，我用括号把 i % 2 * j - j + n / DELAY 包起来，指明 ^ 异或运算的执行优先度低于 %,*,-,+和/操作。或者说，所有的运算操作都会比 ^ 先执行。包装后的代码应该是这样的 ((i % 2 * j - j + n / DELAY) ^ j)。


// 之前我把 `p.innerHTML = P;` 放错地方了，更新后，把它移出了 while 循环

const DELAY = 64; // approximately 15 frames per second 15 frames per second * 64 seconds = 960 frames
var n = 1;
var p = document.getElementById("p");
// var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";

/**
 * Draws a picture
 * 128 chars by 32 chars = total 4096 chars
 */
var draw = function() {
    var i = DELAY; // 64
    var P ='p.\n'; // First line, reference for chars to use
    var j;

    n += 7;

    while (i > 0) {

        j = DELAY / i;
        i -= 1 / DELAY;

        let index;
        let iIsOdd = (i % 2 != 0);

        if (iIsOdd) {
            let magic = ((i % 2 * j - j + n / DELAY) ^ j); // < ------------------
            let magicIsOdd = (magic % 2 != 0); // &1
            if (magicIsOdd) { // &1
                index = 1;
            } else {
                index = 0;
            }
        } else {
            index = 2;
        }

        switch (index) { // P += P[index];
            case 0:
                P += "p"; // aka P[0]
                break;
            case 1:
                P += "."; // aka P[1]
                break;
            case 2:
                P += "\n"; // aka P[2]
        }
    }
    //Update HTML
    p.innerHTML = P;
};

setInterval(draw, 64);

你可以在这里看到最后的结果。

第二步：理解代码

这部分将会介绍什么内容呢？不要心急，让我们一步一步来解析。

i 通过 var i = DELAY，被初始化为 64，然后每次循环递减 1/64，等于 0.015625 （ i -= 1 / DELAY ）。循环持续到 i 小于 0 时（while (i > 0) {）。每次执行循环，i 将会减少 1/64，所以每执行 64 次循环，i 就会减 1 （ 64 / 64 = 1 ），总得来说， i 需要执行 64 x 64 = 4096 次，之后小于 0.

之前的图片中，一共有 32 行，每行包含了 128 个字符。恰巧的是 64 x 64 = 32 x 128 = 4096。我们触发 32 次 i 为严谨的偶数的情况，i 是绝对的偶数时，i 才为偶数（非奇数 let iIsOdd = (i % 2 != 0); 译者提示：偶数是整数，所以 2.2 是奇数），例如 i 为 64，62，60 等。在这 32 次里，index 通过 index = 2 赋值为 2，意味着字符串将添加 P += "\n"; // aka P[2] 从而换行，开始一行新的字符串。剩余的 127 个字符则都是 p 和 .。

那么我们根据什么来判断何时用 p 或者 . ?

当然，之前我们就已经知道了，当 let magic = ((i % 2 * j - j + n / DELAY) ^ j) 中的 magic 是奇数的时候用 . ，如果是偶数则用 p。

var P ='p.\n';

...

if (magicIsOdd) { // &1
    index = 1; // second char in P - .
} else {
    index = 0; // first char in P - p
}

但我们很难知道 magic 是奇数还是偶数，这是一个很有分量的问题。在此之前，让我们证实一些事情。

如果我们把 + n/DELAY 从 let magic = ((i % 2 * j - j + n / DELAY) ^ j) 当中移除掉，我们最终将会看到一个静态的布局，如下图

现在，让我们来看看移除了 + n/DELAY 的 magic。如何能得到上面漂亮的图片。

(i % 2 * j - j) ^ j

注意到每次循环里，我们都会执行：

j = DELAY / i;
i -= 1 / DELAY;

换句话说，我们可以将上述表达式中的 j 用 i 表示，变成 j = DELAY/ (i + 1/DELAY)，但因为 1/DELAY 是一个非常小的数值，所以我们暂时去掉 + 1/DELAY 并简化成 j = DELAY/i = 64/i

// 译者注

为何这里不是 j = DELAY/ (i - 1/DELAY)呢？

原因：

i -= 1 / DELAY 转化成 i = i - 1 / DELAY

这里有 2 个 i 可以代入消元，但是因为 j 的表达式在 i 前面，所以 j 取得 i 应该是自减前的 i，故 i = i + 1/ DELAY

因此我们可以重写 (i % 2 * j - j) ^ j 为 (i % 2 * 64/i - 64/i) ^ 64/i

让我们用在线的图形计算器来绘制那些函数

首先，我们来绘制下 i%2 的图

从下面的图形可以看出，y 的值区间在 0 到 2 之间。

如果我们绘制 64 / i 则会得到如下图形

如果我们绘制 (i % 2 * 64/i - 64/i) 表达式，我们将得到一个混合了上面两张图的一个图形，如下

最后，如果我们把 2 个函数同时绘制出来，将会是如下的图（红线为 j 的关系图）

我们能从图形里知道些什么？

让我们回忆下我们要去解答的问题：如何得到如下静止图像：

好的，我们知道如果 (i % 2 * j - j) ^ j 的值是一个偶数，那么我们将添加 p，如果是一个奇数则添加 . 。

让我们专注在图形的前面 16 行，i 的值在 64 到 32 之间。

异或运算在 JavaScript 里会把小数点右边的值忽略掉，所以它看起来和执行 Math.floor 的效果一样。

其实当 2 个对比位都是 1 或者 0 的时候, 异或操作会返回 0。

这里我们的 j 初始值为 1，且慢慢的递增趋向于 2，但始终小于 2，所以我们可以把它当成 1 来处理（Math.floor(1.9999) === 1），为了得到结果为 0 （意味着是偶数），我们还需要异或表达式的左边也是 1，使得返回一个 p 给我们。

换句话说，每条藏青色的倾斜线都相当于我们图像中的一行，因为前面 16 行的 j 值总是介于 1 和 2 之间，而唯一能得到奇数值的方法是让 (i % 2 * j - j) ^ j（也可以说i % 2 * i/64 - i/64 或者藏青色的倾斜线）大于 1 或小于 -1。

为了将这个地方讲清楚，这里有一些 Javascript 控制台的输出，0 或者 -2 意味着结果是偶数，1 则是奇数。

1 ^ 1 // 0 - even p
1.1 ^ 1.1 // 0 - even p
0.9 ^ 1 // 1 - odd .
0 ^ 1 // 1 - odd .
-1 ^ 1 // -2 - even p
-1.1 ^ 1.1 // -2 - even p

如果我们观察下我们的图形，可以看出原点右边的斜线大部分都是大于 1 或者小于 -1 （几乎没有偶数，或者说几乎没有 p ），且越靠后（靠近原点）越如此。第 16 行几乎介于 2 和 -2 之间。第 16 行之后，我们可以看到图形是另外一种模式。

16 行之后 j 超过了 2，使得结果发生了变化。现在当藏青色的斜线大于 2，小于 -2，或者在 1 和-1 之间且不等于的时候，我们将会得到一个偶数。这也是为什么在 17 行之后我们会在一行内看到两组和两组以上的 p。

如果你仔细看动图的最底部几行，你会发现这几行不符合上面的规则，图表曲线看起来起伏非常大。

现在让我们把 + n/DELAY 加回来。在代码里我们可以看到 n 的初始值是 8 （初始是 1，但是每次定时器被调用时就加 7 ），它会在每次执行定时器时增加 7。

当 n 变成 64，图形会变成如下样子。

可以注意到，j 总是 ~1 （这里的 ~ 是近似的意思），但是现在红斜线的左半边位于 62-63 区间的值无限趋近于 0，红斜线的右半边位于 63-64 则无限趋近与 1。因为我们的字符按 64 到 62 的顺序排列，那么我们可以猜测斜线的 63-64 部分（ 1^1=0 是偶数）添加的是一段 p，左边 62-63 部分（ 1^0=1 是奇数）添加的是一段 .。就像普通的英语单词一样，从左到右的添加上。

用 HTML 渲染出来的话，将会看到下图（你可以自己在 codepen 改变 n 来观看效果）。这和我们的预期一致。