比特币脚本语言

脚本是一种简单的脚本语言,也是比特币交易处理的核心。如果你曾经写过汇编代码,你会发现这篇文章很容易理解,而且可能是有趣的;否则它可能是特别具挑战性的。所以请保持专注!

遇上机器码

脚本是计算机程序,作为程序员,你当然知道程序是什么。程序接受输入,执行一段时间,然后返回输出。编程语言是我们编写计算机能理解的程序的工具,因为大多数语言都带有编译器,可以将人性化的代码映射到CPU来操作,所以也称为操作码。

操作码

操作码包括内存操作,数学,循环,函数调用以及在程序编程语言(如C)中找到的所有内容。它们构成CPU的口语,即所谓的机器码。由于字节是计算机的首选习惯用法,因此操作码也是字节。结果就是,机器码表示要在CPU上执行的操作的字节串。

在像C这样的高级编程语言中考虑这段代码:

1
2
3
x = 0x23;
x += 0x4b;
x *= 0x1e;

现在假设你要在假设的小尾数的CPU上编译和运行此代码,该CPU具有16位内存(寄存器)的单个单元和以下操作码集:

opcode|encoding|V :–:|:–:|:–: SET(V)|ab V|16-bit ADD(V)|ac V|16-bit MUL(V)|ad V|16-bit

操作码解释如下:

  • SET使用值V加载寄存器。
  • ADD将V添加到寄存器中。
  • MUL将寄存器乘以V。

这种CPU的编译器将生成这9个字节的机器代码:

1
ab 23 00 ac 4b 00 ad 1e 00

以下是它的解释方式:

  • 1.使用值23加载寄存器。
  • 2.将4b添加到寄存器,现在是23 + 4b = 6e。
  • 3.将寄存器乘以1e,得到6e * 1e = ce4。

寄存器保存最终结果,即ce4。

堆栈内存

大多数情况下,我们需要使用变量跟踪复杂的程序状态。在C中,根据变量是静态分配还是使用malloc分配,它存储在不同排列的内存中。虽然malloc-ed数据像一个非常大的数组中的元素一样被访问,但静态变量被推送到一堆名为stack的项目中并从中弹出。堆栈以LIFO方式运行(后进先出),这意味着你推送的最后一个项目将是第一个弹出的项目。

考虑这个虚函数:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
int foo() {

/* 1 */

/* 2 */
uint8_t a = 0x12;
uint16_t b = 0xa4;
uint32_t c = 0x2a5e7;

/* 3 */
uint32_t d = a + b + c;

return d;

/* 4 */
}

堆栈最初是空的(1):

1
[]

然后,推送三个变量(2):

1
2
3
[12]
[12, a4 00]
[12, a4 00, e7 a5 02 00]

第四个变量被赋予其他变量的总和并被推入堆栈(3):

1
[12, a4 00, e7 a5 02 00, 9d a6 02 00]

堆栈的尖端是返回值,并通过其他方式发送回函数调用者。每个临时堆栈变量都会在块(4)的末尾弹出,因为必须平衡推push/弹pop操作,以便堆栈始终返回其初始状态:

1
2
3
4
[12, a4 00, e7 a5 02 00]
[12, a4 00]
[12]
[]

脚本机器码

同样,比特币核心有自己的“虚拟处理器”来解释脚本机器码。脚本具有丰富的操作码,但与英特尔等完全成熟的CPU相比却非常有限。关于脚本的一些关键事实:

  • 1.脚本不循环。
  • 2.脚本总是终止。
  • 3.脚本内存访问是基于堆栈的。

实际上,第1点也意味着第2点。第3点意味着在Script中没有像命名变量这样的东西,你只需在堆栈上进行计算。通常,你推送的堆栈项成为后续操作码的操作数。在脚本的末尾,顶部堆栈项是返回值。

在介绍现实世界的脚本之前,让我们先列举一些操作码。如需全套,请查看比特官方维基页面

常量

以下操作码将数字0-16推入堆栈:

opcode|encoding :–:|:–: OP_0|00 OP_1-OP_16|51-60

按照惯例,OP_0OP_1也表示布尔值OP_FALSE(零)和OP_TRUE(非零)。

例:

1
54 57 00 60

或者:

1
OP_4 OP_7 OP_0 OP_16

这是堆栈如何发展:

1
2
3
4
5
[]
[4]
[4, 7]
[4, 7, 0]
[4, 7, 0, 16]

返回值是最高项,因此脚本返回16。我知道,这是毫无意义的,但这是一个开始。

推送数据

提供了几个操作码来推送自定义数据。它们的操作数大小不同:

opcode|encoding|L (length)|D (data) :–:|:–:|:–:|:–: OP_PUSHDATA1|4c L D|8-bit|L bytes OP_PUSHDATA2|4d L D|16-bit|L bytes OP_PUSHDATA4|4e L D|32-bit|L bytes

例如,如果你的数据长度可以存储为8位数字,那么OP_PUSHDATA1是你的最佳选择。看这个:

1
2
3
4c 14 11 06 03 55 04 8a
0c 70 3e 63 2e 31 26 30
24 06 6c 95 20 30

第一个字节显然是OP_PUSHDATA1操作码,后面是1字节长度14,即十进制20.因此,接下来会有20个字节的数据。这条指令的作用是将这些数据压入堆栈:

1
2
3
[11 06 03 55 04 8a 0c 70
3e 63 2e 31 26 30 24 06
6c 95 20 30]

实际上,与varints一样,对于非常短的数据有一种特殊的编码。如果操作码位于01和4b(包括)之间,则它是一个推送数据操作,其中操作码本身是以字节为单位的长度:

opcode|encoding|L (length)|D (data) :–:|:–:|:–:|:–: L|L D|01-4b|L bytes

例如,在字符串中:

1
07 8f 49 b2 e2 ec 7c 44

操作码07意味着要推送7个字节的数据:

1
[8f 49 b2 e2 ec 7c 44]

区块链中的下一个块呢?

你学到了一些关于机器代码和操作码的知识。脚本是矿工软件理解的简单低级语言。使用堆栈内存跟踪脚本状态。

在下一篇文章中,我将向你展示操作代码,它不仅仅是推送数据。 如果你喜欢它,请分享这篇文章!

======================================================================

分享一些以太坊、EOS、比特币等区块链相关的交互式在线编程实战教程:

  • java以太坊开发教程,主要是针对java和android程序员进行区块链以太坊开发的web3j详解。
  • python以太坊,主要是针对python工程师使用web3.py进行区块链以太坊开发的详解。
  • php以太坊,主要是介绍使用php进行智能合约开发交互,进行账号创建、交易、转账、代币开发以及过滤器和交易等内容。
  • 以太坊入门教程,主要介绍智能合约与dapp应用开发,适合入门。
  • 以太坊开发进阶教程,主要是介绍使用node.js、mongodb、区块链、ipfs实现去中心化电商DApp实战,适合进阶。
  • C#以太坊,主要讲解如何使用C#开发基于.Net的以太坊应用,包括账户管理、状态与交易、智能合约开发与交互、过滤器和交易等。
  • EOS教程,本课程帮助你快速入门EOS区块链去中心化应用的开发,内容涵盖EOS工具链、账户与钱包、发行代币、智能合约开发与部署、使用代码与智能合约交互等核心知识点,最后综合运用各知识点完成一个便签DApp的开发。
  • java比特币开发教程,本课程面向初学者,内容即涵盖比特币的核心概念,例如区块链存储、去中心化共识机制、密钥与脚本、交易与UTXO等,同时也详细讲解如何在Java代码中集成比特币支持功能,例如创建地址、管理钱包、构造裸交易等,是Java工程师不可多得的比特币开发学习课程。
  • php比特币开发教程,本课程面向初学者,内容即涵盖比特币的核心概念,例如区块链存储、去中心化共识机制、密钥与脚本、交易与UTXO等,同时也详细讲解如何在Php代码中集成比特币支持功能,例如创建地址、管理钱包、构造裸交易等,是Php工程师不可多得的比特币开发学习课程。
  • tendermint区块链开发详解,本课程适合希望使用tendermint进行区块链开发的工程师,课程内容即包括tendermint应用开发模型中的核心概念,例如ABCI接口、默克尔树、多版本状态库等,也包括代币发行等丰富的实操代码,是go语言工程师快速入门区块链开发的最佳选择。

汇智网原创翻译,转载请标明出处。这里是原文比特币脚本语言