Blockchain VM Jan 15, 2023

这是22年5月份在我在公司内部分享的关于区块链虚拟机的基础介绍，整理资料的时候翻出来发到博客上。

什么是区块链虚拟机

从比特币脚本到以太坊虚拟机

比特币脚本

UTXO 模型

UTXO (Unspent Transaction Output) ，简单来说就是：

一个 UTXO 包含一个面额和一个当前的拥有者。
某个一账户的余额是由当前区块链网络里，所有属于这个账户的 UTXO 组成的：

一笔交易里可以包含多个 input \也可以有多个 output，只需要保证 sum(inputs) > sum(outputs) + fee 即可。

如果一个用户想要发送一笔交易，发送 X 个币到一个特定的地址，有时候，他们拥有的 UTXO 的一些子集组合起来面值恰好是 X，在这种情况下，他们可以创造一个交易：花费他们的 UTXO 并创造出一笔新的、价值 X 的 UTXO ，由目标地址占有。当这种完美的配对不可能的时候，用户就必须打包其和值大于 X 的 UTXO 输入集合，并添加一笔拥有第二个目标地址的 UTXO ，称为“变更输出”，分配剩下的币到一个由他们自己控制的地址。

思考？

账户模型和 UTXO 模型相比，有什么优势，有什么缺点？

账号模型特点： - 余额状态简单，绝大多数情况下，并不会关心自己的资产由哪些面值组成，一般只关心总额多少。而 UTXO 模型需要统计当前状态下的所有 UTXO。 - 状态数据和用户数量正相关，不会随着时间增大而无限增加 - 轻量级客户端更容易编写
UTXO 模型特点： - 资产的可追溯性更强 - UTXO 模型理论上来说可以并行地利用不同的 UTXO 签发多笔交易。但是如果双花，同一个 UTXO 最终也只会在一个交易里被确认。

使用 output

这里涉及到的两个脚本：

锁定脚本 scriptPubKey
解锁脚本 scriptSig

比特币虚拟机在执行交易时：需要验证解锁脚本能否解开锁定脚本，会把 锁定脚本( scriptPubKey )和对应索引的解锁脚本( scriptSig )拼接起来从左到右执行一遍。如果执行过程中没有出现错误并且执行结果为真，则验证通过，意味着钥匙打开了锁，这个 UTXO 可以被花费。

请注意，解锁脚本里不能出现 PUSHDATA 以外的任何操作码，否则会报错 > 16: mandatory-script-verify-flag-failed (Only non-push operators allowed in signatures)

解锁脚本里只能有数据不能出现逻辑操作，否则任何 UTXO 都可以用 OP_RETURN 解锁: OP_TRUE OP_RETURN

脚本 Script

bitcoin-core 源码 interpreter.cpp里的注释：

/**
 * Script is a stack machine (like Forth) that evaluates a predicate
 * returning a bool indicating valid or not.  There are no loops.
 */

Script 是一种类 Forth、基于栈式模型、无状态的、非图灵完备的语言。 opcodes 分为常量、流程控制、栈操作、算术运算、位运算、密码学运算、保留字等若干类，还包括3个内部使用的伪指令。

A simple example

先看一个简单的例子，只需要用到几个简单的操作符：

Word	Opcode	Hex	Input	Output	Description
OP1…OP16	81-96	0x51-0x60	Nothing	1-16	push the number into stack
OP_ADD	147	0x93	a b	out	a is added to b.
OP_EQUAL	135	0x87	x1 x2	True/false	Return True if x1 == x2, or false

比如 A 需要转账给 B 一笔钱，那么 B 就需要提供一个收款方式（锁定脚本模板），A 按照 B 提供的锁定脚本把钱锁定，就相当于完成了对 B 的转账。

假如 B 提供的收款方式是：因为只有我知道 x + 2 = 3 的解是 x = 1 ，所以告诉 A，你只需要把金额通过以下脚本锁定： OP_2 OP_ADD 3 OP_EQUAL

当 B 需要使用这笔钱的时候：B 就可以使用解锁脚本：OP_1 来证明自己可以使用这笔钱了：因为：解锁脚本 + 锁定脚本: OP_1 OP_2 OP_ADD 3 OP_EQUAL 的执行结果是 True

当然，这样提供锁定脚本的方法“只能用一次”，因为你的解锁方式使用过以后就相当于公开了。

实际点的例子

下面举几个在后面的脚本中会出现的指令，全部的指令可参考官方文档和源码。

举例几个：

Word	Opcode	Hex	Input	Output	Description
`OP_DUP`	118	0x76	x	x x	Duplicates the top stack item.
`OP_HASH160`	169	0xa9	in	hash	The input is hashed twice: first with SHA-256 and then with RIPEMD-160.
`OP_EQUALVERIFY`	136	0x88	x1 x2	Nothing / fail	Same as OPEQUAL, but runs OPVERIFY afterward.
`OP_CHECKSIG`	172	0xac	sig pubkey	True / false	The entire transaction’s outputs, inputs, and script (from the most recently-executed OPCODESEPARATOR to the end) are hashed. The signature used by OPCHECKSIG must be a valid signature for this hash and public key. If it is, 1 is returned, 0 otherwise.