5.4 服务幂等性设计

幂等性是一个数学概念，后被引入计算机领域，用于描述某个操作可以安全地重试，并且无论执行多少次，结果始终保持一致。

在前文中提到的柔性事务通常基于“最大努力交付”机制，这意味着在网络故障、节点宕机或进程崩溃时，系统会通过重复请求来实现容错。因此，如果某些关键服务不具备幂等性，重复请求可能会导致数据不一致或其他问题。例如，重复请求一个不具备幂等性的退款接口，可能会导致重复退款。

接下来，笔者将介绍两种实现服务幂等性的方法，供读者参考。

5.4.1 全局唯一 ID 方案

全局唯一 ID 方案的核心思想是为每个操作生成一个独一无二的标识符，用以判断该操作是否已经执行过，避免重复执行。

全局唯一 ID 方案的操作步骤如下：

生成唯一 ID：每次执行操作前，根据业务操作生成一个全局唯一ID，这个 ID 可以利用 UUID、雪花算法（Snowflake）、Uidgenerator 或 Leaf 等算法生成。
附加到请求：将生成的唯一 ID 附加到请求中，作为请求的一个参数、HTTP 头或请求体的一部分。
处理请求：服务器端接收到请求后，首先检查唯一 ID：
- 如果 ID 已存在：说明该请求已经被处理过，服务器直接返回之前的响应结果，避免重复处理。
- 如果 ID 不存在：执行请求的操作，并将操作结果和该 ID 存储在数据存储中（如数据库、缓存等），以供后续请求检查。

值得一提的是，snowflake 算法取自世界上没有两片相同的雪花之意。使用分布式部署的 Snowflake 每秒可生成数百万个唯一且递增的 ID，广泛应用于需要生成唯一标识符的各类场景。

接下来，再看数据库中关于修改数据的操作。

假设有一个账户表 accounts，包含字段 id（账户ID）和 balance（账户余额）。现在要给账户 ID 为 1 的账户增加余额

UPDATE accounts SET balance = balance + 100 WHERE id = 1;

如果这个SQL语句执行一次，那么账户的余额会增加 100。但由于某些原因（比如网络重试或者程序逻辑错误），这个 SQL 语句被执行了两次，账户的余额将会增加 200，而不是预期的 100。

每次执行这个语句都会对账户余额产生不同的影响，属于典型的非幂等性操作。对于此类的非幂等性操作，我们来看使用乐观锁（Optimistic Locking）如何解决。

乐观锁基本思想是，假设并发操作发生冲突的概率较低，允许多个事务或线程在不加锁的情况下同时读取数据，但在写入数据时再进行冲突检测。如果在写入前检测到数据已被其他事务修改，则放弃当前操作，避免数据不一致的情况。

结合上述增加余额的 SQL，请看下面具体的操作：

增加版本号字段：在涉及更新的数据表中增加一个 version 字段，更新数据时，版本号随之增加。
更新时检查版本号：执行更新操作时，通过 WHERE 子句检查当前版本号是否与读取时的版本号一致，如果一致则执行更新，并更新版本号。
重试机制：如果更新操作失败，意味着数据库内的数据已经被修改。此时，业务层面请求最新的数据，更新本地 version 并发起重试，直至成功或达到最大重试次数。

UPDATE accounts 
SET balance = balance + ?, 
    version = version + 1 
WHERE id = ? AND version = ?;

上面乐观锁的操作模式，是一种典型的 CAS（Compare And Swap | Compare And Set，比较并交换）操作。

CAS 有时也被称为“轻量级事务”。由于乐观锁不需要在读取和写入时持有锁，在并发冲突不频繁的情况下（也就是读多写少的场景），使用乐观锁除保证一致性之外，还可提供更好的并发性能。

总字数:1125字