比特币 ASIC 芯片演进:从 BM1385 到 BM1373
通过芯片本身讲述的十年挖矿硅芯片。工艺节点、晶体管数量、电压域、架构跃迁。从 2015 年的 200 J/TH BM1385 到驱动 Antminer S23 的全新 3nm BM1373——以及 Gufo 期待接下来发生什么。
一手拿着 Bitaxe Gamma,一手拿着旧的 Antminer S7。相同的算法。相同的 SHA-256。来自同一份 Satoshi 白皮书的相同比特币协议。但每个设备核心的硅芯片讲述了一个13 年、13 倍效率改进,以及挖矿硬件构建方式的根本性重新设计的故事。S7 的 BM1385 芯片在 2015 年以 200 J/TH 处于最先进水平。Gamma 的 BM1370 处于 15 J/TH。而全新的 BM1373——Bitmain 的第一款 3nm SHA-256 芯片,搭载于 Antminer S23 系列——将其推低到每芯片 10 J/TH。
每一代 ASIC 硅芯片都是一个故事:工艺节点缩小、电压域重新设计、晶体管数量翻倍或三倍、重新塑造的热包络以提取每一焦耳的有用工作。大多数矿工从不查看他们硬件的内部。芯片是散热器下的黑色方块,匿名而相同。但理解硅芯片,你就理解了独立挖矿的整个经济学:为什么有些链偏爱旧芯片,为什么 Bitaxe 真的不同于工业农场,为什么下一次减半会伤害一些运营商而不伤害另一些。
这是 Gufo 的完整芯片图谱。我们将逐一介绍从 2015 年到 2026 年的每一个主要 Bitmain 挖矿 ASIC,诚实地与 MicroBT 和 Auradine 的产品进行比较,最后对 BM1373 之后会发生什么进行有根据的推测。
ASIC 芯片实际上是什么(简要)
比特币挖矿 ASIC——专用集成电路——是为了一个确切目的设计的芯片:尽可能快地计算 SHA-256 哈希函数,同时尽可能少地消耗电力。不像 CPU 或 GPU 是通才,ASIC 是专才。它什么也做不了。但它做的那一件事,它每瓦做得比高端 GPU 快大约 100,000 倍。
芯片内部是数百万个并行运行的小型 SHA-256 计算核心,每个核心每个时钟周期计算一次哈希。现代 Bitmain 芯片在单个晶圆上包含数十万个这样的核心。每芯片的总吞吐量以每秒万亿次哈希(TH/s)衡量,总效率以焦耳每万亿次哈希(J/TH)衡量。J/TH 越低 = 每瓦更多有用工作 = 更低电费 = 有竞争力的矿工。
两个物理杠杆控制一切:
- 工艺节点 — 晶体管有多小。更小 = 每平方毫米更多晶体管,更低的开关电压,更少的热量。行业在十年间从 28nm(BM1385)走到 3nm(BM1373)。
- 架构 — 核心如何排列,它们如何通信,如何供电。智能架构从相同的硅面积中提取更多有用工作。
两者每一代都在改进。Bitmain 自 2013 年以来已经出货了 9 代以上的挖矿芯片。每一代都在 18-24 个月内使前一代过时。这就是挖矿艰难的原因。硬件与自身竞争。
Bitmain 芯片家族树
这是过去十年所有主要的 Bitmain SHA-256 挖矿 ASIC,从最老到最新,以及让每个芯片闻名的设备:
| 芯片 | 年份 | 工艺 | 每芯片算力 | 效率 | 用于 |
|---|---|---|---|---|---|
| BM1385 | 2015 | 28nm | ~30 GH/s | ~200 J/TH | Antminer S7 |
| BM1387 | 2017 | 16nm | ~45 GH/s | ~98 J/TH | Antminer S9 系列 |
| BM1391 | 2018 | 10nm | ~53 GH/s | ~75 J/TH | Antminer S15/T15 |
| BM1397 | 2019 | 7nm | ~85 GH/s | ~40 J/TH | Antminer S17 / Bitaxe MAX |
| BM1398 | 2020 | 7nm | ~110 GH/s | ~32 J/TH | Antminer S19 / S19j |
| BM1366 | 2022 | 5nm | ~500 GH/s | ~21 J/TH | Antminer S19 XP / Bitaxe Ultra |
| BM1368 | 2024 | 5nm | ~700 GH/s | ~17.5 J/TH | Antminer S21 / Bitaxe Supra |
| BM1370 | 2024-2025 | 5nm 精炼 | ~1.2 TH/s | ~15 J/TH (12 水冷) | S21 Pro / S21 XP Hyd / Bitaxe Gamma |
| BM1373 | 2026 | 3nm | ~2.5 TH/s | ~10 J/TH (9.5 水冷) | Antminer S23 系列 |
把最后一行读两遍。从 2015 年的 30 GH/s 到 2026 年的 2,500 GH/s。每芯片算力提升 83 倍。从 200 J/TH 到 10 J/TH。效率提升 20 倍。相同的算法。相同的网络。相同的 SHA-256 谜题。只是更好的硅芯片,年复一年。
工艺节点 — 这些数字实际意味着什么
”工艺节点”是制造芯片所使用的制造技术的简称。数字——28nm、7nm、3nm——历史上指的是芯片上最小的特征尺寸,尽管现代命名更多是营销而不是测量。重要的是:更小的数字意味着更多晶体管装入相同面积,每个晶体管在更低电压下切换,泄漏电流更少。
每次节点缩小大致带来:
- 2 倍晶体管密度 — 相同芯片面积内核心数翻倍
- ~30% 更低的每次操作功耗 — 相同工作产生更少热量
- ~15-25% 更高的时钟速度 — 每核心每秒更多哈希
结合起来,你就得到从 BM1385 到 BM1373 的累计收益:
BM1385 (28nm, 2015): 30 GH/s, 200 J/TH
BM1373 (3nm, 2026): 2,500 GH/s, 10 J/TH
改进:每芯片算力 83 倍,效率 20 倍,11 年
作为对比:2017 年的 Antminer S9 需要 189 个芯片才能提供 14 TH/s。Antminer S23 需要 ~127 个 BM1373 芯片才能提供 318 TH/s——以 67% 的芯片数量提供 23 倍的算力,且装在尺寸相似的单个设备上。这就是十年硅芯片演进的实际样貌。
逐一介绍这些芯片
BM1385 (2015) — 始祖
第一款 Bitmain 大规模部署的芯片。建立在台积电的 28nm 工艺上。Antminer S7 使用了 162 个这种芯片,在 1,293W 功耗下提供 4.7 TH/s——壁端效率约 275 J/TH,芯片级 ~200 J/TH。按 2026 年的标准,S7 产生的算力比单个 Bitaxe Gamma 芯片还少。按 2015 年的标准,它是最先进的。
BM1387 (2017) — 传奇
赢得比特币挖矿半个十年的芯片。Antminer S9 使用了 189 个 BM1387 芯片,在 1,372W 下提供 14 TH/s(~98 J/TH)。多年来,S9 是地球上部署最多的比特币矿机——出货数百万台。即使在今天(2026),在电费低于 $0.04/kWh 的地区,一些 S9 仍然有利可图。单一芯片代提供八年有用服务。没有其他 Bitmain 芯片能匹敌这种寿命。
BM1397 (2019) — 7nm 转折点
Bitmain 第一款主流 7nm 芯片。用于 Antminer S17 系列。J/TH 大致比 BM1387 时代减半。也成为原始 Bitaxe MAX 项目的基础——第一款 DIY 单芯片独立矿机。BM1397 使用预计算的 midstates 而不是接收完整的区块头,这一架构细节使它与后来的几代区别开来。
BM1366 (2022) — 5nm 跃迁
Bitmain 挖矿产品线中的第一款 5nm 芯片。效率大幅跃升至 ~21 J/TH。用于 Antminer S19 XP(140 TH/s, 21.5 J/TH)和 Bitaxe Ultra。Bitaxe Ultra 在独立挖矿历史上占有特殊地位——2025 年 3 月,一台 ~0.48 TH/s 的单台 Bitaxe Ultra 解出了比特币区块 #887,212,在提交 6.19 亿份额后获得 3.125 BTC 的支付。这是现代时代”彩票挖矿实际上获得回报”最被引用的例子。
BM1368 (2024) — 架构重新设计
这里开始变得有趣。BM1368 是其一代中第一款进行了深度架构变化的芯片——不仅仅是工艺缩小。两个关键变化:
- 电压域重新设计:BM1368 从传统的 ~0.4V 域转移到 ~1.0-1.2V。这听起来反直觉——更高的电压通常意味着更多功率——但与新架构配合,它允许更简单的供电、更少的电压调节器,以及大幅提高的每芯片算力。
- 消除 PIC 控制器:上一代 Bitmain 芯片依赖独立的 PIC 微控制器来管理电压缩放和芯片通信。BM1368 直接集成了这些功能。结果:更简单的算力板、更少的故障点、更容易的固件开发。
Antminer S21 使用 108 个 BM1368 芯片在 17.5 J/TH 下提供 200 TH/s。Bitaxe Supra 使用单个 BM1368 在桌面上以 ~22 J/TH 提供 600-750 GH/s。架构重新设计相对于 BM1366 这一代提供了大约 6-7 倍的每芯片算力——这是 Bitmain 历史上最大的单代跃升。
BM1370 (2024-2025) — 精炼
BM1370 采用了 BM1368 架构并将其推得更远。相同的 5nm 工艺,但精炼以获得更高的每芯片算力(~1.2 TH/s vs 0.7)和更好的效率(~15 J/TH vs 17.5)。用于:
- Antminer S21 Pro — 195 芯片 × 1.2 TH/s = 234 TH/s at 15 J/TH(~3,510W)
- Antminer S21 XP Hyd — 324 芯片 × 1.46 TH/s = 473 TH/s at 12 J/TH 水冷(~5,676W)
- Bitaxe Gamma — 1 芯片,原装 1.0-1.2 TH/s,超频至 900 MHz / 1250 mV 可达 1.84 TH/s
- NerdQAxe++ / Zyber 8G — 4 芯片,4.8+ TH/s
- NerdOCTAxe — 8 芯片,10-12 TH/s
BM1370 的宽电压窗口(0.65V 到 1.30V)和频率余量(原装 525 MHz,好硅芯片上超频至 900-1000 MHz)使其成为社区的最爱。Bitaxe 超频指南遍地开花。AxeOS 固件添加了电压/频率调优 UI。该芯片成为工业级硅芯片与 DIY 桌面挖矿文化之间的桥梁。
BM1373 (2026) — 3nm 未来
Bitmain 第一款 3nm SHA-256 芯片。每芯片规格:
- ~2.5 TH/s 每芯片 — 大约是 BM1370 的两倍
- ~25W 每芯片 — 略高于 BM1370(原装 ~17W)
- 10 J/TH 效率 — 比 BM1370 好 33%
- 3nm 工艺 — Bitmain 四年来第一次节点缩小
部署在整个 Antminer S23 系列中:
| 型号 | 算力 | 效率 | 功率 | 冷却 | 估计价格 |
|---|---|---|---|---|---|
| S23(风冷) | 318 TH/s | 11 J/TH | 3,498W | 风冷(75 dB) | ~$8-10k |
| S23 浸没式 | 442 TH/s | 12 J/TH | ~5,300W | 浸没式 | ~$11-13k |
| S23 Hyd | 580 TH/s | 9.5 J/TH | 5,510W | 水冷(50 dB) | ~$17-18k |
| S23 Hyd 3U | 1,160 TH/s (1.16 PH/s) | 9.5 J/TH | 11,020W | 水冷 3 相 | ~$30k+ |
S23 Hyd 3U 真的非凡:单个机架安装单元 1.16 PH/s,在 380-415V 三相电下消耗 11kW。单台 S23 Hyd 3U 产生的算力比 SoloFury 今天运营的整个 4× S21+ 舰队还多。Bitmain 对这些单元提供 7 年保修,表明对硅芯片寿命的信心。
Bitaxe 和 NerdQAxe 社区已经在为 BM1373 调整板子。TinyChipHub(事实上的开放硬件 ASIC 供应商)出货密封的 BM1373 芯片卷盘,4 芯片 NerdQAxe++ 构建预计将提供 10-12 TH/s——直接匹配 Zyber 8G Solo Miner 的算力,但 J/TH 显著更低。桌面独立挖矿的天花板刚刚又上移了一个数量级。
竞争对手:MicroBT (Whatsminer)
MicroBT 是 Bitmain 在 SHA-256 领域最严肃的竞争对手。他们设计自己的 ASIC 芯片(不是从 Bitmain 授权)并构建了一条平行的演进路径:
| 型号 | 年份 | 算力 | 效率 | 冷却 |
|---|---|---|---|---|
| Whatsminer M30S+ | 2020 | 100 TH/s | 34 J/TH | 风冷 |
| Whatsminer M50S | 2022 | 126 TH/s | 26 J/TH | 风冷 |
| Whatsminer M50S++ | 2023 | 150 TH/s | 22 J/TH | 风冷 |
| Whatsminer M60 | 2023 | 172 TH/s | 19.9 J/TH | 风冷(5nm 芯片) |
| Whatsminer M60S | 2024 | 186 TH/s | 18.5 J/TH | 风冷 |
| Whatsminer M63 | 2024 | ~390 TH/s | ~18.5 J/TH | 水冷 |
| Whatsminer M66S | 2024 | 298 TH/s | 18.5 J/TH | 水冷/浸没式 |
| Whatsminer M6XS+ | 2025 | 190-450 TH/s | 17 J/TH | 多种 |
MicroBT 的策略是稳步精炼而不是戏剧性的架构跃迁。他们的 M60 系列使用 5nm 芯片,与 Bitmain 的 S21 产品线直接竞争。每瓦效率比 BM1370 这一代落后大约 10-15%——接近到足以让 Whatsminer 在 Bitmain 可用性受限的市场(亚洲部分地区、俄罗斯、某些非洲业务)继续受欢迎。
MicroBT 还没有宣布与 BM1373 等效的 3nm 芯片。行业分析师预计 2026 年末或 2027 年会有 Whatsminer M70 系列以缩小差距。在此之前,BM1373 / S23 系列在高端给 Bitmain 真正的效率领先。
不可预测因素:Auradine
Auradine 是一家美国的 ASIC 初创公司,在 2024 年纳什维尔的 Bitcoin 2024 上公开宣布了第一款西方设计的 3nm 比特币挖矿芯片——AT2880 Teraflux。规格(部署时验证):
- 工艺:3nm(与 BM1373 相同的节点)
- 每芯片算力:未正式发布,但设备级效率与 BM1370 / BM1373 这一代相当
- 用于他们的 Teraflux 挖矿单元(每设备 ~100-200 TH/s,~13-15 J/TH)
- 美国制造叙事:吸引关心供应链政治的北美机构买家
Auradine 还不是大批量玩家——他们的生产规模相对于 Bitmain 或 MicroBT 较小——但他们代表了第一个真正的西方挑战者,对抗中国挖矿 ASIC 的双头垄断。如果 2026-2027 年地缘政治对中国芯片出口的压力加剧,Auradine 可能会显著增长。他们的硅芯片在纸面上有竞争力。问题是制造规模。
架构深度解析:BM1368 和 BM1370 之间发生了什么变化
对于实际打开硬件的矿工,BM1368→BM1370 的过渡是 Bitmain 近期历史上最有趣的工程变化。两款芯片都使用相同的 5nm 工艺节点。相同的逻辑架构。相同的 SHA-256 核心。然而 BM1370 在相似的功耗下提供 ~70% 更多的每芯片算力。
怎么做到的?三件事:
- 每晶圆更多核心 — 精炼的 5nm 单元库允许更密集的 SHA-256 核心放置。在类似的晶圆面积上核心数大约 1.5 倍。
- 优化的供电 — BM1370 较宽的电压窗口(0.65V 到 1.30V)让芯片在低功率稳态和高功率突发模式之间动态缩放。BM1368 的窗口较窄。
- 更好的热耦合 — 芯片封装改进(不同的焊球间距、更好的散热器热界面)允许在更高的时钟速度下持续运行而不出现热节流。
对 Bitaxe 超频玩家来说,这意味着 BM1370 芯片可以在原装电压下推到 900+ MHz——这些频率会在几分钟内熔化 BM1368。这不是魔法;这是冶金学和封装。相同的硅芯片,更聪明的供电。
BM1373 的 3nm 跃迁实际带来什么
BM1373 是 Bitmain 第一款离开 5nm 节点的芯片。跃迁到 3nm 产生:
- ~33% 效率改进 在芯片级别(15 → 10 J/TH)
- ~2 倍每芯片算力(1.2 → 2.5 TH/s)
- ~50% 芯片数量减少 在等效的设备算力下
- 更低的热密度 — 即使在每芯片更高功率下,更小的晶圆意味着热量更容易提取
Antminer S23 Hyd 在 580 TH/s,9.5 J/TH 代表了广泛部署的 3nm SHA-256 硅芯片目前可能达到的水平。作为对比,上一代 S21 XP Hyd 需要 12 J/TH 才能达到 473 TH/s。相同的水冷包络。3nm 节点同时在两个轴上提供了 22% 更多的算力和 21% 更好的效率。这是真正的代际跃升,不是营销刷新。
这对独立矿工意味着什么?两件事:
- 旧硬件(S19 系列、M30 系列)正在迅速接近过时,对于任何支付零售电价的矿工而言。效率差距现在太大了。到 2026 年末,预计会有大量舰队退役。
- 桌面独立挖矿的天花板上移。Bitaxe 级单芯片 BM1373 构建将以桌面尺寸提供 2.5 TH/s。NerdQAxe 级 4 芯片构建将提供 10+ TH/s。这是”消费级”SHA-256 硅芯片的新地板。
经济图景:芯片代际和 ROI
对于运营舰队的矿工,问题不是”这个芯片酷不酷?“——而是”这个芯片在下一代让它过时之前能不能收回成本?“
在 $0.07/kWh 托管和当前 BTC 价格(~$96k)下的粗略 ROI 数学:
| 设备 | 日收入 | 日电费 | 日利润 | $4k 单元的 ROI |
|---|---|---|---|---|
| Antminer S19 (110 TH/s, 30 J/TH) | ~$4.50 | ~$5.50 | -$1.00 | 负 |
| Antminer S21 (200 TH/s, 17.5 J/TH) | ~$8.20 | ~$5.85 | +$2.35 | ~4.6 年 |
| Antminer S21+ (235 TH/s, 16.5 J/TH) | ~$9.65 | ~$6.50 | +$3.15 | ~3.5 年 |
| Antminer S21 Pro (234 TH/s, 15 J/TH) | ~$9.60 | ~$5.90 | +$3.70 | ~3.0 年 |
| Antminer S21 XP Hyd (473 TH/s, 12 J/TH) | ~$19.40 | ~$9.50 | +$9.90 | ~2.0 年 |
| Antminer S23 Hyd (580 TH/s, 9.5 J/TH) | ~$23.80 | ~$9.25 | +$14.55 | ~1.4 年 |
数字是说明性的——真实 ROI 取决于算力价格、难度、BTC 价格和正常运行时间——但方向性信息清楚。S23 系列重置了 ROI 表。旧的 S19 硬件现在在大多数司法管辖区在热力学和经济上都过时了。S21 和 S21+ 仍然有利可图,但回本期更长。S23 Hyd 是新的舰队旗舰,等待太久才升级的运营商将被难度增加挤出市场。
对独立挖矿(和 SoloFury)的影响
特别对独立矿工而言,芯片演进有三个直接后果:
1. Bitaxe 级硬件比以往任何时候都更可行
基于 BM1373 的单芯片矿机在 2.5 TH/s 显著改变了数学。对于 BC2 / BCH2 链,单个 BM1370 Bitaxe 每 1-2 天找到一个区块,一台 BM1373 设备将在数小时内找到。对于 XEC,单芯片的预期时间从 ~50 天下降到 ~25 天。消费级独立挖矿正在真正回归可行性,而不仅仅是彩票模式。
2. 工业 S21+ 舰队仍然是 BCH 的甜蜜点——目前
SoloFury 的 4× S21+ 舰队(共 940 TH/s)以平均每 22 天约 1 个的速度找到 BCH 区块。不管是哪一代,这个数学都成立,直到 BCH 网络算力显著上升(这需要在 BCH 上专门大规模部署 S21+/S23——目前没有发生)。对于 2026-2027 年,小型 S21+ 舰队仍然是个人 BCH 独立矿工最具成本效益的进入点。
3. 竞争压力是真实的
随着 S23 部署扩展,比特币网络算力将上升。使用旧硬件的运营商将被迫选择:升级、找到补贴电力或关闭。在较小链(BCH、BC2、BCH2、XEC)上的独立矿工免受这种压力影响,因为这些网络没有经历激进的 S23 部署。较小的链仍然是独立挖矿在结构上受保护的细分市场。
BM1373 之后会发生什么
Gufo 对 2027-2028 年的预测:
- 2nm BM1xxx — Bitmain 的下一个节点缩小。预期芯片级 4-5 J/TH,比 BM1373 好大约 50%。设备可能在 2027 年末可部署。
- 垂直/3D 堆叠 — 业界一直在试验内存的堆叠芯片晶圆。挖矿 ASIC 可能跟进。这可能在没有进一步节点缩小的情况下提供 2-3 倍每芯片算力。
- 供电创新 — 直接片上 DC-DC 转换器、集成冷却通道、更激进的电压缩放。架构胜利现在与工艺节点胜利同样重要。
- “琐碎”收益的终结 — 2nm 以下的工艺缩小变得过于昂贵。未来的效率改进将越来越多地来自架构,而不是光刻。创新放缓但不停止。
结语
十年的比特币挖矿硅芯片产生了 20 倍的效率改进和 83 倍的每芯片算力增加。芯片变得更小、更快、单位工作更便宜,并且越来越普及。相同的算法。相同的网络。相同的 Satoshi 白皮书。只是更好的硅芯片,年复一年。
对于独立矿工,这既是好消息也是坏消息。坏消息:网络每年都变得更难,小运营商必须升级或接受较小的相对份额。好消息:你家里的 Bitaxe Gamma 与工业农场的 BM1373 具有相同的每哈希概率。芯片不知道它小。网络不在乎。概率在哈希数量上是均匀的,无论谁计算的。
BM1373 是 2026 年比特币挖矿所处的位置:3nm 硅芯片,10 J/TH,每芯片 2.5 TH/s,部署在从桌面 NerdQAxe 构建到每个消耗 11kW 的机架式 3U 巨兽的机器中。从 BM1385 的 200 J/TH 到 BM1373 的 10 J/TH,十一年。下一个十一年可能会带来另外 5-10 倍的改进。芯片将继续缩小。网络将继续调整。数学将继续工作。
选择你的硅芯片。选择你的链。插入。等待。骰子仍在滚动。
每个芯片都是物理学的小奇迹:数十亿晶体管每秒切换数十亿次,计算一个特定的密码学谜题,追求一个数字,最终,凭借耐心和运气,将解锁一个区块。猫头鹰知道:硅芯片在演进,但狩猎不变。