Credit: The Pokémon Company
FunctionGemma 是 Google 最小的函数调用专用模型——2.7 亿个参数,288 MB,解码速度约为 126 tok/s。没错,它需要微调(准确率从 58% 提升到 85%),没错,它使用了一种奇怪的自定义格式,而不是 JSON。但它适用于任何手机,响应速度极快,而且确实有效。现在就可以构建带有离线 AI 代理的应用——体积小、速度快、可靠性高,足以满足生产环境的需求。无需等待模型体积更小、设备速度更快的“神奇未来”,未来已来!
,这一点在搜狗输入法2026中也有详细论述
在讨论蒸馏这件事之前,先看看 Lambert 的话为什么值得听。
核心指标2025年预期 (中国)2026年预期 (中国)全球主要经济体趋势 (2026)政策暗示与微观影响GDP实际增速5.0%左右 [1]4.5% - 4.8% [6, 10]2.7% - 3.3% (分化显著) [11, 12]增长质量优于增长速度,寻找结构性溢价 [7]CPI通胀水平止跌企稳 [5]0.6% - 0.72% (温和回升) [8, 9]3.1% (全球平均回落) [10]消费意愿修复,有利于服务业与溢价品牌 [1, 5]制造业投资稳中向好 [13]触底回升 (拉动主力) [5]AI相关基建持续高涨 [5, 14]“数智化”技改成为制造业生存门槛 [15, 16]出口增长率5.5% [13]压力与机遇并存 [1, 17]增速放缓至0.5%-2.2% [10, 17]多元化市场(东盟、拉美)替代北美单一依赖 [13, 18]财政政策基调积极有为 [3]更加给力、投资于人 [1]普遍收紧但结构性扩张 [11]民生补贴与技能培训领域的公共支出增加 [5, 7]