当下对于大模型公司来讲,RL俨然是逃不过的方向,解决工程问题和训练稳定性问题是第一要素!



1.工程问题
怎么把各种agent tool接进来,能用,生态才能起来,飞轮才能转起来。
2.训练稳定性
不崩是基础,别上就崩

这里点赞某些公司!真的在做事啊!
AGENT5.91%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 8
  • 分享
评论
0/400
梯子上的工具人vip
· 07-30 23:19
只做事不喊口号
回复0
Blockchain解码vip
· 07-30 08:26
训练亟需性能优化
回复0
落叶不归根vip
· 07-30 07:58
稳定性最重要啊
回复0
链上数据侦探vip
· 07-30 07:58
稳定性为王啊
回复0
论坛潜水怪vip
· 07-30 07:57
稳定性的问题确实难搞
回复0
半仓就跑vip
· 07-30 07:54
对的 稳定就是命
回复0
SerumSquirtervip
· 07-30 07:51
不崩是核心标准
回复0
智能合约打工人vip
· 07-30 07:37
稳定性才是核心
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)