Para las empresas de grandes modelos, RL es evidentemente una dirección inevitable; resolver problemas de ingeniería y de estabilidad en el entrenamiento es el primer elemento.
1. Problemas de ingeniería Cómo integrar varias herramientas de agente para que funcionen, solo así el ecosistema podrá crecer y la rueda voladora podrá comenzar a girar. 2. Estabilidad de entrenamiento No colapsar es fundamental, no te subas si va a colapsar.
¡Aquí me gusta ciertas empresas! ¡Realmente están haciendo cosas!
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
11 me gusta
Recompensa
11
8
Compartir
Comentar
0/400
LadderToolGuy
· 07-30 23:19
Solo hacer las cosas sin gritar lemas
Ver originalesResponder0
BlockchainDecoder
· 07-30 08:26
La capacitación necesita urgentemente optimización del rendimiento
Ver originalesResponder0
FallingLeaf
· 07-30 07:58
La estabilidad es lo más importante.
Ver originalesResponder0
OnChainDetective
· 07-30 07:58
La estabilidad es lo más importante.
Ver originalesResponder0
ForumLurker
· 07-30 07:57
El problema de la estabilidad es realmente difícil de manejar.
Para las empresas de grandes modelos, RL es evidentemente una dirección inevitable; resolver problemas de ingeniería y de estabilidad en el entrenamiento es el primer elemento.
1. Problemas de ingeniería
Cómo integrar varias herramientas de agente para que funcionen, solo así el ecosistema podrá crecer y la rueda voladora podrá comenzar a girar.
2. Estabilidad de entrenamiento
No colapsar es fundamental, no te subas si va a colapsar.
¡Aquí me gusta ciertas empresas! ¡Realmente están haciendo cosas!