傅盛的大模型，只做百亿级，这是为啥

xinwen.mobi · 发表于 2024-1-23 06:15:41

傅盛的大模型选择只做百亿级，可能是出于以下几个原因：

资源和时间限制：百亿级的模型需要大量的计算资源和时间来训练和优化。如果模型规模过大，可能会超出团队的资源和能力范围，导致训练和优化的难度增加。

数据质量和规模：百亿级的模型需要大量高质量的训练数据来支持其准确性和泛化能力。如果数据规模不够大或数据质量不够高，可能会影响模型的性能。

模型复杂性和稳定性：百亿级的模型通常非常复杂，需要大量的参数和复杂的模型结构来支持其性能。然而，这种复杂性也可能导致模型的不稳定性和过拟合问题。

模型应用场景：百亿级的模型可能更适合某些特定的应用场景，例如自然语言处理、图像识别等。如果模型规模过小，可能无法满足某些应用场景的需求。

因此，傅盛的大模型选择只做百亿级，可能是为了在资源和时间限制下，保证模型的性能和稳定性，并满足特定的应用场景需求。

		自动登录	找回密码
密码			立即注册

傅盛的大模型，只做百亿级，这是为啥

相关帖子