
根据周五的媒体报道,预计META将在本月发布大型语言模型Llama 4的新一代开放资源。这种大语言模型的发布至少在两次之前发布了两次,并且仍然有可能延迟。
自上一代Llama 3发行以来已经将近一年了,其中包含META在AI军备竞赛中的技术挑战。
根据META的内部试验,Llama 4的数学推理(GSM8K基准)和代码生成(HumaneVal)的数学推理增加了37%。
这种大语言模型的许多延迟的主要原因是,多模式清洁培训数据遇到障碍,尤其是视频文本对齐的质量不满意。该模型需要协调16,000H100 GPU簇,其能耗是Llama培训3的2.3倍。
行业观察者指出,如果再次推迟,元将错过关键disp六月开发人员会议的外行窗口。竞争对手人类的Claude 4和Google Gemini 2.0计划分别发布有关第三季度的重大更新。
金融的官方帐户
24小时广播滚动滚动最新的财务和视频信息,并扫描QR码以供更多粉丝遵循(Sinafinance)