苹果推出开放语言模型OpenELM

현재 언어 번역이 없어 원문을 표시합니다.

PANews 4月25日消息,据ZAKER报道,苹果研究团队推出了一种先进的开放语言模型OpenELM。OpenELM使用分层缩放策略,在transformer模型的每一层中有效地分配参数,从而提高了准确性。例如,在参数预算约为10亿的情况下,OpenELM 的准确率比OLMo提高了2.36%,而所需的预训练token却减少了2倍。

与之前只提供模型权重、推理代码以及在私有数据集上进行预训练的做法不同,OpenELM包含了在公共可用数据集上对语言模型进行训练和评估的完整框架,包括训练日志、多个检查点和预训练配置。此外,他们还发布了将模型转换为MLX库的代码,从而在苹果设备上进行推理和微调。

早在今年2月,苹果公司CEO TimCook表示,苹果生成式AI功能将于“今年晚些时候”推出,有消息称即将在6月发布iOS 18可能是苹果iOS史上“最大”的更新,而9月也将推出首款AI iPhone设备。

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
PANews APP
Etched, 8억 달러 조달로 저지연 AI 추론 클러스터 구축…10억 달러 이상 주문 확보
PANews 속보