苹果推出开放语言模型OpenELM

현재 언어 번역이 없어 원문을 표시합니다.

PANews 4月25日消息,据ZAKER报道,苹果研究团队推出了一种先进的开放语言模型OpenELM。OpenELM使用分层缩放策略,在transformer模型的每一层中有效地分配参数,从而提高了准确性。例如,在参数预算约为10亿的情况下,OpenELM 的准确率比OLMo提高了2.36%,而所需的预训练token却减少了2倍。

与之前只提供模型权重、推理代码以及在私有数据集上进行预训练的做法不同,OpenELM包含了在公共可用数据集上对语言模型进行训练和评估的完整框架,包括训练日志、多个检查点和预训练配置。此外,他们还发布了将模型转换为MLX库的代码,从而在苹果设备上进行推理和微调。

早在今年2月,苹果公司CEO TimCook表示,苹果生成式AI功能将于“今年晚些时候”推出,有消息称即将在6月发布iOS 18可能是苹果iOS史上“最大”的更新,而9月也将推出首款AI iPhone设备。

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
관련 특집
PANews APP
금 현물 가격이 4,700달러를 돌파했습니다.
PANews 속보