大模型训练
-
亚马逊研究者指出,大语言模型的训练需警惕数据陷阱
据 Techradar 报道,亚马逊的研究人员提醒,在大语言模型的训练过程中,需要警惕数据陷阱。他们指出,当前网络上存在大量由机器翻译生成的内容,这些低质量的内容可能会对训练过程造成困扰。 研究人员发现,大量网…
-
防止艺术作品被AI训练,芝加哥大学研发AI污染工具Nightshade
芝加哥大学的电脑科学研究团队近日发布了一款名为Nightshade的工具,旨在防止AI系统对艺术作品进行训练和学习。这款工具的原理是在画素层级加入数据,使得无论是人类还是AI系统都无法简单辨识,但如果用于训练AI模…
-
艾伦人工智能研究所开源文本生成AI模型及训练数据
艾伦人工智能研究所(AI2)近日宣布,将向公众开源其最新研发的文本生成AI模型以及用于训练这些模型的数据。这一举措旨在推动人工智能领域的发展,并促进学术界和工业界的交流与合作。 据悉,AI2此次开源的文本生成…
-
苹果寻求与大型出版商合作,用新闻采集权训练AI
近日,据《纽约时报》报道,苹果公司正在积极与多家主流新闻出版商洽谈内容许可协议。此举旨在获取训练AI系统所需的大量新闻数据。为了实现这一目标,苹果已经与Condé Nast、NBC News和IAC等知名媒体机构进行了初步…
-
尴尬了,谷歌Gemini疑似使用百度文心一言训练,引发网友热议
近日,有网友在Google Vertex AI平台使用Gemini进行中文对话时发现,Gemini-Pro自称是百度语言大模型。这一消息引发了网友们的热议和关注。 据微博大V@阑夕爆料,在对Google Gemini进行测试时,如果用中文询问Gemin…