开源技术
-
阿里巴巴宣布,语音合成技术DreamTalk发布新的测试链接
阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。这个项目的开源意味着更多的开发者和研究人员可以使用这项技术,为其添加新的功…
-
苹果多模态大语言模型Ferret正式开源发布
今年10月,苹果和哥伦比亚大学的研究团队共同发布了一个名为Ferret的多模态大语言模型。相较于传统模型,Ferret的独特之处在于其能够精准地识别并描述图像内容,同时还能准确地辨别和定位图像中的各种元素。 Ferret…
-
苹果对外发布 MLX(开源模型运行软件框架)
昨天,苹果的机器学习研究团队发布了一个新的开源模型运行软件框架,名为 MLX。这是一个专为苹果 M 系列芯片设计的高效机器学习框架,旨在让配备 M 系列芯片的设备能够更有效地进行深度学习训练。 据 GitHub 主页显…