大模型技术
-
联发科发布70亿参数大语言模型MR Breeze-7B:双语处理能力强,助力数据洞察
联发科旗下知名研究机构联发科技研究中心(MediaTek Research)近日公开宣布,他们已成功研发并推出了全新的开源大语言模型(LLM)——MR Breeze-7B。这款模型凭借其强大的双语处理能力和数据洞察特性,正引领着人工…
-
蚂蚁集团发布革命性多模态遥感基础模型SkySense
近日,蚂蚁集团宣布推出其全新的20亿参数多模态遥感基础模型——SkySense,该模型在业界引起了广泛关注。值得一提的是,SkySense的相关论文已被国际顶级AI会议CVPR 2024收录,并在17项测试中均取得了第一名的优异成绩…
-
苹果Spotlight搜索即将迎来AI驱动的史诗级更新
据彭博社独家报道,苹果公司正在紧锣密鼓地推进其产品中的人工智能(AI)元素的整合,其中Spotlight搜索功能将迎来一次革命性的更新。这项内置于macOS和iOS系统的快速搜索工具,未来有望通过AI技术的加持,实现更为…
-
谷歌扩展Gemini大语言模型接口,为开发者提供更多功能
谷歌正通过其Vertex AI平台向开发者提供更广泛的Gemini大语言模型接口。据TechCrunch报道,Gemini 1.0 Pro在公开预览后已正式上市,同时,更高级别的Gemini 1.0 Ultra虽目前仅通过白名单提供,但其性能已引起业界关…
-
谷歌发布全新AI大模型Gemini 1.5:性能逼近GPT-4,掀起新的一轮AI技术竞赛
近日,科技巨头谷歌宣布推出其全新AI大模型——Gemini 1.5,这一重大突破再次将人工智能技术的边界推向新的高度。作为谷歌在AI领域的最新力作,Gemini 1.5不仅在性能上实现了惊人的提升,更在功能和应用场景上展现出…
-
谷歌发布创新音乐生成系统MusicRL:结合人类反馈与强化学习提升音乐品质
谷歌最近发布了一款名为MusicRL的音乐生成系统,该系统通过结合人类反馈与强化学习,显著提升了生成音乐的质量,使其更符合人类的品味。这一突破性的技术是基于预训练的MusicLM模型,该模型原本就能根据文本描述生…
-
谷歌推出Bard新版更新:支持文生图、扩展双重检查功能
谷歌近日发布了聊天机器人Bard的新版更新,此次更新后Bard将支持文生图和扩展双重检查功能。 Bard新增的图像生成功能将在全球受支持的地区免费提供,由谷歌Imagen 2模型提供支持,但需要使用英语指令。用户可以根据…
-
亚马逊研究者指出,大语言模型的训练需警惕数据陷阱
据 Techradar 报道,亚马逊的研究人员提醒,在大语言模型的训练过程中,需要警惕数据陷阱。他们指出,当前网络上存在大量由机器翻译生成的内容,这些低质量的内容可能会对训练过程造成困扰。 研究人员发现,大量网…
-
艾伦人工智能研究所开源文本生成AI模型及训练数据
艾伦人工智能研究所(AI2)近日宣布,将向公众开源其最新研发的文本生成AI模型以及用于训练这些模型的数据。这一举措旨在推动人工智能领域的发展,并促进学术界和工业界的交流与合作。 据悉,AI2此次开源的文本生成…
-
vivo对外公布2023年度十大产品技术创新盘点
近日,vivo 发布了「2023 年度科技创新」十大产品技术创新榜单,这标志着 vivo 在技术研发和创新方面的强大实力。此次发布的技术创新涵盖了多个领域,包括芯片技术、影像技术、续航系统等,为全球消费者带来更优质…
-
上海AI实验室推出新一代书生·视觉大模型:60亿参数引领视觉与语言精细对齐
上海AI实验室发布了新一代书生·视觉大模型,即InternVL-6B。这一模型的视觉编码器参数量达到了60亿,并采用了对比-生成融合的渐进式对齐技术,实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。 除了上…
-
华为与香港大学联手发布新型图像生成模型CompAgent
华为与香港大学的研究团队近日共同发布了一种名为CompAgent的新型图像生成模型。该模型主要用于解决组合文本到图像生成的问题,为人工智能领域带来了新的突破。 CompAgent的核心思想是采用分而治之的方法,将复杂的…
-
Meta推出3D格式Mosaic-SDF:革新AI模型,加速三维生成模型的发展
Meta近日发布了一篇论文,介绍了一种全新的3D格式Mosaic-SDF。这种3D格式是专为AI模型定制的,旨在加速三维生成模型的发展。 Mosaic-SDF采用了具有不同中心和尺度的小体积网格来近似任意的符号距离函数。这种设计使…
-
为改进光影效果,腾讯对外发布视频生成模型VideoCrafter2
腾讯近日发布了视频生成模型 VideoCrafter2,该模型在光影效果等方面有了大幅提升。VideoCrafter2可以根据用户提供的文字描述,快速生成几秒钟的高质量视频。相比之前的版本,新模型在画面质量、人物动作等方面有了…
-
能解奥数题的大模型来了!谷歌推出新型大模型Alpha Geometry
谷歌最近发布了一种新型的大模型——Alpha Geometry,该模型专门针对数学几何领域,其数学几何能力已经达到了人类奥林匹克金牌选手的水平。值得一提的是,该模型的训练是基于合成数据而不是现有的数据集,这一创新方…
-
百川智能发布全新角色大模型Baichuan-NPC:优化对话能力,推动游戏产业创新
近日,百川智能发布了全新的角色大模型 Baichuan-NPC,旨在为游戏产业带来更丰富、更真实的角色体验。该模型优化了“角色知识”和“对话能力”,使模型能够更好地理解上下文对话语义,更加符合人物性格地进行对话和行动…
-
vivo S18 Pro:大模型加持,AI时代的智能手机新标杆
随着科技的飞速发展,人工智能已经渗透到我们生活的方方面面。近日,vivo 宣布其新款旗舰手机 S18 Pro 将于 1 月 13 日正式开售,这款手机搭载了最新的人工智能大模型,为我们的日常生活带来了更多便利和惊喜。 作…
-
美图公司自研AI视觉大模型MiracleVision面向公众正式开放
1月2日,美图公司自研的AI视觉大模型MiracleVision(奇想智能)正式通过《生成式人工智能服务管理暂行办法》备案,并向公众开放。这一创新技术自面世以来持续迭代,目前已经升级至4.0版本,不仅广泛应用于美图旗下…
-
清华联手哈佛团队推出大语言模型系统LangSplat
清华大学与哈佛大学的研究团队近日联合发布了最新的大语言模型系统LangSplat。据Arxiv页面显示,这款模型基于3DGS的3D语言场方法,并引入了SAM和CLIP技术,在开放词汇3D对象定位和语义分割任务上表现出色,不仅优于…
-
快手AI KwaiAgents近日开源,测试效果超越GPT-3.5
快手联合哈尔滨工业大学近日开源了KwaiAgents模型,该模型实现了7B/13B模型的跨越效果,性能超越了GPT-3.5。这一开源项目为整个社区注入了新的活力,为研究者提供了丰富的资源和参考。 KwaiAgents模型包括三个部分…
-
谷歌创始人亲自投身研究:谢尔盖·布林与Gemini大模型的密切合作
近日,一则关于谷歌联合创始人谢尔盖·布林(Sergey Brin)亲自参与谷歌最新大模型Gemini研发的消息引起了广泛关注。据报道,布林不仅在研发过程中投入了大量时间和精力,甚至在关键时刻亲自为Gemini写代码,每周工…
-
同济、复旦大学联合发布解决大模型幻觉问题的RAG技术
在人工智能领域,大模型已经成为了许多应用的基石。然而,随着其应用的广泛,大模型的幻觉问题也日益凸显。近日,同济大学与复旦大学的研究团队联手,发布了一种名为“检索增强生成(RAG)”的新方法,旨在解决这一挑…
-
苹果多模态大语言模型Ferret正式开源发布
今年10月,苹果和哥伦比亚大学的研究团队共同发布了一个名为Ferret的多模态大语言模型。相较于传统模型,Ferret的独特之处在于其能够精准地识别并描述图像内容,同时还能准确地辨别和定位图像中的各种元素。 Ferret…
-
百川智能创始人王小川表示,不仅要用模型也要造模型
在当今的大模型时代,许多企业和技术人员都热衷于自己训练模型。对此,百川智能创始人、CEO王小川在12月21日的发言中表示,使用模型和创造模型都是非常重要的。 王小川认为,当前行业中出现了许多模型,许多企业和…
-
AI发型生成器发布:用文字生成3D发型,为时尚设计带来无限可能
近日,来自马克思普朗克智能系统研究所、苏黎世联邦理工学院以及达姆施塔特工业大学的研究者们发布了一款AI发型生成器,这款工具可以通过文本来生成3D发型模型,为时尚设计领域带来了无限可能。 这款AI发型生成器名…
-
丹麦科技大学研发全新AI大模型Life2vec,可用AI预测人类寿命
丹麦科技大学最近公布了他们的最新研究成果——一款名为Life2vec的AI大模型,该模型能够预测人类的死亡时间。这一发现引起了广泛关注,因为这一技术有可能改变我们对生命和死亡的理解。 Life2vec模型是基于大量数据训…
-
Adobe推出全新AI大模型技术,可利用AI进行字体设计
Adobe、马萨诸塞州大学、谷歌以及多伦多大学的研究者们近日发布了一项名为VecFusion的神经架构,利用AI大模型来设计字体。这一创新的研究成果为字体设计领域带来了新的可能性。 VecFusion是一个级联扩散模型,由一…
-
2023云智大会,百度多款AI原生云产品正式发布
百度在2023年的云智大会·智算大会上发布了多款AI原生云产品,其中包括AI异构计算平台“百舸3.0”、智算网络平台和自研云原生数据库GaiaDB 4.0等。这些新产品在AI计算、网络和存储等方面进行了全面的优化升级,为AI应…
-
清华大学联手华为发布新技术,可增加大模型文本输入限制
近日,清华大学与华为研究团队联合发布了一项新技术,通过语义压缩技术,可以提高大模型文本输入的限制。这一技术的推出,为大模型在文本处理领域的应用提供了更广阔的空间。 该技术从信息论中的源编码中汲取灵感,…
-
大模型现在可以在创建小型AI工具,实现自我复制
近日,来自多所高校的研究者团队与AI技术公司Aizip联手表示,现在已经可以让大语言模型在一定程度上实现自我复制。这一突破性的进展将为AI领域带来新的可能性,并有望推动小型AI工具的发展。 据Aizip CEO Yan Su表…
-
谷歌DeepMind用AI解决纯数学领域长期悬而未决的问题
谷歌DeepMind近期使用大型语言模型在纯数学领域破解了一个长期悬而未决的问题。在发表在Nature杂志上的一篇论文中,研究人员表示这是第一次使用大型语言模型来发现一个科学难题的解决方案,产生了从未存在的可验证…
-
Google发布强大的文生图模型Imagen 2,提升图像生成质量
近日,Google宣布推出其最新文生图大模型Imagen 2,为用户提供更加高质量、逼真的图像生成服务。 Imagen 2是利用Google DeepMind的技术开发的,并在5月份的科技巨头I/O大会上进行了预览。与第一代Imagen相比,Image…
-
NyunAI 与 Transmute AI Lab 联合公布大模型压缩方法:基于减阶建模的参数化
近日,NyunAI 与 Transmute AI Lab 在 Arxiv 页面上发布了联合研究的论文,揭示了一种全新的大模型压缩方法。这一方法基于减阶建模的参数化,为大模型的压缩提供了有效的解决方案。 该方法的核心在于在特征空间内进…
-
微软发布小语言模型 AI Phi-2:展示出色推理和语言理解能力
微软研究院最近发布了新的AI语言模型Phi-2,这是一个小型的语言模型,展示了出色的推理和语言理解能力。 Phi-2模型仅有27亿参数,虽然规模较小,但其在复杂的基准测试中的性能可以与一些更大的模型相媲美,甚至超越…