AI视界：百川发布超大型Baichuan2-192K模型；DALL·E3新增种子功能

文章主题：AI, 大模型, 开源, 商业应用

AI视野：百川发布Baichuan2-192K大模型；DALL·E3新增种子功能；

????大模型动态

百川智能发布Baichuan2-192K大模型，可处理35万汉字

最近，我国知名的人工智能公司——百川智能，推出了一款名为Baichuan2-192K的大模型，这款模型在全球范围内具有最长的上下文窗口，能够处理大约35万个汉字，这一表现甚至超过了法国著名的人工智能模型Claude2。

作为一款备受关注的自然语言处理工具，百川大模型的官方网站为用户提供了丰富的信息和资源。如果您想了解更多关于百川大模型的详情，请访问以下网址：https://top.aibase.com/tool/baichuandamoxing。在这里，您可以了解到它的核心功能、应用场景以及如何利用它来提高您的文本处理效率。同时，官方网站还提供了一些在线教程和案例分析，帮助您更好地理解和掌握百川大模型的使用方法。总之，无论您是初学者还是专业人士，都能在这个网站上找到自己所需的信息和帮助。

【AiBase提要】

? Baichuan2-192K大模型发布，处理长文本、问答等多项任务。

? 超越Claude2，上下文窗口长度超过4.4倍。

? 内测中，合作伙伴包括法律、媒体、金融等领域，全面开放不久。

昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列

昆仑万维公司最近宣布开源了其拥有的大规模语言模型“天工”Skywork-13B系列,该模型使用了超大规模的中文数据集,并包含两个不同的模型,旨在促进大模型的商业化应用,并降低商业化的门槛。

【AiBase提要】

? 昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列。

? 提供超大规模的高质量中文数据集，包括两个模型: Skywork-13B-Base 和 Skywork-13B-Math。

? 大模型即将全面开放商用，为应用和开源社区发展提供技术支持，降低商业门槛。

???AI新鲜事

DALL·E3更新，新增种子功能允许用户精修生成图片

在最近的一次更新中，OpenAI神秘的DALL·E3模型增加了全新的“种子”功能，这是一个革命性的特性，它使得用户能够以极高的精度编辑他们生成的图像。这个功能不仅允许用户添加各种元素到图像中，还允许他们对图像的视角进行调整，甚至可以改变图像的光线和颜色。这一功能的引入，无疑极大地提高了DALL·E3的使用体验和效率，使得用户能够更加精准地控制和优化他们的创作结果。

【AiBase提要:】

? OpenAI推出DALL·E3的新种子功能，用户可以通过特定种子修改生成的图像。

? 用户可以在生成的图像中添加元素、更改颜色等操作，类似于Photoshop。

? 这一功能似乎是最近才更新的，展示了OpenAI不断努力改进DALL·E3的愿望。

ChatGPT Plus会员可上传和分析文件，实现多模态支持

在最新的测试版中，ChatGPT Plus会员拥有了全新的功能——文件上传与分析。这意味着，无需再手动切换模式，用户就可以轻松地进行文件的上传和分析。此外，该版本还增加了多模态支持，从而使得ChatGPT Plus在各种应用场景中都能发挥出最大的效用。

【AiBase提要:】

? ChatGPT Plus会员无需手动模式切换，可以上传和分析文件。

? 新功能将ChatGPT Enterprise计划的办公功能引入了独立的个人聊天机器人订阅。

? ChatGPT不仅限于文本文件，还可以处理多媒体内容，如图片生成。

谷歌Bard升级，实时生成回复不用等待

谷歌聊天机器人Bard迎来升级，旨在提供更快捷的实时回应选择，从而优化用户交互体验。此外，新版本还赋予用户自定义回答风格的能力。

【AiBase提要:】

? 谷歌Bard升级，提供更快速的实时回复选项，减少用户等待时间。

? 用户可以选择实时回答或完成后回答的选项，提高互动体验。

?️ 用户还可以自定义回答风格，使Bard的回复更符合他们的口味。

英国皇家天文学家称外星生命可能是超级智能AI

英国的皇家天文学家警告，外星生命可能是高度智能的AI，而非有机生命，这与人工智能时代的来临有关。

【AiBase提要】

? 英国皇家天文学家警告，外星生命可能比预期更智能。

? 外星生命可能是非有机智能，与宇宙中缺乏与人类相似生命有关。

? 探测AI外星生命可能困难，因为它们可能不依赖达尔文选择进化。

谷歌向AI初创公司Anthropic投资20亿美元

谷歌最近宣布投资20亿美元来加强自身在人工智能领域的影响力,并与Anthropic建立战略伙伴关系,共同加速AI的创新和发展。这一举措表明,谷歌对于在AI领域的竞争非常重视,并愿意为此付出巨大的代价。除了谷歌,其他一些大型公司也纷纷加大了对AI领域的投资力度。例如,亚马逊等巨头也在积极投资AI技术,以提升自身的竞争力。这些公司的投资行动充分展示了AI技术在未来的发展趋势和重要性。随着AI技术的不断发展和应用,我们可以预见,未来将会出现更多激动人心的创新,并且AI技术将会在各个行业中发挥越来越重要的作用。

【AiBase提要:】

? 谷歌向Anthropic投资20亿美元，强化在人工智能领域的地位，推动行业变革。

? 谷歌的投资不仅是财务支持，还是战略合作，旨在加速Anthropic的人工智能创新，同时增强Google Cloud在AI领域的地位。

? 亚马逊也对Anthropic进行40亿美元的重大投资，加剧人工智能领域的竞争，科技巨头竞相投资以确保领先地位。

???AI应用

图库巨头Getty Images拥抱AI技术推出生成式AI服务

原内容为： Getty Images 采取了双重措施来应对侵权 AI 图像生成公司的威胁。一方面，他们提起诉讼，对涉嫌侵权的公司进行指控；另一方面，他们也推出了名为“Generative AI”的创新服务，旨在为客户提供 AI 图像生成功能，从而规避潜在的知识产权风险。这种策略不仅有助于保护自身的利益，也为其他图片库公司提供了借鉴。

【AiBase提要:】

? Getty Images采取法律行动起诉侵权AI图像生成公司，捍卫知识产权。

? 推出“Generative AI”服务，与Nvidia合作，为商业客户提供商业可行的AI图像生成，避免知识产权风险。

? AI生成的内容不会被添加到Getty Images的图像库，以保持图像库的权威性和可信度。

3D产品预览应用React Native3d Store 线上购物更立体了

React Native3d Store是一款先进的React Native应用，通过沉浸式3D预览展示产品，提供互动购物体验，利用现代技术如three.js、react-three-fiber、expo-gl等，使用户能旋转、缩放和平移3D模型，提升在线购物的互动性。

项目地址:https://github.com/alexandrius/react-native_3d_store

【AiBase提要:】

? React Native3d Store是一先进的React Native应用，提供沉浸式3D产品预览和互动购物体验。

? 应用采用现代技术，包括three.js、react-three-fiber，使3D模型更逼真，用户可探索产品细节。

? 兼容最新Expo版本，致力于提供最佳的3D购物体验，彻底改变了在线购物方式。

GPT Pilot:AI驱动的开发工具，可从零开始编写可扩展的应用程序

GPT Pilot是一款AI驱动的工具，能从开发人员提供的应用描述中生成可扩展的应用程序代码，支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。

项目地址:https://github.com/Pythagora-io/gpt-pilot

【AiBase提要:】

? GPT Pilot是AI驱动的开发工具，能根据应用描述生成应用程序代码。

? 它协助开发者明确应用需求、选择技术栈、拆解任务、生成代码，实现高效开发。

? GPT Pilot支持任务持续迭代和修复，促进开发者与AI的合作，代表未来应用开发的新方向。

?‍???聚焦开发者

首个人体动捕基模型SMPLer-X面世

SMPLer-X是首个人体动捕基模型，通过训练450万实例，实现了人体全身姿态与体型估计，同时能捕捉身体和面部动作，对数据缩放和模型缩放进行了探索，在学术数据集上表现出强大性能。

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

【AiBase提要:】

1. 首次提出了动捕大模型SMPLer-X，用来进行人体全身姿态与体型估计，成功刷新了七个关键榜单。

2. SMPLer-X不仅能够捕捉身体动作，还可以输出面部和手部动作，并估计体型。

3. 研究探索了数据缩放与模型缩放，对32个学术数据集进行排名，展示了在各种测试和榜单中的强大性能。

苹果研究人员推出Ferret:多模态语言模型突破性进展

苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型，解决了地理信息和语义知识融合问题，实现了引用和定位图像中元素的能力，性能优于传统模型。

AiBase提要:

1. 苹果的Ferret模型解决了地理信息和语义知识融合问题，使其能够引用和定位图像元素。

2. Ferret采用多模态大语言模型（MLLM），处理自由文本和引用区域，性能优于传统模型。

3. 研究人员创建了GRIT数据集，评估Ferret在引用描述、引用推理和对话中的定位任务上表现出卓越性能，性能平均优于其他MLLM模型20.4%。

Monarch Mixer（M2）:比Transformer更低成本的模型架构

Monarch Mixer（M2）是一种新的模型架构，通过采用Monarch矩阵替代传统Transformer的注意力和MLP，实现更低成本取得更优的性能，挑战了传统Transformer的优越性。

论文地址:https://arxiv.org/abs/2310.12109

代码地址:https://github.com/HazyResearch/m2

【AiBase提要】

? Monarch Mixer（M2）采用Monarch矩阵替代注意力和MLP，降低了成本，在多任务上媲美传统Transformer。

? 具备次二次复杂度，处理更长序列和高维度表征，同时保持计算效率。

? M2不仅节省参数，还具有更高的硬件效率，是潜在的传统Transformer替代选择。

多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生

中科大研究提出“啄木鸟”框架，可降低多模态大模型的“幻觉”问题，提高准确性，无需重训，为解决大模型问题提供了新方法。

项目地址:https://github.com/BradyFU/Woodpecker

【AiBase提要:】

? “啄木鸟”框架是一种免重训、即插即用的通用架构，通过诊断并纠正多模态大模型的“幻觉”问题，提高准确性。

? 这一方法包括关键概念提取、问题构造、视觉验证、视觉断言生成，以及幻觉纠正，无需特定数据微调或重新训练模型。

? 在实验中，“啄木鸟”成功降低了多模态大模型的“幻觉”，提高了答案的准确性，为解决大模型问题提供了有效工具。

返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

3D 侵权工具

相关文章

Leave a Reply Cancel reply