文章主题:AI, 大模型, 开源, 商业应用

666AI工具大全,助力做AI时代先行者!

AI视野:百川发布Baichuan2-192K大模型;DALL·E3新增种子功能;

????大模型动态

百川智能发布Baichuan2-192K大模型,可处理35万汉字

最近,我国知名的人工智能公司——百川智能,推出了一款名为Baichuan2-192K的大模型,这款模型在全球范围内具有最长的上下文窗口,能够处理大约35万个汉字,这一表现甚至超过了法国著名的人工智能模型Claude2。

作为一款备受关注的自然语言处理工具,百川大模型的官方网站为用户提供了丰富的信息和资源。如果您想了解更多关于百川大模型的详情,请访问以下网址:https://top.aibase.com/tool/baichuandamoxing。在这里,您可以了解到它的核心功能、应用场景以及如何利用它来提高您的文本处理效率。同时,官方网站还提供了一些在线教程和案例分析,帮助您更好地理解和掌握百川大模型的使用方法。总之,无论您是初学者还是专业人士,都能在这个网站上找到自己所需的信息和帮助。

【AiBase提要】

? Baichuan2-192K大模型发布,处理长文本、问答等多项任务。

? 超越Claude2,上下文窗口长度超过4.4倍。

? 内测中,合作伙伴包括法律、媒体、金融等领域,全面开放不久。

昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列

昆仑万维公司最近宣布开源了其拥有的大规模语言模型“天工”Skywork-13B系列,该模型使用了超大规模的中文数据集,并包含两个不同的模型,旨在促进大模型的商业化应用,并降低商业化的门槛。

【AiBase提要】

? 昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列。

? 提供超大规模的高质量中文数据集,包括两个模型: Skywork-13B-Base 和 Skywork-13B-Math。

? 大模型即将全面开放商用,为应用和开源社区发展提供技术支持,降低商业门槛。

???AI新鲜事

DALL·E3更新,新增种子功能允许用户精修生成图片

在最近的一次更新中,OpenAI神秘的DALL·E3模型增加了全新的“种子”功能,这是一个革命性的特性,它使得用户能够以极高的精度编辑他们生成的图像。这个功能不仅允许用户添加各种元素到图像中,还允许他们对图像的视角进行调整,甚至可以改变图像的光线和颜色。这一功能的引入,无疑极大地提高了DALL·E3的使用体验和效率,使得用户能够更加精准地控制和优化他们的创作结果。

b092c7136abb489dab8a6db533505aa3.jpeg

【AiBase提要:】

? OpenAI推出DALL·E3的新种子功能,用户可以通过特定种子修改生成的图像。

? 用户可以在生成的图像中添加元素、更改颜色等操作,类似于Photoshop。

? 这一功能似乎是最近才更新的,展示了OpenAI不断努力改进DALL·E3的愿望。

ChatGPT Plus会员可上传和分析文件,实现多模态支持

在最新的测试版中,ChatGPT Plus会员拥有了全新的功能——文件上传与分析。这意味着,无需再手动切换模式,用户就可以轻松地进行文件的上传和分析。此外,该版本还增加了多模态支持,从而使得ChatGPT Plus在各种应用场景中都能发挥出最大的效用。

【AiBase提要:】

? ChatGPT Plus会员无需手动模式切换,可以上传和分析文件。

? 新功能将ChatGPT Enterprise计划的办公功能引入了独立的个人聊天机器人订阅。

? ChatGPT不仅限于文本文件,还可以处理多媒体内容,如图片生成。

谷歌Bard升级,实时生成回复不用等待

谷歌聊天机器人Bard迎来升级,旨在提供更快捷的实时回应选择,从而优化用户交互体验。此外,新版本还赋予用户自定义回答风格的能力。

【AiBase提要:】

? 谷歌Bard升级,提供更快速的实时回复选项,减少用户等待时间。

? 用户可以选择实时回答或完成后回答的选项,提高互动体验。

?️ 用户还可以自定义回答风格,使Bard的回复更符合他们的口味。

英国皇家天文学家称外星生命可能是超级智能AI

英国的皇家天文学家警告,外星生命可能是高度智能的AI,而非有机生命,这与人工智能时代的来临有关。

【AiBase提要】

? 英国皇家天文学家警告,外星生命可能比预期更智能。

? 外星生命可能是非有机智能,与宇宙中缺乏与人类相似生命有关。

? 探测AI外星生命可能困难,因为它们可能不依赖达尔文选择进化。

谷歌向AI初创公司Anthropic投资20亿美元

谷歌最近宣布投资20亿美元来加强自身在人工智能领域的影响力,并与Anthropic建立战略伙伴关系,共同加速AI的创新和发展。这一举措表明,谷歌对于在AI领域的竞争非常重视,并愿意为此付出巨大的代价。除了谷歌,其他一些大型公司也纷纷加大了对AI领域的投资力度。例如,亚马逊等巨头也在积极投资AI技术,以提升自身的竞争力。这些公司的投资行动充分展示了AI技术在未来的发展趋势和重要性。随着AI技术的不断发展和应用,我们可以预见,未来将会出现更多激动人心的创新,并且AI技术将会在各个行业中发挥越来越重要的作用。

【AiBase提要:】

? 谷歌向Anthropic投资20亿美元,强化在人工智能领域的地位,推动行业变革。

? 谷歌的投资不仅是财务支持,还是战略合作,旨在加速Anthropic的人工智能创新,同时增强Google Cloud在AI领域的地位。

? 亚马逊也对Anthropic进行40亿美元的重大投资,加剧人工智能领域的竞争,科技巨头竞相投资以确保领先地位。

???AI应用

图库巨头Getty Images拥抱AI技术 推出生成式AI服务

原内容为: Getty Images 采取了双重措施来应对侵权 AI 图像生成公司的威胁。一方面,他们提起诉讼,对涉嫌侵权的公司进行指控;另一方面,他们也推出了名为“Generative AI”的创新服务,旨在为客户提供 AI 图像生成功能,从而规避潜在的知识产权风险。这种策略不仅有助于保护自身的利益,也为其他图片库公司提供了借鉴。

【AiBase提要:】

? Getty Images采取法律行动起诉侵权AI图像生成公司,捍卫知识产权。

? 推出“Generative AI”服务,与Nvidia合作,为商业客户提供商业可行的AI图像生成,避免知识产权风险。

? AI生成的内容不会被添加到Getty Images的图像库,以保持图像库的权威性和可信度。

3D产品预览应用React Native3d Store 线上购物更立体了

React Native3d Store是一款先进的React Native应用,通过沉浸式3D预览展示产品,提供互动购物体验,利用现代技术如three.js、react-three-fiber、expo-gl等,使用户能旋转、缩放和平移3D模型,提升在线购物的互动性。

5666d7eae7d647c2977c10b872340b5a.jpeg

项目地址:https://github.com/alexandrius/react-native_3d_store

【AiBase提要:】

? React Native3d Store是一先进的React Native应用,提供沉浸式3D产品预览和互动购物体验。

? 应用采用现代技术,包括three.js、react-three-fiber,使3D模型更逼真,用户可探索产品细节。

? 兼容最新Expo版本,致力于提供最佳的3D购物体验,彻底改变了在线购物方式。

GPT Pilot:AI驱动的开发工具,可从零开始编写可扩展的应用程序

GPT Pilot是一款AI驱动的工具,能从开发人员提供的应用描述中生成可扩展的应用程序代码,支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。

0dd4d29a00b645cea9f41bfacbc707dc.png

项目地址:https://github.com/Pythagora-io/gpt-pilot

【AiBase提要:】

? GPT Pilot是AI驱动的开发工具,能根据应用描述生成应用程序代码。

? 它协助开发者明确应用需求、选择技术栈、拆解任务、生成代码,实现高效开发。

? GPT Pilot支持任务持续迭代和修复,促进开发者与AI的合作,代表未来应用开发的新方向。

?‍???聚焦开发者

首个人体动捕基模型SMPLer-X面世

SMPLer-X是首个人体动捕基模型,通过训练450万实例,实现了人体全身姿态与体型估计,同时能捕捉身体和面部动作,对数据缩放和模型缩放进行了探索,在学术数据集上表现出强大性能。

f4cbe2b63efe440690448f5608bf21bc.jpeg

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

【AiBase提要:】

1. 首次提出了动捕大模型SMPLer-X,用来进行人体全身姿态与体型估计,成功刷新了七个关键榜单。

2. SMPLer-X不仅能够捕捉身体动作,还可以输出面部和手部动作,并估计体型。

3. 研究探索了数据缩放与模型缩放,对32个学术数据集进行排名,展示了在各种测试和榜单中的强大性能。

苹果研究人员推出Ferret:多模态语言模型突破性进展

苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,解决了地理信息和语义知识融合问题,实现了引用和定位图像中元素的能力,性能优于传统模型。

AiBase提要:

1. 苹果的Ferret模型解决了地理信息和语义知识融合问题,使其能够引用和定位图像元素。

2. Ferret采用多模态大语言模型(MLLM),处理自由文本和引用区域,性能优于传统模型。

3. 研究人员创建了GRIT数据集,评估Ferret在引用描述、引用推理和对话中的定位任务上表现出卓越性能,性能平均优于其他MLLM模型20.4%。

Monarch Mixer(M2):比Transformer更低成本的模型架构

Monarch Mixer(M2)是一种新的模型架构,通过采用Monarch矩阵替代传统Transformer的注意力和MLP,实现更低成本取得更优的性能,挑战了传统Transformer的优越性。

65a2ddd28486401b8fcf1a5b6ad4b924.jpeg

论文地址:https://arxiv.org/abs/2310.12109

代码地址:https://github.com/HazyResearch/m2

【AiBase提要】

? Monarch Mixer(M2)采用Monarch矩阵替代注意力和MLP,降低了成本,在多任务上媲美传统Transformer。

? 具备次二次复杂度,处理更长序列和高维度表征,同时保持计算效率。

? M2不仅节省参数,还具有更高的硬件效率,是潜在的传统Transformer替代选择。

多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生

中科大研究提出“啄木鸟”框架,可降低多模态大模型的“幻觉”问题,提高准确性,无需重训,为解决大模型问题提供了新方法。

35c8eaa521fe4273ad85d0a0dbd96c2a.jpeg

项目地址:https://github.com/BradyFU/Woodpecker

【AiBase提要:】

? “啄木鸟”框架是一种免重训、即插即用的通用架构,通过诊断并纠正多模态大模型的“幻觉”问题,提高准确性。

? 这一方法包括关键概念提取、问题构造、视觉验证、视觉断言生成,以及幻觉纠正,无需特定数据微调或重新训练模型。

? 在实验中,“啄木鸟”成功降低了多模态大模型的“幻觉”,提高了答案的准确性,为解决大模型问题提供了有效工具。

返回搜狐,查看更多

责任编辑:

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *