文章主题:AI, 大模型, 开源, 商业应用
AI视野:百川发布Baichuan2-192K大模型;DALL·E3新增种子功能;
????大模型动态
百川智能发布Baichuan2-192K大模型,可处理35万汉字
最近,我国知名的人工智能公司——百川智能,推出了一款名为Baichuan2-192K的大模型,这款模型在全球范围内具有最长的上下文窗口,能够处理大约35万个汉字,这一表现甚至超过了法国著名的人工智能模型Claude2。
作为一款备受关注的自然语言处理工具,百川大模型的官方网站为用户提供了丰富的信息和资源。如果您想了解更多关于百川大模型的详情,请访问以下网址:https://top.aibase.com/tool/baichuandamoxing。在这里,您可以了解到它的核心功能、应用场景以及如何利用它来提高您的文本处理效率。同时,官方网站还提供了一些在线教程和案例分析,帮助您更好地理解和掌握百川大模型的使用方法。总之,无论您是初学者还是专业人士,都能在这个网站上找到自己所需的信息和帮助。
【AiBase提要】
? Baichuan2-192K大模型发布,处理长文本、问答等多项任务。
? 超越Claude2,上下文窗口长度超过4.4倍。
? 内测中,合作伙伴包括法律、媒体、金融等领域,全面开放不久。
昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列
昆仑万维公司最近宣布开源了其拥有的大规模语言模型“天工”Skywork-13B系列,该模型使用了超大规模的中文数据集,并包含两个不同的模型,旨在促进大模型的商业化应用,并降低商业化的门槛。
【AiBase提要】
? 昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列。
? 提供超大规模的高质量中文数据集,包括两个模型: Skywork-13B-Base 和 Skywork-13B-Math。
? 大模型即将全面开放商用,为应用和开源社区发展提供技术支持,降低商业门槛。
???AI新鲜事
DALL·E3更新,新增种子功能允许用户精修生成图片
在最近的一次更新中,OpenAI神秘的DALL·E3模型增加了全新的“种子”功能,这是一个革命性的特性,它使得用户能够以极高的精度编辑他们生成的图像。这个功能不仅允许用户添加各种元素到图像中,还允许他们对图像的视角进行调整,甚至可以改变图像的光线和颜色。这一功能的引入,无疑极大地提高了DALL·E3的使用体验和效率,使得用户能够更加精准地控制和优化他们的创作结果。
【AiBase提要:】
? OpenAI推出DALL·E3的新种子功能,用户可以通过特定种子修改生成的图像。
? 用户可以在生成的图像中添加元素、更改颜色等操作,类似于Photoshop。
? 这一功能似乎是最近才更新的,展示了OpenAI不断努力改进DALL·E3的愿望。
ChatGPT Plus会员可上传和分析文件,实现多模态支持
在最新的测试版中,ChatGPT Plus会员拥有了全新的功能——文件上传与分析。这意味着,无需再手动切换模式,用户就可以轻松地进行文件的上传和分析。此外,该版本还增加了多模态支持,从而使得ChatGPT Plus在各种应用场景中都能发挥出最大的效用。
【AiBase提要:】
? ChatGPT Plus会员无需手动模式切换,可以上传和分析文件。
? 新功能将ChatGPT Enterprise计划的办公功能引入了独立的个人聊天机器人订阅。
? ChatGPT不仅限于文本文件,还可以处理多媒体内容,如图片生成。
谷歌Bard升级,实时生成回复不用等待
谷歌聊天机器人Bard迎来升级,旨在提供更快捷的实时回应选择,从而优化用户交互体验。此外,新版本还赋予用户自定义回答风格的能力。
【AiBase提要:】
? 谷歌Bard升级,提供更快速的实时回复选项,减少用户等待时间。
? 用户可以选择实时回答或完成后回答的选项,提高互动体验。
?️ 用户还可以自定义回答风格,使Bard的回复更符合他们的口味。
英国皇家天文学家称外星生命可能是超级智能AI
英国的皇家天文学家警告,外星生命可能是高度智能的AI,而非有机生命,这与人工智能时代的来临有关。
【AiBase提要】
? 英国皇家天文学家警告,外星生命可能比预期更智能。
? 外星生命可能是非有机智能,与宇宙中缺乏与人类相似生命有关。
? 探测AI外星生命可能困难,因为它们可能不依赖达尔文选择进化。
谷歌向AI初创公司Anthropic投资20亿美元
谷歌最近宣布投资20亿美元来加强自身在人工智能领域的影响力,并与Anthropic建立战略伙伴关系,共同加速AI的创新和发展。这一举措表明,谷歌对于在AI领域的竞争非常重视,并愿意为此付出巨大的代价。除了谷歌,其他一些大型公司也纷纷加大了对AI领域的投资力度。例如,亚马逊等巨头也在积极投资AI技术,以提升自身的竞争力。这些公司的投资行动充分展示了AI技术在未来的发展趋势和重要性。随着AI技术的不断发展和应用,我们可以预见,未来将会出现更多激动人心的创新,并且AI技术将会在各个行业中发挥越来越重要的作用。
【AiBase提要:】
? 谷歌向Anthropic投资20亿美元,强化在人工智能领域的地位,推动行业变革。
? 谷歌的投资不仅是财务支持,还是战略合作,旨在加速Anthropic的人工智能创新,同时增强Google Cloud在AI领域的地位。
? 亚马逊也对Anthropic进行40亿美元的重大投资,加剧人工智能领域的竞争,科技巨头竞相投资以确保领先地位。
???AI应用
图库巨头Getty Images拥抱AI技术 推出生成式AI服务
原内容为: Getty Images 采取了双重措施来应对侵权 AI 图像生成公司的威胁。一方面,他们提起诉讼,对涉嫌侵权的公司进行指控;另一方面,他们也推出了名为“Generative AI”的创新服务,旨在为客户提供 AI 图像生成功能,从而规避潜在的知识产权风险。这种策略不仅有助于保护自身的利益,也为其他图片库公司提供了借鉴。
【AiBase提要:】
? Getty Images采取法律行动起诉侵权AI图像生成公司,捍卫知识产权。
? 推出“Generative AI”服务,与Nvidia合作,为商业客户提供商业可行的AI图像生成,避免知识产权风险。
? AI生成的内容不会被添加到Getty Images的图像库,以保持图像库的权威性和可信度。
3D产品预览应用React Native3d Store 线上购物更立体了
React Native3d Store是一款先进的React Native应用,通过沉浸式3D预览展示产品,提供互动购物体验,利用现代技术如three.js、react-three-fiber、expo-gl等,使用户能旋转、缩放和平移3D模型,提升在线购物的互动性。
项目地址:https://github.com/alexandrius/react-native_3d_store
【AiBase提要:】
? React Native3d Store是一先进的React Native应用,提供沉浸式3D产品预览和互动购物体验。
? 应用采用现代技术,包括three.js、react-three-fiber,使3D模型更逼真,用户可探索产品细节。
? 兼容最新Expo版本,致力于提供最佳的3D购物体验,彻底改变了在线购物方式。
GPT Pilot:AI驱动的开发工具,可从零开始编写可扩展的应用程序
GPT Pilot是一款AI驱动的工具,能从开发人员提供的应用描述中生成可扩展的应用程序代码,支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。
项目地址:https://github.com/Pythagora-io/gpt-pilot
【AiBase提要:】
? GPT Pilot是AI驱动的开发工具,能根据应用描述生成应用程序代码。
? 它协助开发者明确应用需求、选择技术栈、拆解任务、生成代码,实现高效开发。
? GPT Pilot支持任务持续迭代和修复,促进开发者与AI的合作,代表未来应用开发的新方向。
????聚焦开发者
首个人体动捕基模型SMPLer-X面世
SMPLer-X是首个人体动捕基模型,通过训练450万实例,实现了人体全身姿态与体型估计,同时能捕捉身体和面部动作,对数据缩放和模型缩放进行了探索,在学术数据集上表现出强大性能。
项目地址:https://caizhongang.github.io/projects/SMPLer-X/
【AiBase提要:】
1. 首次提出了动捕大模型SMPLer-X,用来进行人体全身姿态与体型估计,成功刷新了七个关键榜单。
2. SMPLer-X不仅能够捕捉身体动作,还可以输出面部和手部动作,并估计体型。
3. 研究探索了数据缩放与模型缩放,对32个学术数据集进行排名,展示了在各种测试和榜单中的强大性能。
苹果研究人员推出Ferret:多模态语言模型突破性进展
苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,解决了地理信息和语义知识融合问题,实现了引用和定位图像中元素的能力,性能优于传统模型。
AiBase提要:
1. 苹果的Ferret模型解决了地理信息和语义知识融合问题,使其能够引用和定位图像元素。
2. Ferret采用多模态大语言模型(MLLM),处理自由文本和引用区域,性能优于传统模型。
3. 研究人员创建了GRIT数据集,评估Ferret在引用描述、引用推理和对话中的定位任务上表现出卓越性能,性能平均优于其他MLLM模型20.4%。
Monarch Mixer(M2):比Transformer更低成本的模型架构
Monarch Mixer(M2)是一种新的模型架构,通过采用Monarch矩阵替代传统Transformer的注意力和MLP,实现更低成本取得更优的性能,挑战了传统Transformer的优越性。
论文地址:https://arxiv.org/abs/2310.12109
代码地址:https://github.com/HazyResearch/m2
【AiBase提要】
? Monarch Mixer(M2)采用Monarch矩阵替代注意力和MLP,降低了成本,在多任务上媲美传统Transformer。
? 具备次二次复杂度,处理更长序列和高维度表征,同时保持计算效率。
? M2不仅节省参数,还具有更高的硬件效率,是潜在的传统Transformer替代选择。
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生
中科大研究提出“啄木鸟”框架,可降低多模态大模型的“幻觉”问题,提高准确性,无需重训,为解决大模型问题提供了新方法。
项目地址:https://github.com/BradyFU/Woodpecker
【AiBase提要:】
? “啄木鸟”框架是一种免重训、即插即用的通用架构,通过诊断并纠正多模态大模型的“幻觉”问题,提高准确性。
? 这一方法包括关键概念提取、问题构造、视觉验证、视觉断言生成,以及幻觉纠正,无需特定数据微调或重新训练模型。
? 在实验中,“啄木鸟”成功降低了多模态大模型的“幻觉”,提高了答案的准确性,为解决大模型问题提供了有效工具。
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!