每周日AI一周见闻与您相约。AI一周见闻涵盖四大部分:每周见闻、企业新品发布、AI黑科技、下周看点。
每周见闻本周要点汇总:
1、谷歌从模型到应用全面进击AI,PaLM2让Bard更强大,办公套装Workspace叫板Office。
2、3D建模大突破,OpenAI推出文本生成3D模型—Shap-E,生成3D模型从2分钟优化到100秒。
3、Meta开源 ImageBind 新模型,AI学会人类感知,图片是嫁接桥梁。
4、GPT4最强对手Claude史诗升级,解读百页资料仅需一分钟。
5、还有三种黑科技,AI超写实数字人为何凸显商业价值、AI更懂视频等内容。
企业新品发布1、谷歌从模型到应用全面进击AI
本周谷歌的I/O发布会备受瞩目,新品发布效果超出市场的预期。谷歌不仅仅发布了新模型PaLM2,还将AI全面接入办公套装Workspace,直接叫板Office。
值得关注的是,新推出PalM2模型有四种大小,包括Gecko、Otter、Bison和Unicorn。Gecko作为最轻量的版本,可以部署到移动端,易于微调各类细分模型,提供每秒处理20个token的能力。
此前大模型在边缘侧终端的应用主要是依靠API接口调用的方式,大模型的训练和推理仍在云端进行,对边缘侧终端及芯片形态更新没有太大需求。
轻量化Gecko版本,能够提供AIGC更为定制化、时延更低,安全性、隐私性更好的应用,开拓AI模型在终端芯片推理的场景,边缘侧智能终端以及SoC有望全面升级,进入新的更新换代周期。
见智研究认为:谷歌的PalM2模型推出,能够更好的驱动机器人Bard升级,不仅能够使用100中语言回复用户,多模态版本的Bard还更新了图像、编程、应用集成等功能;而且还在医学上被认达到临床专家水平。
此外,PalM2大模型的又一亮点就是全球首个支持移动端部署的大模型AI,被看做是点燃移动边缘端的Ai大模型竞赛。意味着大模型竞赛的路线现在已经从PC端拓展到手机和IOT领域。
从谷歌的研发力和生态的角度来看:
在AI基础设施上:A3虚拟机训练速度目前比其他设施快80%,成本低50%;Vertex AI平台能够给开发者提供多种基础模型,用于微调从而尽快得到专属模型。
在应用生态上:谷歌搜索推出Converse的生成式AI功能,不仅能够写邮件、写文案、做表格、PPT能力直接对标Office,而且在决定购买性价比更好的产品时候特别有用。
见智研究认为:此功能必然是视频创作者的福音,能够让机器批量检索大量视频,并且精准定位所需要的视频画面,效率非常高。此功能是将视频中的信息逐一定义为向量,从而实现快速检索的功能。
3、 4D渲染—实现高清动态还原
Synthesia Research 发布HumanRF(运动中人类的高保真神经辐射场),通过视频输入来捕捉运动中人的全部外观细节,能够让合成的视频更加高清,从4MP的分别率升级到12MP运行。HumanRF极大的解决了摄像机拍摄后进行高分辨率视频合成的困难。
见智研究认为:4D高清合成的突破性,对于视频创作来说具有重大意义。当下看到可以应用场景包括电影制作、电脑游戏或视频会议等,边界还能够不断拓展到超写实数字人的视频生成领域。
下周关注重点OpenAI向所有ChatGPT Plus 用户开放联网功能和众多插件!从Alpha 到 Beta,它们将允许ChatGPT 访问互联网并使用70多个第三方插件。这些插件包括创建新网站,文本转音频,购物比价下单,总结和分析PDF文档,创建专属自己的智能工作流等等,涵盖日常生活的衣食住行各个方面。
本文来自华尔街见闻,欢迎下载APP查看更多
相关文章
猜你喜欢