国内商汤推出大模型,具有多模态功能,性能优势

2023-04-11 清博智能 清博智能

今日(4月10日)商汤科技宣布推出

今日(4月10日)商汤科技宣布推出大模型体系“日日新大模型”,其中对用户高度关注的语言问答和图片AI生成功能部分,商汤在活动中做了多种应用场景的实机演示,并且多次邀请与会嘉宾在会后去体验产品,显示出商汤对产品完成度的高度自信。

商汤大模型“日日新”名称取自《礼记·大学》中的“苟日新,日日新,又日新”,体现大模型日新月异,不断进化之意。

日日新大模型包括自然语言生成、文生图、感知模型标注、以及模型研发功能。商汤称其大模型从2019年开始研发,目前整体参数量达到5000亿,今年目标达到万亿。

用户最关心的功能之一——中文语言大模型应用平台,商汤将其命名为“商量”,希望AI能在商量的过程中帮助用户解决问题。“商量”平台目前参数量为1800亿。

“商量”在医疗领域的应用。在用户提出症状后,“商量”并没有直接给出病情诊断,而是在多次询问病情后才给出了可能的病症和求医科室建议,相较以往的通过网络搜索查询病情,“商量”的方式更注重引导,更类似真正的问诊体验。

 

商汤称,目前“问诊助手”功能已在包括新华医院在内的多家医院落地,未来有望面向更多医院开放。

之后,商汤公布了其自研的生成式AI应用系列,剑指实现多模态大模型的终极目标;包括文生图工具“秒画”、AI数字人生成工具“如影”、3D建模快速生成工具“琼影”和“格物”。

“秒画”可理解为对标Midjourney的AI绘图产品,并实现了部分Civitai(C站)功能,尤其值得注意的是,“秒画”实现了2秒出图和自训练功能。
 

在自训练方面,商汤在现场演示中向AI“投喂”20张香港明星照片生成港星风格,之后用户便可使用该种风格快速生成图片,全程不需要编程和调试,只需要准备20张风格一致的图片即可。

在生成图片界面,类似Midjourney的逻辑,用户只需要在选定风格后输入提示词即可生成,且比Midjourney更加人性化的是,用户可以自己选择生成图片的数量、分辨率、长宽比等,图片生成的速度也比Midjourney更快。

“琼影”和“格物”是本次商汤发布的场景和建模AI生成工具,可快速生成大到城市、小到花朵的建模,且建模可实现实时互动。



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言

相关资讯

新英格兰医学杂志推出NEJM AI,追逐人工智能

ChatGPT以强劲势头在医疗领域崭露头角,现有各种探索也为行业带来了更多想象。近日,医学顶刊《新英格兰医学杂志》(NEJM)正式宣布将于2024年出版新杂志NEJM AI,并从今年夏天开始接收投稿。

European Radiology:人工智能实现PET/CT的肺癌全自动评估!

使用人工智能(AI)算法的自动肺部肿瘤检测已经在高分辨率CT上显示出重要的价值。然而,特别是在层厚为3毫米、以自由呼吸技术采集的PET/CTs的CT部分在检测晚期肿瘤方面对算法来说是个挑战。

European Radiology:人工智能在甲状腺超声中的临床价值

根据目前的实践指南推荐,超声检查(US)是区分甲状腺癌和良性结节以及选择细针抽吸(FNA)活检对象的一线和最准确的影像检查。

分割一切的视觉算法出现,病理和影像的人工智能可能会被颠覆!

Meta研究部门发布了一篇名为其“Segment Anything(分割一切)”的论文,文中介绍了一个全新的Segment Anything Model(即SAM),可以用于识

文本生成视频的优化算法出现——Runway技惊四座

文本生成视频并不新鲜,在“文字生成图片”到“文字生成视频(Text-to-Video,T2V)”自然也是AI在相关领域的自然发展,2022年9月,Met

征集问题:您想问chatGPT哪些问题?#我向chatGPT提问#

chatGPT火爆全球,不过,由于种种原因,国内的同仁很难直接登录chatGPT,这是十分遗憾的事情。