【资料图】
科技讯(作者/季倩)《AI前哨》6月19日消息,科技获悉,北京生数科技有限公司(以下简称“生数科技”)正式宣布完成近亿元人民币的天使轮融资,本轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,目前估值已达1亿美金。本轮融资后续将主要用于核心研发团队的建设,加速多模态大模型和应用产品的研发。
生数科技成立于2023年3月,由瑞莱智慧RealAI、蚂蚁和BV百度风投联合孵化成立,致力于成为全球领先的生成式人工智能基础设施及应用建设者。团队核心成员主要来自清华大学人工智能学院,前瑞莱智慧副总裁唐家渝出任首席执行官。目前,生数科技正积极打造世界领先的可控多模态通用大模型,致力于通过生成式AI技术提升全人类的创造力与生产力。
生数科技是国内最早布局多模态通用大模型的团队之一,于2023年初即开源了全球首个基于Transformer的多模态扩散大模型UniDiffuser,首次实现基于一个底层模型高质量地完成图生文、图文联合生成、图文改写等多种生成任务。基于此前积累,生数科技也正从0到1打造着产业级的多模态深度生成式大模型,覆盖文本、图像、3D模型、音视频等多个模态。目前该大模型正在快速迭代中,现阶段已于图像生成、3D内容生成、视频生成等任务中实现全球范围内超高水平的生成效果。
唐家渝表示,现阶段市面上的模型和产品仅仅解决了初级阶段的可生成性问题,但生成的结果仍有很大的不确定性和不可控性,模型对用户意图的把握、精确细节的控制仍存在很大的不足,比如难以对生成的图像画面中元素的位置、细节做到准确的控制,生成的3D模型在表面精细度、色彩光影的准确性方面仍处于较低水平。
可控生成是成熟商业化的重要前提,生数科技通过优化底层算法已于短时间内实现领先行业的生成效果,例如3D生成效果已大幅领先Shap-E(OpenAI)、DreamFusion(Google)、Magic3D(NVIDIA)等主流模型水平,能在无需任何3D训练数据的前提下,通过文本描述自动生成高质量的带纹理的三维网格与NeRF图,包括生成复杂效果和360°场景、根据同样的描述生成不同形式的3D内容,以及首个实现了基于三视图自动生成高质量的3D内容,是目前业内最接近产业级应用的3D生成效果。其次,图像生成已超过Stable Diffusion最新版基础模型水平,在构图、风格、画面精准度等方面能够更好地把握用户意图,预计将于年内赶超Midjourney最新版本。未来团队还将重点持续快速迭代底层多模态大模型能力,进一步提升高标准、高质量的可控生成水平,推动商业化的快速落地。
蚂蚁集团称,预训练模型、扩散模型等关键算法和模型的出现与演进推动了生成式AI的快速发展。生数团队在生成式模型、扩散模型、大模型研发探索与科研人才储备上具备坚实的基础,同时学术与产业深度融合的背景,也赋予了团队贯穿从底层技术研发到产品应用落地的独特能力。“我们相信生数团队能够在这波AI浪潮中突围而出,同时也期待团队能够不断开拓多模态大模型的技术边界和应用场景,成为中国生成式大模型领域的佼佼者。”
Copyright 2015-2022 南极体育网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com