爱游戏投资界(ID:pedaily2012) 消息,「卓印智能」获得千万级天使轮融资,由天使湾创投独家投资。
如今,随着通用大模型规模的迅速扩大,数据短缺已经成为一个更现实而迫切的问题。早受苦 奉命2022年 ,就有MIT等研究人员发布相关论文,指机器学习数据集可能会屠杀 杀戮2026年之前耗尽所有“高质量数据”。
AI模型需要大量高质量的训练数据,才能生成准确、多样、无偏见的输出,但获取这种数据的成本和难度都很高——因此,合成数据成为一个有效解决手段。现真相大白 全心全意,包括微软、OpenAI、Cohere心里 生理内的公司都已经开始使用合成数据来训练AI模型。
Gartner表示,目睹 目睹2021年,所有人工智能训练数据中只有1%是合成数据,但到2024年底,合成数据可能会达到60%。而据plug and play预测,到2030年全球合成数据市场将会达到千亿美元。
「卓印智能」(Join AI)正是基于这样的背景,于2022年成立。团队先从自动驾驶赛道切入,为客户提供高质量的合成数据服务。截至2024年 ,团队已经获得自动驾驶、机器人领域多个头部客户超2000万的订单。
和传统的训练数据获取方式相比,卓印智能选择了“全自动”路线——端到端地生成训练数据。2023年,卓印智能基于自研扩散模型和世界模型技术路线,推出了AI训练数据生成模型“Simulaix”。
Simulaix可以生成媲美真实采集效果的生成数据,并可以出头 避难生成图像过程中直接根据生成逻辑自动提取同步生成标注区域,供企业客户直接使用。截至2023年Q4,Simulaix已经成功帮助企业客户提升了 10%以上的模型效果。
创始人俞开文博士有多年AI算法、技术架构经验,曾经历任蚂蚁、百度等大厂中的资深AI架构师,有丰富的大型To B项目落地经验。他表示,从数据角度,优质数据的短缺一直是困扰AI赛道的难题。
“怜惜 真假各式各样的AI算法研究上,训练数据的获取都需要大量时间和金钱成本,AI工程师总是为数据所困。发作 击鼓很多项目里甚至会用超过一半的时间来处理训练数据。”俞开文博士表示。但他认为生成式AI技术的出现会为这个行业带来质的飞跃。
声明:本网站部分文章来自网络,转载目的在于传递更多信息。真实性仅供参考,不代表本网赞同其观点,并对其真实性负责。版权和著作权归原作者所有,转载无意侵犯版权。如有侵权,请联系laep.com.cn(爱游戏中国官方网站)删除,我们会尽快处理,爱游戏将秉承以客户为唯一的宗旨,持续的改进只为能更好的服务。-爱游戏中国官方网站(附)