2022年12月发布的大型语言生成模型ChatGPT,以其强大的信息整合和语言创作能力惊艳了世界,能够胜任对话聊天、小说和剧本构思等多个场景。在北密歇根大学的一门课程论文评分时,用ChatGPT撰写的论文得到了最高等级的A+评分,并被教授评为“全班最好的论文”。
》中已经对AIGC对内容营销的影响有了基本的介绍,本篇主要针对中国市场对国内正在做AIGC的相关企业展开介绍。
目前AIGC主要运用在文字、图像、视频、音频、游戏以及虚拟人等方面。简单的说,用户只需要输入一段对文章的描述或要求,类似于大学课堂上教授布置论文时的要求,系统就能根据指令进行创作;输入对艺术绘画作品的文字描述,比如“星空下的大海,远处的波浪像笼罩着一层层白雾慢慢向海边靠近”,系统就能自动生成一张绘画作品。
所谓AIGC,英文全称是AI Generated Content,指的是利用人工智能来生产内容,其中AI是人工智能的简称,GC则是创作内容。
同传统意义上的AI相比,AIGC变聪明了。毕竟创造力是人类非常特别的能力,但当人们发现AIGC有创造力的时候非常震惊,未来AIGC将是人工智能发展的新方向。在AIGC 相关技术爆发的同时,其商业化速度同样惊人,文字生成公司Copy.ai 仅用两年时间 ARR 就突破 了千万美金,这非常像移动互联网早期,全新的商业模式在不断涌现并快速被市场验证后,能够更快的迭代,寻求突破。
AI绝不是真的在一夜间变得无所不能,算法、模型、框架的迭代凝结着无数从业者的心血,无论是科技大厂,还是初创企业,始终要在最前沿的科技领域保持前瞻的视野和敏锐的判断,才有可能把握住市场机遇,而背后日复一日的数据积累,更是产品能够在差异化的需求中胜出的基础。
众多从业者也纷纷表示:AIGC将会是AI的下一波浪潮,第一代AI更多应用在分析、识别领域,而AIGC实现了重大突破,它让AI有创造内容的能力,是全新的革命。
越早拥抱变化,才能越早享受到技术变革所带来的红利。AIGC帮助各行各业的内容创作者们打破自身能力的局限性,更好将自己的想法、创意变成现实。
目前AIGC的发展,可以以较人工更高效的技术路径,实现个性化文本、图像的生成需求,对规模化内容的生产有较大冲击,特别是对初级、通用形内容生产者,具有取代性。现在图像、文本人工智能内容生成技术,基本可以实现快速生成高质量的营销内容。
聆心智能是一家超拟人底层大模型研发商,致力于打造“超拟人底层大模型”,核心技术是具有可控、可配置、拟人特点的LLM,通过简单设置即可构造一个有知识、有个性、有风格的类人智能体。聆心智能的愿景是创造AGI(通用人工智能)时代的类人智能体,使得AI Companion进入人类生活的所有角落,科技向善为人类谋福祉始终是聆心智能的目标。
聆心智能孵化自清华大学计算机系,创始人黄民烈教授是自然语言生成领域知名教授。团队核心成员均来自于清华大学、卡内基梅隆大学、谷歌等国内外顶尖高校及公司,具有丰富的商业化经验,一直以来,在大模型和对话系统的开发与应用领域中处于行业领先位置。
作为AI心理赛道中自然语言处理(NLP,Natural Language Processing)基因领先的创业团队之一,聆心智能已开发了心理咨询及朋辈支持服务线上平台聆心悠然,可为不同需求层次的用户提供服务。
澜舟科技是一家认知智能公司,针对商业场景数字化转型、以自然语言处理为基础提供商业洞见类产品,主要产品包括基于预训练模型的功能引擎(包括搜索、生成、翻译、对话等)和针对垂直行业场景的 SaaS 产品。
公司创始人周明是世界顶级的 AI 科学家,自然语言处理领域的代表性人物。
【熊猫小说家】小程序是澜舟科技首个 AIGC 方向的 C 端用户产品,通过技术领先的语言生成模型,快速将用户的日常生活变成小说情节。
倚澜科技成立于2021年6月,致力于沉浸式数字内容和实时3D引擎两大核心业务,为超写实虚拟化身CG内容创作、实时交互等场景提供技术解决方案和平台化技术服务,通过科技创新,改变数字内容生产方式。
22年11月,倚澜科技在线上发布会上公布了Meta Conference、Meta Streaming两套元宇宙场景解决方案,分别对应两套产品MetaC系统与MetaS系统。
Meta Conference 是一款提供给线下会议、论坛使用的扩展现实会议工具。该系统首创XR空间互动模式,让每一位演讲者在论坛现场就能轻松创触摸科技前沿,结合实际场景与虚拟场景创造元宇宙会议空间,打通由虚向实、由实向虚的双向通道,实现科技魅力和互动体验的飞跃。
而Meta Streaming 是直播行业提供的一款智能便捷的扩展现实直播工具。该系统首创轻量高精AR模式,让每一位创作者和品牌主都能够以极低的成本和极简的方式,实现真实和虚拟的人、物品、空间进行虚实结合来增强直播互动,为主播和直播用户创造沉浸式的直播体验。
彩云小梦是一款AI写书软件。你可以通过给出一些基本的世界设定,让你的彩云AI围绕故事主题去进行联想创作。彩云小梦由彩云科技出品,因为有了彩云天气和彩云小译这两款成功产品的开发运营经验,彩云小梦自身研发素质过硬,曾风靡B站创作圈。
彩云小梦创始人兼 CEO 袁行远在访谈中说道:「就像游戏让我们体验各种光怪陆离的世界,看电影是对生命的延长。人只能活一辈子,这是很遗憾的,但电影、小说都是让我们体验不一样的人生。而现在有 AI 技术,可以让你更沉浸式的体验,不仅可以阅读基督山伯爵,也可以扮演基督山伯爵,而且是自由的扮演。它也是对生命的延长,以前所未有的一种形式。」
智能写作SDK服务平台,致力于为企业提供场景化内容创作解决方案和通用内容创作SDK服务,打造一站式内容创作应用。必优科技已在智能简历方面,搭建了AI在线辅写简历平台——YOO简历。
选择简历作为智能写作的应用场景,原因在于简历常被视为低频场景,但事实上市场空间很广。而目前市场上,大多智能简历以提供模板为主,难以起到内容优化的作用,因此用户较为容易认可内容优化的商业价值。
基于以上问题,必优科技首先通过大量AI训练,明确企业关注的核心内容与板块,以此来引导用户完成简历内容。其次,通过分析投递岗位,提炼出关键信息。最后,是将内容润色,通过将口语化等内容转为职业化表达,优化用户的内容价值。
YOO简历能够实现AI辅写,关键在于底层的韦尼克框架(Wernicke)。韦尼克框架是由必优科技自主研发的智能写作引擎,基于其自研的深度学习模型WCCG(Wernicke Control Content Generate)架构生成。
社交媒体管理服务商「KAWO 科握」,成立于2017年,是一家为品牌或市场营销机构提供一站式社交媒体管理的平台,也是国内首家提供标准化SaaS服务的社交媒体协同管理平台。
「KAWO」为品牌提供了统一的协作平台,使得内外部不同参与者都可以拥有单一登录信息的安全平台,管理不同的社交媒体账号,从而进行创建、排期、批准、发布内容等,提升效率的同时降低人为失误和人力依赖。数据显示,该平台每周平均为品牌运营人员节省了3-4个小时的工作时间。
KAWO 科握具有深度数据复盘、竞品监测与分析、内容规划与排期、编辑与排版、实时反馈与审批、定时发布等功能,帮助客户团队的内外部成员均可在平台上全流程协作管理多个社媒账号。
AI+金融的初创公司,智能投研,即在金融市场数据的基础支持上,通过深度学习、自然语言处理等人工智能方法,对于数据、事件、结论等信息进行自动化处理和分析,为金融机构的专业从业人员(分析师、基金经理、投资人等)提供投研帮助,提高其工作效率和分析能力。预计到2020年,智能投研所属的人工智能分析产业的市场规模达到700亿美元左右。
利用自然语言处理(NLP)和图像处理(CV)算法,从海量分散的非结构化数据中自动提取结构化信息,通过独立开发的智能AI金融信息平台,描绘包括中小企业,上市公司,地区、产业、全球等多维度金融实体画像,服务政府、银行、基金券商、评级机构、保险和大型企业,为金融资产管理、风控评级、行业研究、投资决策等各类金融业务赋能。
上海秘塔网络科技有限公司成立于2018年4月,是人工智能领域的一家新锐科技公司,致力于将重复脑力劳动AI化,以AI为杠杆撬动专业场景的百倍生产力提升。
目前,秘塔科技已经拥有数百万用户,成立北京和成都两大研发中心,在AIGC、文档辅助创作、智能合同等方向上开展研发与产品落地。
中文在线全资子公司鸿达以太已经在录制部分有声书过程中运用AIGC技术,通过捕捉声纹,AI做情感标识,产出高质量仿真语音,快速完成文本到语音的转化过程,极大加速了网络文学到音频内容的生产能力,扩充了内容传播的渠道。
其“AI主播”可实现低成本、高效优质的内容生产,实现了单播、双播、多人播制作方式,支持制作玄幻、悬疑、武侠、历史、言情等不同类型的作品,实现旁白、角色音的区分,演绎更丰富、贴合剧情。该功能已向公司旗下17K文学平台全部作者开放。
黑狐创客隶属于广州黑狐科技有限公司,是国内以AI技术应用的平台,自注册成立历时至今一直以“诚信为本、用户至上”的服务理念为经营之本。平台一直致力于AI生态圈,产品有:狐写作、黑狐文字提取神器。
公司主营业务包括字体设计、字库软件开发和授权、提供字库类技术服务 和视觉设计服务,以及以 IP 赋能方式开展的 IP 产品化业务。
2022下半年,深度学习模型Diffusion扩散化模型创新推进AIGC技术突破,公司AI造字等内容领域爆发。
智搜是中国领先的AI+资讯的技术服务商,自主研发了Giiso资讯机器人引擎,以及系列衍生的写作机器人、机器人商店、天机智讯、Giiso编辑机器人等智能产品,可广泛应用于新闻媒体服务和情报采集追踪等领域。作为国内首家AI+资讯的技术服务商,智搜正试图圈住“资讯”这块蛋糕,为人们提供更智能的资讯服务。
智搜以卓越的科研能力获得国家级高新技术企业认证,并先后获得了金沙江联合资本、力合集团、民银国际等多家著名投资机构的参股投资。发展至今,智搜已有近百名员工,其中研发人员占五成以上。
同伴客数据是领先的数据要素市场集成构建商,致力于让所有数据资产都能产生最大价值。同伴客数据成立于2017年,是一家致力于通过数字科技为人类释放无限潜能的科技公司。其核心产品是TBanic数字员工基础平台,集成了基于“DARD”技术(数据-Data、人工智能-AI、机器流程自动化-RPA、数字人-Digital Human)的数字员工开发套件,客户可以根据不同的业务场景,构造出具备对应工作技能的数字员工。同伴客的产品和解决方案覆盖数字蓝领、数字白领和数字金领三个层级,主要包含AIGC数字员工、数据洞察数字员工、RPA数字员工、金融交易数字员工、人工增强数字员工,目前已服务于全球超过200家客户。
文本生成工具「Friday AI」:用户输入一个标题,就能生成一篇文章。
Friday智能写作是一款在线AI内容创作工具,做为提高写作者内容生产效率的助手,能够帮助你更快、更好地创作内容。Friday AI开始搭建易用的专注于人工智能文本生成的服务。作为一家中美合资公司,我们为不同的写作场景开发和提供各种原创文本,包括产品描述、营销信息、各类主题文章和广告文案等。
成立于1993年,公司已落地了一批服务型虚拟人项目,其中有面向农产品电商主播提供直播脚本智能创作、带货虚拟人全链租用等知识赋能服务。
拓尔思开展“大数据看世界杯”的虚拟数字人系列服务。在 2022 年北京冬奥会上,二十多位数字人代替真人为赛事提供服务支持。其中数字播报员小思通过对资讯内容的自动分析、智能创作和虚拟播报帮助观众了解冬奥盛况,让观众能快速把握冬奥会海量资讯中的亮点信息。小思冬奥播报由拓尔思 SaaS 平台开发而成,集成自然语言处理、大数据、人工智能等技术。
去年由Stability发布的Stable Diffusion模型,就让人工智能生成图片的速率和质量进行了大幅提升。全AI创作的绘图作品几乎达到专业水准,让一众画师感到职业危机。
生成式AI平台,成立于2021年。“输入一句话,Tiamat系统就会从0开始生成一整张图片。”Tiamat系统是该团队自主研发的一款AI艺术创作工具。该系统采用了当前最先进的算法技术和强大的多模态技术,结合人类灵感创造力与科技的碰撞,拓展了算法艺术与AI创造力在商业环境中的应用边界,致力于探索前沿AIGC领域的更多可能性。
Tiamat生成式AI模型是基于扩散模型(Diffusion Models)和审美模型实现的,研发团队还在扩散模型采样、数据集构建上开展了许多工作,进一步增加了图像生成质量。作为一款国产优化自研系统,Tiamat系统支持中文和各种复杂的描述风格,界面简洁,在手机上就可以使用。
Tiamat研发团队创新性地使用梯度引导和条件生成结合的技术,对系统进行优化,使得Tiamat系统能够在图片生成符合文本输入的同时,让最终结果的色彩细节、构图更加完善。
ZMO开发了新一代AIGC引擎,基于⾃研优化的Implicit style diffusion技术,为⽤户提供从AI辅助内容创作到AI完全⽣成的技术引擎与创作平台。
2022年年底,ZMO的中文平台“YUAN初”、以及同名小程序全新上线,用户可以便捷体验AI图像生成。
ZMO开发了新一代AIGC引擎,基于⾃研优化的Implicit style diffusion技术,为⽤户提供从AI辅助内容创作到AI完全⽣成的技术引擎与创作平台。
围绕电商场景,通过AIGC生成网站搭建过程中所需的各类素材,具体业务包括针对性生成公司介绍、企业价值、Slogan、自动提升图片清晰度、自动生成logo等。
国内类似的公司包括聆心智能。基于多模态对话生成系统,该公司专注于针对精神心理的AI驱动的高质量数字疗法,让AI围绕认知、情绪和行为三个维度对用户进行评估和干预,生成千人千面的情绪治疗方案,目前已与北医六院、湘雅二院、中日友好医院、清华大学玉泉医院等达成合作。
Mai小麦作为AI量化社交电商领域的独角兽,将AI与电商行业深度融合,打造了独特的商业模式。此外,Mai的核心技术已经得到美国和日本的专利认证,Mai通过自主研发的视觉识别产品,模拟人眼观看视频时的过程,自动识别画面中出现的商品并匹配各大电商平台的同款推荐给用户。
当前,市面上的视频广告技术本质上都是图片识别,而Mai小麦可以模拟人眼对画面中的商品进行追踪,做到高速准确的多物体识别。这是Mai小麦在技术领域的核心竞争力,并且在行业中处于领先地位。目前Mai已经与微博、爱奇艺等头部内容平台以及唯品会、天猫、京东、亚马逊等国内外知名电商平台展开合作,并且正在积极拓展合作平台和应用场景,让更多用户可以感受到AI技术带来的“所见即所买”的便捷。
Nolibox成立于2020年,是一家基于场景需求和用户喜好的智能设计引擎及平台服务商,致力于让每个人都能享受好设计。Nolibox将美学原理、设计模型及人工智能技术进行深度融合,完成知识表示与设计生成,支持多场景之间的设计分发与延展创造。
这一设计平台旨在提供兼收并蓄的多元设计,让人们能够以实惠价格获取别具一格的优质设计作品。在此理念驱动下,“计算美学”(Nolibox)致力于运用人工智能等尖端技术,打破当下垄断的设计壁垒。
视觉中国是国内最大的视觉内容互联网版权交易平台,百度文心一格是AI作画这一新兴领域兼顾创新与实用的代表性平台。双方在AIGC赋能内容创作上的积极探索,展现了AIGC的多元商业价值。视觉中国与百度正式签署战略合作协议,视觉中国与百度旗下的AI作画平台文心一格将在创作者赋能和版权保护等方面展开多项合作,共探AIGC内容产业发展方向。
蓝色光标AI技术主要应用于“智能创意设计”“短视频智能化制作”“智能策略方案制作”三个方面。2021年12月,蓝色光标销博特全新上线AI易稿模块,辅助营销人员轻松写作,用户只需输入公司、产品、行业、标题四项关键内容即可一键生成新闻草稿;此外,还能轻松创作虚拟人配音的可“聆听”音频版新闻稿件。
2022年2月,蓝色光标旗下智能营销助手销博特平台发布“小元宵”计划,旨在将平台现有的分析、写作、文案、随笔以及创意等六大产品能力封装成API技术接口,为虚拟数字人赋能营销创作能力。
万兴科技深耕数字创意软件领域,推出万兴喵影、万兴优转、万兴录演等视频创意软件,Wondershare Filmstock、万兴喵库视频创意素材平台,万兴爱画、万兴播爆等AIGC应用;此外面向全球市场还推出万兴图示、万兴脑图MindMaster、墨刀等绘图创意软件,万兴PDF、Wondershare PDFelement等文档创意软件,万兴恢复专家、万兴数据管家、万兴易修等实用工具软件。
公司正以前瞻的视野推进全球化布局,在深圳设立研发总部,并在长沙、北京、杭州、郑州、西安、温哥华、东京等地设立运营中心,业务范围遍及全球200多个国家和地区,全球累计用户逾15亿。
西湖心辰今年8月上线的AI绘画平台盗梦师,今年9月,AI绘画的作品《太空歌剧院》获得了第一名。
「盗梦师」所在的AIGC厂商「西湖心辰」成立于2021年,依托于新型研究型学术机构西湖大学,专注于人工智能自然语言处理领域的科研成果转化及产品应用等,2021年年底完成了近千万美元的天使轮融资。Diffusion方法出现之后,AI Art的生成速度被大幅提高,也让他们终于看到了在这一赛道推出产品的可行性。
Fancy Technology成立于2020年4月,核心团队主要来自阿里系,深谙平台运营规则及电商玩法。FancyTech是在用AIGC做内容生成,通过AI能力学习平台里海量的跨平台内容,得到我们自己的模型,在结合商家的素材去为他们生成更多内容。
在天使轮之后,FancyTech基于其之前做数据智能服务商所沉淀的海量数据,建立数据分析模型,最终打造出面向品牌的智能服务平台Content Hub,其核心是通过“跨平台热门内容的智能使用和内容的智能生成”,从而提升品牌力商品的转化率以及用户的留存度。
美图公司旗下应用程序Meitu也顺势推出AI绘画功能,在海外收获了一大批新用户。特别是在日本地区的苹果App免费下载排行榜上,Meitu软件在上周多次蝉联第一,一度创造了单日最高将近破百万新增用户的巨幅增长。
美图选择的AI绘画赛道,是AIGC的重要分支,利用该技术,用户只需或拍摄上传一张照片,几秒钟后就能得到一张意象极为相似的艺术图画。美图秀秀AI绘画功能广受海外用户喜爱,在日本、巴西、乌克兰多日蝉联Apple Store总榜第一名;在美国、加拿大、澳大利亚、新西兰、白俄罗斯、智利、哈萨克等地区冲至总榜前三名,订阅用户数在多个国家都有上涨。
诗云科技成立于2020年12月,总部在深圳,愿景是用AI生成内容,让用户以更低成本完成内容创作。其主要产品是内容生成引擎Surreal Engine,核心技术是深度学习和图形学,如自然语言理解、3D建模、神经辐射场、生成对抗网络、神经渲染等。
在Surreal Engine里,他们把内容生成分解成三个步骤:Understanding(理解)、Framing(视框化)、Rendering(渲染)。这是一个多模态的生成器,可以在文字、语音、图片、视频、3D 内容、虚拟内容之间互相切换。这些底层能力会堆叠起来组成内容生成和内容编辑的能力。
北京视连通科技有限公司在人工智能/CV识别、视频内容智能生产和营销增值方面深入探索,以自有AI技术加持大屏增加营销增长。他从当下传统长视频运营的痛点切入,直指面向内容的营销是助力传统长视频运营商营销增长的重中之重。
特看科技成立于2022年6月,创始人兼CEO吴春松(花名乐乘)是前阿里资深产品专家,曾担任阿里巴巴智能设计实验室负责人,打造了AI设计平台“鲁班”;后负责淘宝内容工具业务,孵化了淘宝商家短视频工具亲拍App。联合创始人兼CTO陈炳辉是前阿里资深技术专家,曾担任UC浏览器内核技术负责人,淘宝内容中台视频生产播放技术负责人。
特看核心团队在生成式AI、B端视频直播工具领域有着多年的技术及产品落地经验,同时也在电商行业拥有丰富的认知。团队致力于打造服务全球电商商家的内容工具SaaS,目前已推出海外电商数据分析&视频智能生成工具数字人直播工具“主播宝”。
像素偏移致力于拓展视觉艺术的技术边界,改变人们创作、审美和休闲方式。 我们结合数字角色渲染和混合现实等技术应用,展开在 IP 角色数字化、创意营销视频生产等领域的产品方案落地。
腾讯智影是腾讯影业战略型科技创新团队,依靠腾讯体系的能力和资源,联动云技术,运用5G和AI作为技术载体,基于腾讯科技为影视行业提供智慧化全流程解决方案,推出可提高影片拍摄,后期制作,宣传发行的系列工具:智慧制片,审片平台,智慧后期。
作为国内人工智能视觉技术企业,影谱科技开创了AI视觉生成技术的全景商业模式,影谱科技在产品、业务、研发等方面取得的一系列突破,代表着社会对AI技术商业落地能力的期望。
2020年9月,影谱科技发布“AI视频鉴伪鉴定平台”,从数字治理入手辅助AI视频生态的安全性;2020年10月,发布“智能影像生成引擎MAGC 2.0”,被学界、商界、媒体界认定成为数字经济的生成要素;2020年11月,推出国内首款融合AI+5G的3D数字孪生引擎MADT,创建适应数字经济时代的新型可视化业务链环境。除此之外,基于MADT引擎,影谱科技还推出了业内首款3D数字文创解决方案。同月,公司首次对外展示和演示新的3D成像系统,并针对新零售业务场景提出行业解决方案。
GilaCloud旗下的GliaStudio是人工智能视频自动生产制作平台,通过其人工智能技术会自动将内容转换成视频,并且提供客制化选项。GliaStudio在大数据分析以及机器学习等领域提供多种应用服务以及解决方案,致力于让用户都能享受人工智能以及大数据所带来的便利。
商业内容创作服务企业「井英科技」发布CreativeFitting短视频一站式生产平台,以“AI+人工”协同创作,帮助品牌提高生产效率,为品牌出海赋能。伴随TikTok商业化的崛起,整体广告主对广告短视频的创作需求将大幅度提升。而国内出海广告主在做国外广告短视频时,通常面临脚本创作难、多语言挑战、真人化本土化、真人素材昂贵、外籍演员沟通难等痛点。这都将是CreativeFitting的机会。
2022年初,南京江苏卫视跨年演唱会,有一位“特殊”嘉宾现身:使用最先进技术合成的虚拟人邓丽君现身舞台,与知名歌手周深同台演绎《大鱼》、《小城故事》和《漫步人生路》,虚拟邓丽君的背后是知名虚拟现实(VR)体验服务供应商之一,数字王国。本次其使用的技术是融合机器学习的高阶渲染系统“Mystique Live”,该项技术也曾经运用在《复仇者联盟》系列中的“灭霸”身上。
企业级创意智能生产及协作增长平台。经过多年的技术沉淀,筷子科技基于自研的图片、音频和视频内容的结构化分析技术引擎FusionX,通过AI自动解构图像及视频创意元素,赋能内容人机协作生产效率,深度分析创意与商业转化效果的关系,并通过商业创意线上化团队协作平台产品,大幅提升内容商家客户团队效率和业务增长。
“加筷”智能创意生产及协作平台,该平台为筷子科技于2020年底推出的全新企业级智能创意SaaS产品平台,赋能国内数百万内容商家及跨境商家的智能内容生产及协作平台,链接内容团队编导、拍摄、剪辑、投放、管理等五大协同角色,数十倍提升内容(特别是短视频)生产效率,打通国内外公域及私域主流平台,并通过智能推荐算法和数据分析提升内容转化。
目前,字节跳动旗下的剪映,快手云剪都能提供AI生成视频,快手云剪提供了智能封面、自动配音、自动字幕、画质增强、视频去抖、自动横屏转竖屏等系列智能工具,以技术赋能内容创作者。
在视频的智能化处理模块,目前已经上线个智能工具:智能封面、横屏转竖屏、视频去抖和智能去痕。通过AI技术识别横屏视频,再自动生成竖屏内容,直接降低了横屏竖屏之间的转换门槛。
专注于人工智能与计算机视觉技术研究与产品开发,提供智能制造及数智影像领域技术服务和行业解决方案。帝视科技与产业链上下游高校、院所、企业构建了关系广泛、技术力量强大、产业链完整的产学研合作体,围绕数智影像、智能制造等领域开展系统研究与攻关,形成多种专业化的解决方案。目前,经过自主开发且可落地应用的核心AI算法已有100+,AI模型超1000+,产品能力覆盖数智影像、智能制造产业链上下游企业,加速实体产业往数字化、智能化、系统化方向更新迭代。
思必驰旗下DUI平台上线“单人千音”功能。“单人千音”通过深度神经网络对发音人音色进行建模,实现单个音色就能生成同时覆盖多种语言、多种风格的语音合成声音,极大丰富了合成语音的表现力。与大家分享这一新功能。
于2018年成立,其产品包括针对视频生成配乐的配乐猫、支持非音乐专业人员创作的口袋音乐、可AI生成歌词的LYRICA、AI作曲软件LAZYCOMPOSER。目前已与国内多家音乐平台厂商达成合作。其音乐标注团队已形成了全球最精确的话语歌曲音乐信息库。
标贝科技是一家专注于智能语音交互和AI数据服务的人工智能公司,拥有业内先进的AI语音交互技术及高精度数据采标处理技术,创新打造多场景应用的语音交互方案,以及声音定制,声音复刻、情感合成、声音转换等在内的语音技术产品;AI数据业务涵盖语音合成、语音识别、图像视觉、nlp等采标服务和数据可视化平台-数据工场。
为了赋予合成声音更丰富的情感表现力,满足用户在更多应用场景的多样化需求,标贝科技在音色和场景丰富度上持续发力,上线种音色,包括童声、成人男女声,深度覆盖有声阅读、智能客服、语音播报等多个业务场景,完成对发音库的大量增容。
科大讯飞是成立于1999年的AI巨头,不仅基于AI虚拟人交互平台在打造中国AIGC的中心,而且正在稳步推进国产化核心技术创新。
早在2019年科大讯飞已开始研究超大模型关键技术,联合国内高校打造的开源预训练模型已成为业界头部中文预训练模型,助力行业智能化创新。
讯飞超脑2030计划为牵引来推动源头技术的系统性创新,科大讯飞在复杂场景的多模感知、多维表达、认知智能和AI运动智能算法领域都有长足的进步。多模感知实现语音与视觉、眼神、面部表情、肢体语言、环境的融合感知,多模态增强语音技术将主说话人的干净人声从嘈杂场景中分离出来,识别效果相较单模态提升约49.5%,在业界率先跨过实用门槛。在多语种语音识别、语音合成、图文识别、机器翻译领域,科大讯飞主要语种核心效果保持国际领先水平。
网易试水AI音乐创作领域,推出全球首个一站式音乐创作平台天音。可以为流行音乐专业伴奏编曲工作,提供快速模版化。但是使用该平台需要一定的乐理基础,可根据和弦谱,进行编曲微调的自定义编辑,支持导出成品伴奏音频。
AIGC和虚拟数字人结合会成为一种趋势,聪明且人性化的对话体验,不再只是文字呈现,而是以生动形象的数字人形式输出,这或将成为AIGC数字人的另一个里程碑。
AI音频科技创新企业「倒映有声」,一家以AI技术为核心的国家高新技术企业和无人驱动数字分身技术解决方案供应商,通过自研神经渲染引擎、数字孪生技术、以及独创的TTSA技术,从语义到声音图片,再到连续帧视频画面,实现多姿态的数字分身生成,并实现基于文本实时生成高质量语音(音频)和动画(视频),最终实现无人驱动数字分身的行业技术突破,致力于成为全球领先的AI数字人神经渲染引擎。
倒映有声旗下拥有融媒体AI数字人技术解决方案、“一视同人”数字分身内容创作平台和有声书制作交易平台等,落地场景可覆盖媒体播报、有声读物制作、互动游戏、虚拟直播、娱乐等应用场景,满足企业用户降本增效的需求,促进企业业务形态创新和增长,构建以无人驱动数字分身为载体的虚拟世界新生态。
目前,公司产品、技术、服务以及整套解决方案,已被中央广播电视总台音频客户端云听、河南电视台、物灵科技、中文在线、当红齐天等头部企业所采用。
成立于2018年初,创始人柴金祥已在三维虚拟人的智能建模和绑定、AI表演动画、AI动画生成、交互领域潜心研究了19年,并以第一作者身份代表MSRA发表了中国大陆学者第1篇SIGGRAPH(图形学世界最顶级期刊)论文,先后在SIGGRAPH/TOG发表了20篇关于三维虚拟人核心技术论文。
目前已构建AI虚拟人能力平台,实现一站式造人、育人、用人的构建AI虚拟人的能力平台,赋能各行各业创建多模态交互的AI虚拟人,从而应用在不同的业务场景。
坐落于成都,依托自主研发的元宇宙引擎,采用行业内领先的大数据、区块链、AIGC等技术,致力于打造Web3.0时代的元宇宙基础数字设施,赋能商业元宇宙和城市元宇宙,助力政府、企业数字化转型升级,服务国家战略,推动人类重构未来智能新世界。
2022年11月,星凡科技完成近千万人民币天使轮融资,由鑫瑞恩资本和个人投资者联合投资。本轮融资资金主要用于元宇宙引擎以及AIGC相关技术的研发、市场拓展等。
AIGC已经或者将要渗透到游戏产业链各个环节:美术—AI画图、AI实景运算、AI地图;玩法/策划—AI剧情、智能NPC及语音、AI关卡设计/道具设计;发行—AI投放系统、AI驱动CG制作等等。AIGC对游戏的改造也有望推动全新的玩法/品类甚至游戏形态的诞生。
超参数科技是一家专注于游戏AI探索的初创公司,主攻机器学习、强化学习、大系统工程等领域,旨在为游戏公司提供AI解决方案。成立于2019年初,目前已获得晨兴资本、高榕资本数千万美元A轮融资。
创始人刘永升,原腾讯AI Lab总经理、T4技术专家,围棋AI“绝艺”、王者荣耀AI“绝悟”团队负责人。团队成员包括来自腾讯AI Lab和IEG游戏的多位人工智能科学家、技术骨干,以及海内外顶尖院校的精英伙伴。团队曾主导了围棋AI“绝艺”、王者荣耀AI“绝悟”的研发工作。
超参数科技的方向主要是探索通过AI技术,变革游戏生产方式和内容玩法形式。而经过三年发展,刘永升意识到,游戏AI能够辐射的领域非常广阔,在游戏AI概念下衍生出的业务和应用场景非常丰富,“即便游戏本身也太大了,每个人对游戏AI的理解也不同,我们现在是做减法,把AI Bot做到极致,这是公司非常重要的新战略。”
超参数为AI Bot的发展规划了一条从L1至L4的技术路径,希望从简单拟人化的AI Bot出发,最终构建一个“10亿人与100亿AI bot共存”的虚拟空间生态。
旗下产品「言出法随」——无门槛的影视游戏创作发布平台。灵图致力于搭建下一代影视游戏创作发布平台。利用先进的多模态AI,实现一句话到多种数字媒体内容(图像、视频、VR/AR、3D场景)的一键式生成。将创作能力和权利下放到每一个人,真正实现内容原生,建起人类走向元宇宙时代的桥梁。公司具有奥斯卡级的超大型CG数据集,研发了世界领先的多模态AI。目前该AI已能够实现从文字到多种数字媒体内容的生成。
rct AI 成立于2018年,运用人工智能为游戏行业提供完整的解决方案。在不同类型和题材的游戏场景中,rct AI为游戏开发者打造的一系列解决方案,覆盖了游戏的全生命周期,包含智能内容生成、智能测试、智能数据运营、智能投放等类型。
rct AI也在打造不同技术解决方案,以布局虚拟人“大脑”,即让虚拟人能够智能地行动和决策。在布局过程中,选择以工具的方式切入,借助游戏的全数字化场景迭代AGI技术。rct AI目前主要面向游戏行业提供基于AI的解决方案,包括智能NPC、自动化QA、对话系统和AI陪玩,在这个过程中不断实现技术的积累与迭代。
2016年成立,相芯科技致力于元宇宙基础设施建设,并率先布局深耕虚拟人技术应用,是国内最早一批的元宇宙规模化厂商之一。
相芯科技凭借尖端技术研发能力、丰富的产品开发经验,为各行业领域提供标准化、低门槛、多类型的虚拟人解决方案,广受海内外客户青睐。立足国内,相芯科技已服务小米、荣威、中国移动等各行业头部企业;放眼全球,与美国Fika Media Company、韩国CKG Solutions、新加坡Buzz AR等企业均深入合作。
成立于2020年,独角兽企业,是全球领先的人工智能科技公司,旗下小冰框架是全球承载交互量最大的完备人工智能框架之一,在开放域对话、多模态交互、超级自然语音、神经网络渲染及内容生成领域居于全球领先。
微软小冰人产品有虚拟人、音频生成、视觉创造、文本创造、虚拟社交等。微软小冰的客户已覆盖金融、智能车机、零售、体育、纺织、地产、文旅等十多个垂直领域,并提出了以「人力」的逻辑去进行商业报价的虚拟人商业模式。
深圳追一科技有限公司是领先的人工智能公司和AI数字员工提供商,公司主攻深度学习和自然语言处理,提供智能语义,语音和视觉的AI全栈服务。AI数字员工智能平台能与业务场景深度融合,提供不同类型的AI数字员工,满足企业和政府用户服务、营销、运营、 办公等多种场景的智能化升级需求,帮助客户降本提效,改善用户体验,驱动创新和增长。
核心团队中,国内顶尖技术专家占比81%以上,绝大部分成员为硕士和博士学历,涵盖了NLP算法、语义算法、语音算法、多模态算法、自动机器学习、数据挖掘等全栈AI技术领域。团队成员已提交333项专利,其中获得专利授权109项,在AI领域主流刊物发表数十篇学术论文,其中3篇论文发表在顶级学术会议ASRU、NLPCC、EMNLP上。
昆仑万维成立于2008年,在AIGC领域已经投入了近两年的时间,成立MusicX L ab,目前已经正式销售AI作曲。
22年第四季度推出的“昆仑天工”,旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。
AI图像方面,天工巧绘SkyPaint采用全球第一款多语言Stable Diffusion分支模型,兼容Stable Diffusion;使用1.5亿中英双语语料,支持中英双语输入实现文字生成图像,是国内为数不多的支持中英双语的文图生成模型。
央视最早在 2018 年就和搜狗推出过 AI 主持人,并在21年5月推出手语AI合成主播,搜狗在翻译和虚拟数字人(搜狗分身)交互领域的积累和交叉融合。在搜狗以语言为核心的AI技术布局中,从中文、多方言和外国语种的语音识别转写、AI同传翻译,再到个性化的语音合成和变声……在人们生活中语言应用的方方面面,都不乏搜狗的身影。
如今,搜狗作为国产AI+语音领域颠覆传统语音行业领先者之一,其AI语音技术具有高识别率、高准确率、低时延和多模态融合等优势,已广泛应用到教育、商务、旅游等多个应用场景,并已深入你我身边的千家万户中。
2022年发布了AI助理,覆盖了各种AIGC应用,包括AI自动生成文字、图片以及图片转换成视频,旨在为现有的500多万百家号创作者带来一套AI生产内容工具,帮助他们更快更好地产出视频内容,从而增加百度百家号等产品的用户粘性。
百度增强现实技术部成立于2017年,依托百度大脑核心能力,打造业内领先的AR 智能交互平台DuMix AR。通过视觉定位、人机交互、3D识别跟踪等技术能力的前瞻布局,构建虚实互联的基础设施,变革人机交互的创新体验。百度知识图谱面向海量数据,综合运用语义理解、知识挖掘、知识整合与补全等技术,构建出多元异构的超大规模知识图谱,进而基于知识图谱进行理解、推理和计算。
文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品:
目前,百度知识图谱已经拥有业界最大规模知识图谱,并广泛应用于公司各产品线。同时,百度知识图谱深耕行业图谱,打造面向B端场景的知识图谱平台、产品及解决方案,业内首发行业知识中台,助力各行各业的智能化升级。
2023年2月初,腾讯旗下的腾讯研究院发布《AIGC发展趋势报告2023》。报告中指出,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。以及,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长。
腾讯拥有“微信”这一国民级移动应用程序,包括在公众号、视频号、看一看等功能中都有AI算法加持。目前,腾讯在AI技术领域的业务,主要包括腾讯AI实验室、腾讯优图等。
腾讯AI Lab基于多模态学习及生成能力在游戏领域进行了全流程的布局。如开发的“绝悟”平台通过强化学习的方法来模仿真实玩家,包括发育、运营、协作等指标类别,以及每分钟手速等具体参数,让AI更接近正式服玩家真实表现。腾讯AI Lab还与王者荣耀联合推出了AI开放研究平台“开悟”,试图让AI通过强化学习的方法来模仿真实玩家,最终达到职业电竞水平。除此之外,腾讯还打造了写稿机器人“梦幻写手”。
微软亚洲研究院(MSRA)是微软在美国本土以外规模最大研究机构,自 1998 年建院以来已经发展成为世界一流的计算机基础及应用研究机构,推动整个计算机学科前沿技术发展并将最新研究成果快速产品化。微软亚洲研究院着眼于下一代革命性技术的研究,目前共有约 250 名研究和开发人员以及 300 多名访问学者和实习生。
微软亚洲研究院自然语言计算组专注于自然语言处理领域的理论、算法和应用研究。目前主要的研究兴趣包括:自然语言理解与生成,机器翻译,智能问答,语音处理,代码智能,文档智能,多模态理解与生成,以及大规模预训练模型等。
淘系搜索算法团队拥有全世界最大的商品搜索系统,每天为上亿用户提供数十亿次搜索服务。我们致力于研究最前沿的机器智能技术,探索世界上最完整的最有价值的电商大数据,引领深度学习时代搜索算法技术的变革。
阿里巴巴达摩院语言技术实验室NLP团队研发的技术在图文问答和中文理解榜单多个任务上首次超越人类,建设NLP平台和产品在阿里巴巴集团内支持数百个场景日均数万亿级调用,对外赋能多个行业合作伙伴,也是AI开源魔搭社区NLP模型的主要提供者。其中黄非博士加入达摩院之前,他曾在卡耐基梅隆大学攻读博士,之后在IBM Watson和Facebook从事并领导NLP研究等工作。他在人工智能顶级会议和期刊发表文章60+篇,中美专利20项,曾担任ACL,AACL等学术会议领域主席等。
阿里巴巴旗下的AI在线设计平台Lubanner,帮助营销人员生产Banner。
在视觉生成研究领域始终位于前沿,代表作品包括CycleGAN、GauGAN、EditGAN、GANverse3D、Instant NeRF等。2022年12月,NVIDIA发布了NVIDIA AI Enterprise 软件套件的新版本,为全球企业多个行业和特定领域的各项工作负载提供支持。NVIDIA AI Enterprise 3.0提供用于呼叫中心的智能虚拟助手、音频转录和网络安全数字指纹的AI工作流。对于应用AI来完善客户服务的企业而言,这些都是最常使用的应用。NVIDIA AI Enterprise 3.0预计将于本月晚些时候上线。除上述功能外,还扩大了对NVIDIA NGC软件目录中50多个NVIDIA AI软件框架和预训练模型的支持,将大幅推动并简化全球范围内众多机构的AI部署工作。
商汤拥有领先的人工智能基础设施SenseCore大装置,不仅具有领先的人工智能算力,还可以提供十亿级参数级别的参数大模型,并在此基础上打造了SenMARS火星混合现实平台。SenMARS火星混合现实平台可以提供包括数字人、数字空间、数字物体在内的生成能力。
基于原创的OpenXRLab扩展现实平台的领先算法,结合大量真人动作数据,商汤打造了一套基于深度学习的动作捕捉及生成解决方案。
基于商汤原创的虚拟IP解决方案及多种领先的AI技术,可以实现高效率、低成本的AIGC内容创作,助力银行实现前端业务的用户积累和营销转化。
抖音有很多 NLP 的落地场景,多模态,语义理解,词法分析,意图分析,多语言,广告等等,绝对有你的用武之地;而工程方面的也有非常多有挑战的工作等着你,支持数万亿视频的快速检索框架,超大规模分布式系统,高性能深度学习框架和平台构建等等,方向众多。
2023年2月7日,谷歌通过Twitter发布了一个在线短视频广告,推广其旗下、基于大型语言模型LaMDA的聊天机器人Bard。谷歌已经向AI初创企业Anthropic投资约3亿美元,获得Anthropic约10%的股份,后者将用投资从谷歌的云计算部门购买大量计算资源。
谷歌所研发的LaMDA,是一种基于网络上数十亿词汇进行训练的大型语言模型。它不仅受益于谷歌更强大的计算能力和研发团队,并且谷歌还有能力通过数百万用户的反馈来对LaMDA模型及聊天机器人Bard进行微调。按照Pichai的说法,Bard可以利用谷歌庞大的信息库,为用户提供准确且高质量的答案,对微软及ChatGPT构成有力威胁。
2022年5月,MetaAI官宣发布了基于1750亿参数的超大模型OPT-175B,还对所有社区免费开放。
2022年12月22日,该模型的更新版本OPT-IML(Open Pre-trained Transformer)正式上线个语言任务进行了微调,包含1750 亿个参数」,还将为非商业研究用途免费开放。
MetaAI在2022年5月宣布了一项长期研究计划,与神经影像中心NeuroSpin (CEA)和INRIA合作,以更好地了解人类的大脑如何处理语言。该项目的主要工作是比较AI语言模型和大脑如何响应相同的口语或书面句子,进而将得出的见解和结论用于指导AI模型的开发,使得新模型能够像人类一样高效地处理语音和文本。
OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和成果,如大语言模型GPT系列、文本生成图片预训练模型DALL·E系列、语音识别模型Whisper系列等。由于这些模型在各自领域都有相当惊艳的表现,引起了全世界广泛的关注。
2022年11月30日,OpenAI带来了一种全新的 AI 聊天机器人——ChatGPT,它在很多问题上近乎完美的表现使得它仅仅5天就有了100万用户。它可以帮助我们写代码、写博客、解释技术,可以多轮对话,写短剧等等。
以AI绘画走红全球的新晋独角兽公司Stability AI,去年推出了开源AI模型Stable Diffusion。借助这一模型,任何人只需要提供一段文字描述,就有机会创作出任意风格的绘画作品。Stable Diffusion自2022年8月推出以来,已经被全球超过20万开发者下载和授权。Stability AI的消费级产品DreamStudio注册用户来自全球50多个国家,已经超过100万,他们共同创建了超过1.7亿张图像。
Midjourney-Ai 一款搭载在Discord上的人工智能绘画聊天机器人,一分钟绘图,效果出众,至今仍然是AI绘图领域里的佼佼者。对于普通人来说,使用Midjourney的门槛非常低,你只需从Midjourney官网点击进入它们的Discord服务器,任意选择一个新手频道(#newbies),然后在聊天框里输入或者调用“ / imagine”选项,输入一句描绘你想要实现画面的文字即可。
MiniMax名之梦,致力于成为通用人工智能时代基础设施建设者和内容应用创造者,靠谱的产品和技术规划,充裕资金(全球顶级投资机构),信奉产品和技术驱动的商业模式变革,“不走捷径”得用“智能创造极致体验”。核心成员均来自于中美顶级科技/互联网企业和海内外知名院校。团队拥有丰富的计算资源和数据壁垒,促使前沿技术与产品的结合。
以自研的中文超大规模预训练模型为核心构建工业级中文信息处理引擎,并研发最优秀的产品,引领中国的语言信息处理智能化革命。由于天然的语言差异和屏障,国外的英文大模型无法用于中文语言信息处理场景。而中文大模型的研发远未成熟,实际性能相较英文大模型仍有不小差距。这既是挑战,更是机遇——中文语言信息智能处理这一极为广阔的市场仍然一片蓝海。依靠这些模型强大的语言能力,文章自动写作、摘要自动生成、人机交互对话等一系列应用迅速铺开,并已产生巨大商业价值。
北京智源人工智能研究院(简称:智源研究院 Beijing Academy of Artificial Intelligence,BAAI)是人工智能领域的新型研发机构,目前正在研发的有“悟道”人工智能大模型项目、“天演”人工智能生命模拟工程、“九鼎”智算平台、AI技术赋能生命科学研究等。
GPT-3、OPT系列、悟道等预训练模型在NLP领域取得了非常瞩目的效果,但是不同代码仓库有着不同实现风格,并且在预训练大模型过程中使用的技术也各不相同,造成了技术鸿沟。为了快速加载、训练、推理不同大模型,使用最新最快的模型并行技术以及提高用户训练和使用模型的便捷性,智源人工智能研究院推出了FlagAI(飞智)基础模型开源项目,为一键调大模型等功能提供支持。
FlagAI飞智是一个快速、易于使用和可扩展的AI基础模型工具包。 支持一键调用多种主流基础模型,同时适配了中英文多种下游任务。
非凡产研是非凡资本旗下专业的新商业创新及发展研究中心。非凡产研专注于商业场景下国内及出海企业服务生态领域的研究,涉及方向包括:新营销、新零售、新体验等,来帮助品牌和商家在全球化和数字化的时代获得先机和提升竞争力,同时,非凡产研致力于将数据技术、人工智能和自动化等新技术与不同领域传统产业相结合,包括:消费零售、本地生活、医疗健康等,助力企业插上数智化的翅膀。团队成员来自知名研究咨询公司、私募基金和科技媒体等,是一支具有深入洞察、专业知识和丰富资源的分析师团队。
- 本文固定链接: https://www.douyinkuaishou.cc/?id=55408
- 转载请注明: admin 于 抖音快手 发表
《本文》有 0 条评论