信义科技CEO雷涛AIGC可快速搭建元界产业基础设施

author
0 minutes, 18 seconds Read

财经社4月6日电(记者徐慈浩)随着ChatGPT聊天机器人的普及,人工智能行业迎来了长达半年的技术“热潮”。

但ChatGPT引发的技术伦理、网络安全、知识产权等一系列问题也需要关注。 本期《元界之约》对话信义科技CEO雷涛。 作为信义科技孵化的公司,信义科技近期推出了自己的智能AI内容生成平台“一帧秒”。

在雷涛看来,大模型只解决基础能力。 想要真正应用到各个领域,还是需要自己做数据训练; 基础模型需要真正理解用户,因为用户的问题有很大不同,答案也会有很大不同。

对于AIGC与元宇宙的关系,雷涛表示,AIGC帮助元宇宙快速搭建基础设施。

image/

推出AI视频生成平台“一帧秒”

我简单介绍一下公司在AIGC的布局。

雷涛:信谊科技是夏一科技孵化的实体,正在探索虚拟现实和人工智能领域。 信义科技主要产品及业务涵盖中短视频平台、VR数字孪生技术应用及直播平台运营。 2021年底,我们会考虑做一个新的视频平台应用。 当时,PGC和UGC视频平台已经形成激烈的竞争,同时创作者也在向视频平台转移; 但大量创作者没有制作视频的能力,所以我们做了一款直接将文字转换为视频的产品——一帧秒。

据说一帧秒有数十亿视频素材?

雷涛:One Frame是一个基于AIGC引擎的智能AI内容生成平台。 以文本生成为核心功能,为创作者和机构提供文本放大、文本转语音、文本生成等多模态生成服务。 图片、文字转视频等一系列创意服务; 通过对文案、素材、AI语音、字幕等元素的智能分析和解构,帮助创作者快速出片,实现视频制作零门槛。

AIGC需要丰富的数据和强大的算法。 信义科技目前在这方面的储备有多少?

雷涛:新一科技也涉足大型车型。 当然,我们的研发能力还不足以完成一个新的大型号的开发。 相反,我们是基于目前开源的大模型(比如GPT和清华的GLM)来做我们自己的垂直化。 培训形成自己的大样板产品来服务用户。

在AIGC应用方面,One Frame产品的核心功能是将图像转换为文本。 用户只需要输入一个标题,然后通过AI就完成了视频。 产品逻辑是通过文案来匹配素材,将素材拼接在一起形成视频,但前提是需要有足够的素材。

我们是一照科技孵化的企业。 在一照科技的历史上,我们有数十亿的视频为一帧即时创作提供素材。 我们对这些视频进行了深度结构化,并给它们打上丰富的标签,供用户搜索、匹配等,这样我们就可以形成更好的AIGC视频体验。

AI视频生成需要解决两个问题

GPT模型生成视频比文本更难吗?

雷涛:GPT本身只有文本能力,但基于文本能力可以扩展其应用。 生成视频输出,主要要解决两个问题:一是GPT对镜头语音的理解,二是视频数据的处理和理解。

AIGC或人工智能将对视频行业产生什么影响?

雷涛:其实我们自己的业务是和视频相关的,之前我们也用过GPT系列的型号。 在我看来,GPT模型可以为视频行业解决以下问题: 1、视频脚本的编写,文字的编写本身就是GPT的一项基本能力; 2、视频字幕的提取和翻译,这是一个基于GPT本身的应用; 3、刚刚发布的GPT-4是一个多模态模型。 这种多模态模型可以理解和分析视频内容,同时推荐和搜索视频; 4. 由于GPT可以理解视频应用程序,因此它也可以用于视频内容。 人工智能审查和过滤。

在一些视频平台上,人工智能被广泛用于生成电影评论、科普和财经的快速草稿。 这样做最重要的影响就是提高了视频制作的效率,让个人用户拥有了只有部分工作室才有的视频制作能力,降低了视频制作的门槛。

人工智能生成的视频会存在版权问题吗?

雷涛:我们只是匹配结果,尽量为客户匹配一些有版权的素材; 如果用户需要在商业领域使用这些素材,确实需要解决版权问题。

模型需要真正理解用户的问题

据了解,ChatGPT背后的大语言模型训练集的最新数据截至2021年底,因此无法对2022年发生的任何事件给出准确答案。您对此有何看法?

雷涛:你可以把ChatGPT看做是OpenAI的一个产品demo。 它向你展示了它的能力,所以即使它的数据训练有时间线,这也不影响它的显示能力。 数据不是核心问题,能力才是。 该模型仅提供解决问题的基本能力。 想要真正应用到各个领域,还是需要自己做数据训练。 基础模型确实需要解决如何理解用户的问题,因为用户的问题千差万别,答案也会千差万别。

您认为目前GPT模式存在哪些问题?

雷涛:首先,GPT是一个大型语言模型,训练数据非常大。 这意味着如果构建类似的大型模型,需要花费大量的数据标注、计算能力、能源和存储成本。 这种高成本问题很容易导致技术霸权,这是大模型的天然问题。

其次,训练完成后,基于其的大量数据的伦理问题越来越突出。

第三,GPT-4现在涵盖了广泛的知识。 很多问题都能有条不紊地得到解答,但也存在严重的“废话”现象。 这就考验它的逻辑思维能力,是否误导用户。

这些问题的后果是什么?

雷涛:有一种可能,如果大家都倾向于建立模型,可能会出现类似的军备竞赛,这会消耗大量的存储、算力、能源等成本。 逻辑推理的误导性可能会让用户怀疑许多新闻的真实性,从而无法区分哪些信息是真的,哪些是假的。

AIGC助力元界基础设施建设

您如何看待目前元界行业的发展?

雷涛:元界行业整体发展可能不及预期:一是VR终端销售疲软,META的Quest和Byte的Pico4出货量均低于预期; 其次,元宇宙相关的NFT概念极具投机性; 此外,元界行业还没有出现杀手级应用,手机或者VR设备上也没有出现过这样的产品。

从广义上讲,AIGC也是元宇宙的一部分。 也许未来下一次技术浪潮到来时,元宇宙将充满新的机遇,但目前还处于概念阶段。

AIGC的发展能给元宇宙带来什么?

雷涛:AIGC这个概念从去年开始逐渐流行起来。 我们看到AIGC可以生成文本、图片、视频、代码、游戏等。

元宇宙需要大量的内容制作。 如果依靠传统的PGC或UGC方​​式,要么制作成本太高,要么制作质量低。 AIGC的这种方式帮助元界快速搭建基础设施,包括文本、语音、视频等多媒体内容。

此外,元宇宙中还可以使用AI生成代码或者AI生成字符。 这也是AIGC未来一个可能的方向。

Similar Posts