为了使得您获得更好的网页浏览体验,推荐您安装使用谷歌浏览器 立即更新
400-610-3866

绚烂如烟花,“Clubhouse们”如何才能持续绽放?

2021年02月22日

近日,一款音频社交APP突然爆红网络,强势吸引大批iOS用户下载注册并引起微博等社交媒体平台的大量讨论,这款APP就是——Clubhouse。

图片来源:Neil Patel

Clubhouse在中文网络世界的爆火可以追溯到2021年的1月,Elon Musk在社交媒体发文称将在北京时间2月1号在Clubhouse上创建聊天室,这一消息迅速引爆国内外的社交媒体。Elon Musk的大名可谓无人不知不人不晓,电动车、火箭、脑机接口等一系列关键词让坐拥Tesla、SpaceX的他不仅是成功的企业家,同时也是这个时代最具梦幻意义的创新领袖、科技偶像和巨量网红,更不必提近期他还一度登上世界首富宝座。那么,如果有一个机会能听到Musk和其他一些世界上最顶级的头脑们聊天,想必有大批人不愿错过。

自此,被Musk引流至服务器一度崩溃的Clubhouse成功进入大众视野。但Clubhouse能持续成功的原因,不仅仅在这一次现象级的社会性事件。

从“club+house”这个直白的名字组成上不难看出,Clubhouse提供的主要服务形式是多人语音在线聊天,为人们在线上“club”谈天说地提供“house”。在疫情尚不明朗、居家隔离仍被提倡的国际大环境下,在美区APP store会诞生这样一款呼应居家人群语音社交需求的APP也并不令人意外。同时,Clubhouse的处处“克制”的设计又将其打造成一款与众不同的语音社交软件。

Clubhouse采用了克制的邀请注册机制,普通用户可先行抢注自己的ID,但仍需要邀请码来完成完整注册过程以正常使用。这样保证了初期用户对交互形式的兴趣程度、接受程度以及熟人社交关系网,同时也在某种意义上进行了用户过滤,保证了优质程度。

图片来源于网络

其次在推荐机制上,Clubhouse采取“熟人关系+兴趣探索”的模式,可以让用户迅速发现自己好友的兴趣并探索自己喜欢的房间。而最为克制、与其他IM产品最为不同的是Clubhouse没有任何文本输入框,每一个聊天室中只有纯粹的语音沟通,普通听众除非举手并被主持人允许否则不能发言,而且听众的离开也不会告知主持人和发言嘉宾,这就保证了整个聊天室内的讨论和发言几乎不受任何外力影响,讨论氛围与思考过程不受听众评论和发言的影响,保证了内容层面的高质量。在各大互联网企业都在想尽办法提高APP使用者参与度的今天,这样一款重视交互和内容、小而精的APP显得不那么“入流”,却又脱颖而出。

但事物往往具有两面性,孟德斯鸠曾说:“自由不是无限制的自由。”

由于缺乏相关经验,作为新生产品的Clubhouse显然在中国遭遇了“水土不服”。内容监管的缺失让这款APP几度出现风险内容的讨论房间,几经周折最终被暂停服务。

图片来源于网络

自此,爆火中文社交网络的Clubhouse热度大减,不复往日繁荣。

可见,风险内容监管已经逐步成为语音社交软件存亡的生命线,语音内容中极有可能混有涉黄、涉暴、涉恐、敏感等敏感信息,对网络环境纯净造成威胁,语音内容审核成为了社交平台的新难题

数美科技发现,语音审核除了要识别音频包含的文本内容是否涉及敏感信息,同时还存在语音语调上的拟声词、感叹词和语气词的审核难度,例如涉及色情信息的娇喘、呻吟等。这为语音审核提出了更高的挑战。目前普遍采用的人工审核方式虽然能够提供较好的审核能力,但需要对音频文件进行整段察验,对音频流进行实时监控,造成了较高的时间成本和人力投入。

对此,数美科技旗下的全栈式智能内容识别产品“天净”,能够通过智能音频过滤技术提供强有力的音频内容识别支持。智能音频过滤技术采用基于ffmpeg的音频信息动态转码技术、基于深度学习的语音识别技术和智能特色语义分析技术,能够对绝大部分音频格式进行多场景、多维度地检测与识别。其中包括敏感、涉黄、广告导流等诸多类型。智能音频过滤产品识别准确率高,处理速度快,检测场景广泛,支持中英双语种,能够极大降低人工审核成本,提升音频内容质量。

音频内容识别组成

在语音内容获取上,数美科技的智能音频过滤技术支持OGG、MP3、ASF、WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF等多种音频格式和音频流,能够应对不同语音内容提供平台使用的常用音频格式,同时支持语音直播实时监控、语音点播、语音消息和各种音频文件的检测。

在获取到待检测的音频文件和音频流后,主要从四个方面进行内容的检测识别:

1.敏感违规
利用语音转文本技术将语音信息转为文本信息,再通过成熟的文本内容检测,对音频中出现的多种类型政治违规内容进行检测。

2.涉黄违规
利用大规模GPU集群的计算能力和深度学习技术,准确快速稳定地识别音频中出现的色情,低俗或性感部分,在管理后台对其进行标注和反馈,从而大规模提升人工审核团队效率,增强用户浏览体验。

3.特殊声音
识别同样利用大规模GPU集群的强大计算能力和深度机器学习的技术,除了一般的涉黄违规语言内容,还能准确识别出呻吟等非文本类的特殊声音。

4.导流广告
通过语音转文本技术将语音信息转为文本信息,对文本内容进行关键词检测,识别出潜在的添加微信号、QQ号、QQ群以及虚假信息等导流广告音频内容。

经过测试,智能音频过滤技术对问题音频判断的正确率以及反馈问题音频的正确率均高于90%。在提供高正确率的音频过滤结果的同时,此套解决方案还提供了非常高的处理效率,智能音频过滤API的最大响应时间为1s,超时率低于0.01%,实时率可达到30%。而智能音频过滤API也具有深厚的处理容量,最大支持并发100路处理任务,还可根据需求水平扩展。

数美科技音频内容风控方案

同时,数美科技为“天净”赋予了丰富多样的标签体系,对涉黄、涉暴、涉恐、敏感、广告导流等不同敏感信息进行详细分类,以满足不同程度、不同种类、不同特点的识别需求。而数美强大标签体系亦成功成为了多家社交平台进行风险内容审核的尺度参考,为新生产品提供了可靠强力的内容风控基础。

智能音频检测还整合了业界一流的语音识别技术、大规模GPU计算的深度学习、基于敏感词库的名单服务、特殊声音识别模型、基于深度学习的NLP模型以及实时分布式规则引擎等。其中深度学习模型能够让系统从多个维度检测语义环境,准确识别说话意图。而智能音频检测技术根据不同场景和行业采用了专门化的判断策略,结合强大的标签体系能够为不同类型社交平台提供定制化的过滤服务。

高效准确的识别算法、广泛多样的格式支持、细致强大的判定能力以及不同用户的精细化方案,数美科技持续为音频内容平台客户提供高效准确的音频内容风控方案。