yangkang2021.github.io

webrtc mediasoup集成人工智能与Pipeline

采集分析渲染编码 + 解码分析渲染都是全程GPU是最完美的pipeline

在视频会议里面加入美颜，人像分割，背景替换，人脸检测，识别… 对性能要求非常高：资源使用率本来就高，而且最多给5ms的时间。

这需要给 windows linux mac Android ios的采集模块加一个中间层：

采集后在cpu得到yuv，考虑用dx的全流程gpu？解码后得到的yuv在cpu，给opengl上传显存渲染

默认camera2采集后的数据就在显存，然后显存直接给mediacodec硬件编码，和给opengl渲染。解码后得到的yuv在显存，直接渲染

采集后的数据在cpu，然后分别给编码器和opengl分别上传到显存处理。解码后得到的yuv在cpu，给opengl上传显存渲染

所以，android用shader实现人工智能最好，其他端随意。

obs和webrtc怎么结合的：

两种方式：在webrtc里面用libobs采集，在obs里面用webrtc推流
1. 把yuv放到webrtc的track就能支持基本所有数据的输入
2. 很多人反过来，在obs内部实现一个webrtc output serveice。就拥有了webrtc的直播软件
  - 你需要obs的界面就这样用，但是大多数webrtc都是视频通话，不是简单的直播推流，那就不能