请教各位大虾,如何编程实现将摄像头采集到的视频和声卡采集到的音频数据实时合成到一个视频数据流中去,分数不够可以再加,要多少请开口,我还有四千多分