文章目录

  • iOS 硬解码总结
  • iOS 硬解码
  • 数据转换
  • 初始化Session 和解码器配置
  • 解码


iOS 硬解码总结

在iOS 中解码从解码方式来讲,可以分为硬解码 和 软解码

  • 硬解码: 由显卡核心的GPU 来对视频数据进行解码工作
  • 软解码: 由CPU 来进行解码

画质

性能

内存消耗

支持格式

流畅度

总耗能

硬解码







软解码




无限制



iOS 硬解码

在iOS中使用硬解码是有系统提供的接口来完成的,即VideoToolbox框架。
硬解码的主要流程如下:

  • 将实时视频流进行数据格式转换 annexB ->AVCC (因为VideoToolbox 只能解码AVCC 格式的H264)
  • 初始化解码session和解码回调数,并设置SPS、PPS。
  • 将转码之后的数据格式进行解码
数据转换

进行数据转换之前,我们需要保证在实时传输的过程中,数据保证是完整的一帧过来的,中间如何实现组包和重传本次就不描述了。
在数据转换时,我们通常可以拿到实时流的SPSppsSEIIDR,需要将这些数据保存下来,用作硬解码H264的Description配置创建。
在我们目前的实时流中不存在B 帧,所以图像都是保存在I帧和P帧中,那只要把I帧和P帧数据送到解码器,就完成了图像的解码工作。
数据转换的操作步骤如下:

  1. 找到StartCode
  2. 判断帧类型
  3. 计算SPS、PPS的值
  4. 将图像数据帧传递到解码器

在H264的实时流中,所有NALU单元的StartCode 一定是0x000001或者0x00000001,所以我们需要遍历收到的buffer
常见的起始码一般是4个字节,在使用H264分析工具查看后,发现我们的SPS/pps/IDR 都是4个字节,而P帧的startCode 为 3个字节,所以我们不能直接设定起始码位置。
先贴一个我们的H264码流截图

ios 图片编解码 苹果解码格式_ios 图片编解码

因为码流中存在2个PPS,我们必须将两个PPS 都要保存下来,不然在进行解码的时候无法正常的出图,会一直报错数据错误(-12909)
详细的代码如下:

for (int i = 0; i<size && i<300; i++) {
        // 1、判断startCode 的长度并找到帧数据的起始位置
        int naluSize = [self getNALHeaderLen:(buffer + i) size:size-i];
        if (naluSize && i + naluSize + 1 < size ) {
            uint8_t tempBuffer = buffer[i + naluSize];
            int sliceType = tempBuffer & 0x1F;
            // 2.获取到起始码后一位的值
            uint8_t tempBuffer = buffer[i + naluSize];
            // 3.进行与操作,判断帧类型 5:IDR 7:SPS 8:pps 6:sei 1:P/B(B 帧数据为0x01)
            int sliceType = tempBuffer & 0x1F;
            // 4.进行sps pps 值的计算
            if (sliceType == 0x01) {
                self.PNaluStartIndex = i;
                currentType = YJVideoFrameType_P;
                break;
            } else if (sliceType == 0x05) {
                if (preFrameType == YJVideoFrameType_SEI) {
                    [self getSliceInfo:buffer slice:&_seiData size:&_seiLength start:preIndex end:i];
                }
                self.INaluStartIndex = i;
                currentType = YJVideoFrameType_I;
                goto GO_EXIT;
            } else if (sliceType == 0x07) {
                preFrameType = YJVideoFrameType_SPS;
                preIndex = i + naluSize;
                i += naluSize;
            } else if (sliceType == 0x08) {
                if (preFrameType == YJVideoFrameType_SPS) {
                    [self getSliceInfo:buffer slice:&_spsData size:&_spsLength start:preIndex end:i];
                } else if (preFrameType == YJVideoFrameType_PPS) {
                    // 连续2个都是PPS
                    [self getSliceInfo:buffer slice:&_ppsData size:&_ppsLength start:preIndex end:i];
                }
                preFrameType = YJVideoFrameType_PPS;
                preIndex = i + naluSize;
                i += naluSize;
            } else if (sliceType == 0x06) {
                if (preFrameType == YJVideoFrameType_PPS) {
                    [self getSliceInfo:buffer slice:&_pLPPS size:&_lppsLength start:preIndex end:i];
                }
                preFrameType = YJVideoFrameType_SEI;
                preIndex = i + naluSize;
                i += naluSize;
            }
            
         }         
}

// 获取startcode 长度
- (int)getNALHeaderLen:(const uint8_t *)buffer size:(NSInteger)size {
    if (size >= 4 && buffer[0] == 0x0 && buffer[1] == 0x0 && buffer[2] == 0x0 && buffer[3] == 0x1) {
        return 4;
    } else if (size >= 3 && buffer[0] == 0x0 && buffer[1] == 0x0 && buffer[2] == 0x1) {
        return 3;
    }
    
    return 0;
}


- (BOOL)getSliceInfo:(const uint8_t *)videoBuf slice:(uint8_t **)sliceBuf size:(NSInteger *)size start:(NSInteger)start end:(NSInteger)end {
    BOOL isDif = NO;
    
    NSInteger len = end - start;
    uint8_t *tempBuf = (uint8_t *)(*sliceBuf);
    if (tempBuf) {
        if (len != *size || memcmp(tempBuf, videoBuf + start, len) != 0) {
            free(tempBuf);
            tempBuf = (uint8_t *)malloc(len);
            memcpy(tempBuf, videoBuf + start, len);
            
            *sliceBuf = tempBuf;
            *size = len;
            
            isDif = YES;
        }
    } else {
        tempBuf = (uint8_t *)malloc(len);
        memcpy(tempBuf, videoBuf + start, len);
        
        *sliceBuf = tempBuf;
        *size = len;
    }
    
    return isDif;
}
初始化Session 和解码器配置
  1. 创建视频格式参数配置
  2. 创建解码回调
  3. 创建解码用的session
  • 配置的关键在于对SPS 和 PPS 的参数配置,这个决定了你解码图像是否能够成功,其中CMVideoFormatDescriptionCreateFromH264ParameterSets的几个配置最为关键,我们需要把H264码流中的SPS/PPS都作为参数填充到该方法,此方法的释义可见源码解析。
  • 创建Session的回调也很关键,注意作为数据输出的自定义回调方法,在设置了回调之后VTDecompressionSessionDecodeFrame方法输出的imagebuffer是不会有值的。
- (BOOL)initH264HwDecoder
{
    if (mDeocderSession) {
        return YES;
    }
    const uint8_t *const parameterSetPointers[3] = {pSPS,pPPS,pLPPS};
    const size_t parameterSetSizes[3] = {mSpsSize,mPpsSize, mLppsSize};
    OSStatus status = CMVideoFormatDescriptionCreateFromH264ParameterSets(kCFAllocatorDefault, 3, parameterSetPointers, parameterSetSizes, 4, &mDecoderFormatDescription);
    
    if (status == noErr) {
          NSDictionary* destinationPixelBufferAttributes = @{
                                                           (id)kCVPixelBufferPixelFormatTypeKey : [NSNumber numberWithInt:kCVPixelFormatType_420YpCbCr8BiPlanarVideoRange],
                                                           (id)kCVPixelBufferWidthKey : [NSNumber numberWithInt:1920],
                                                           (id)kCVPixelBufferHeightKey : [NSNumber numberWithInt:1080],
                                                           //这里款高和编码反的
                                                           (id)kCVPixelBufferOpenGLCompatibilityKey : [NSNumber numberWithBool:YES]
          };
    
        VTDecompressionOutputCallbackRecord callBackRecord;
        callBackRecord.decompressionOutputCallback = didDecompress;
        callBackRecord.decompressionOutputRefCon = (__bridge void *)self;
        VTSessionSetProperty(mDeocderSession, kVTDecompressionPropertyKey_ThreadCount, (__bridge CFTypeRef)[NSNumber numberWithInt:1]);
        VTSessionSetProperty(mDeocderSession, kVTDecompressionPropertyKey_RealTime, kCFBooleanTrue);
        
        status = VTDecompressionSessionCreate(kCFAllocatorDefault,
                                          mDecoderFormatDescription,
                                          NULL, (__bridge CFDictionaryRef)destinationPixelBufferAttributes,
                                          &callBackRecord,
                                          &mDeocderSession);
        NSLog(@"Init H264 hardware decoder success");
    } else {
        NSLog(@"Init H264 hardware decoder fail");
        return NO;
    }
    return YES;
}
解码

解码过程没有太多需要注意的地方,网上的都比较一致,没有什么需要特别讲的

-(CVPixelBufferRef)decode:(uint8_t *)frame withSize:(NSInteger)frameSize
{
    CVPixelBufferRef outputPixelBuffer = NULL;
    
    CMBlockBufferRef blockBuffer = NULL;
    OSStatus status  = CMBlockBufferCreateWithMemoryBlock(NULL,
                                                          (void *)frame,
                                                          frameSize,
                                                          kCFAllocatorNull,
                                                          NULL,
                                                          0,
                                                          frameSize,
                                                          FALSE,
                                                          &blockBuffer);
    if(status == kCMBlockBufferNoErr) {
        CMSampleBufferRef sampleBuffer = NULL;
        const size_t sampleSizeArray[] = {frameSize};
        status = CMSampleBufferCreateReady(kCFAllocatorDefault,
                                           blockBuffer,
                                           mDecoderFormatDescription ,
                                           1, 0, NULL, 1, sampleSizeArray,
                                           &sampleBuffer);
        if (status == kCMBlockBufferNoErr && sampleBuffer) {
            VTDecodeFrameFlags flags = 0;
            VTDecodeInfoFlags flagOut = 0;
            OSStatus decodeStatus = VTDecompressionSessionDecodeFrame(mDeocderSession,
                                                                      sampleBuffer,
                                                                      flags,
                                                                      &outputPixelBuffer,
                                                                      &flagOut);

            if(decodeStatus == kVTInvalidSessionErr) {
                NSLog(@"IOS8VT: Invalid session, reset decoder session");
            } else if(decodeStatus == kVTVideoDecoderBadDataErr) {
                NSLog(@"IOS8VT: decode failed status=%d(Bad data)", (int)decodeStatus);
            } else if(decodeStatus != noErr) {
                NSLog(@"IOS8VT: decode failed status=%d", (int)decodeStatus);
            }
            CFRelease(sampleBuffer);
        }
        CFRelease(blockBuffer);
    }
    
    return outputPixelBuffer;
}

// 回调函数
static void didDecompress(void *decompressionOutputRefCon, void *sourceFrameRefCon, OSStatus status, VTDecodeInfoFlags infoFlags, CVImageBufferRef pixelBuffer, CMTime presentationTimeStamp, CMTime presentationDuration )
{
    if (pixelBuffer == NULL) {
        NSLog(@"数据解析为空:%d", status);
        return;
    }
    CMSampleTimingInfo sampleTime = {
        .presentationTimeStamp  = presentationTimeStamp,
        .decodeTimeStamp        = presentationTimeStamp
    };
    YJVideoDecode *decoder = (__bridge YJVideoDecode *)decompressionOutputRefCon;
    CMSampleBufferRef samplebuffer = [decoder createSampleBufferFromPixelbuffer:pixelBuffer videoRotate:180 timingInfo:sampleTime];
    if (samplebuffer) {
        if ([decoder.videoDelegate respondsToSelector:@selector(transportPixelBuffer:)] && decoder.videoDelegate) {
        
            [decoder.videoDelegate transportPixelBuffer:samplebuffer];
        }
        CFRelease(samplebuffer);
    }
}