阿里云视频识别
Untitled group
视频2识别效果
gemini视频识别
费用
视频1识别效果

方案一,使用阿里云进行真人露脸和产品同框检测。

决策点:

  • 是否全部的晒单返利、体验测评、定制合作,用户回传的图片、视频,都进行识别。
  • 图片和视频,分别选择阿里云传统api接口,还是gemini或[[GPT-4V|GPT-4V]]进行识别。
  • 是否维持原有的订单状态流程流程,只在『违规预警』中,进行通知处理。

方案二,使用gemini和gpt4-v进行真人露脸和产品同框检测。

gemini 价格 https://ai.google.dev/pricing

![[Pasted image 20240422181008.png]]

  1. 视频基本信息:

    • 分辨率: 1280x720
    • 时长: 约34秒
    • 帧率: 约30帧/秒
  2. 人物信息:

    • 卡通人物: 在视频的大约8.57%的时间内出现,具体时间范围是从视频开始的约2.6秒到约5.1秒。
    • 真人(普通): 在视频的20%的时间内出现,具体时间范围是从约9.4秒到约13.7秒,以及从约25.6秒到约27.4秒。
  3. 场景信息:

    • 真人实景: 占据视频的约97.14%的时间,时间范围从视频开始到约8.5秒,以及从约9.4秒到视频结束。

这份数据显示了一个视频处理任务的结果,包括场景和时间信息。以下是详细解析:

  1. 视频基本信息:

    • 分辨率: 360x640
    • 时长: 约42秒
    • 帧率: 25帧/秒
  2. 场景信息:

    • 游戏屏幕截图(gamescreen-screenshot): 占据视频大约78.57%的时间。具体的时间范围是:
      • 从视频开始到约4秒
      • 从约5秒到约12秒
      • 从约13秒到约24秒
      • 从约26秒到约28秒
      • 从约30秒到约37秒
      • 从约40秒到视频结束(约42秒)
    • 真人实景(liveaction): 占据视频约16.67%的时间,时间范围是:
      • 从约24秒到约26秒
      • 从约28秒到约30秒
      • 从约37秒到约40秒

这些信息说明视频内容主要是游戏屏幕的截图,同时穿插了一些真人实景的短片段。这种数据通常用于内容分析,可能是为了标识和区分视频中的不同内容类型,如游戏画面与实际拍摄的场景。如果有更具体的问题或需要进一步的帮助,请告知!

图片识别

用gemini,一张图500token左右。约0.005美元

视频识别:

费用 视频理解费用_视觉智能开放平台(VIAPI)-阿里云帮助中心 0.2元/分钟,最小计费单位是秒。

prompts: 根据这些图片,判断是否有:真人露脸,产品同框。直接返回json,包括3个key: 是否真人露脸,是否产品同框,详细信息

视频识别

用gemini,一个50秒视频10000token左右。约0.1美元。
响应速度,10秒内

根据视频,判断是否有:真人露脸,产品同框。直接返回json,包括3个key: 是否真人露脸,是否产品同框,详细信息

这份数据提供了关于另一个视频处理任务的详细结果,标注了人物出现的时间和场景类型。这是对数据的详细解析:

  1. 视频基本信息:

    • 分辨率: 360x640
    • 时长: 约43秒
    • 帧率: 25帧/秒
  2. 人物信息:

    • 真人名人(武泽锦熙): 出现在视频大约4.55%的时间,具体时间范围是从约27秒到约29秒。
    • 真人(普通): 在视频的47.73%的时间内出现,具体时间范围是:
      • 从约5秒到约7秒
      • 从约8秒到约11秒
      • 从约14秒到约27秒
      • 从约40秒到约42秒
  3. 场景信息:

    • 游戏屏幕截图(gamescreen-screenshot): 占据视频大约50%的时间,时间范围是:
      • 从视频开始到约6秒
      • 从约11秒到约16秒
      • 从约29秒到约38秒
      • 从约41秒到视频结束(约43秒)
    • 真人实景(liveaction): 占据视频约40.91%的时间,时间范围是:
      • 从约6秒到约9秒
      • 从约16秒到约27秒
      • 从约38秒到约41秒

这些信息表明视频内容主要包含游戏屏幕截图和真人实景的交替出现,以及特定时间段内有名人(武泽锦熙)的出现。这种数据通常用于内容分析,特别是在需要区分视频中的不同人物和场景类型时。如果您有进一步的问题或需要更多帮助,请随时联系。

视频分析:真人露脸 & 产品同框

根据您提供的视频描述,可以判断:

  • 真人露脸: 视频中出现了宝宝的臉部,展现了宝宝户外活动后皮肤泛红的状态,以及使用产品后的改善效果。 因此可以确定视频中有真人露脸。

  • 产品同框: 视频中展示了安唯伊果冻舒缓CP(喷雾和霜),并且展示了使用产品的过程。所以视频中也有产品同框。

根据提供的视频描述,可以判断:

  • 没有真人露脸: 视频中出现的人物形象都是以贴图的形式展现,并非真人出镜。

  • 有产品同框: 视频中出现了宠物关节保健品,并展示了产品包装和部分成分说明。

因此,视频符合“产品同框”的特征,但不符合“真人露脸”的特征。

识别失败,识别成音乐了。
{
  "是否真人露脸": true,
  "是否产品同框": true,
  "详细信息": "图片中包含一位小女孩正在饮用韩真珠品牌的牛奶饮品,画面清晰可见女孩面部和产品包装。"
}
价格