前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >无损剪切音视频文件的跨平台工具:LosslessCut | 开源日报 0908

无损剪切音视频文件的跨平台工具:LosslessCut | 开源日报 0908

作者头像
小柒
发布2023-09-14 19:57:23
4260
发布2023-09-14 19:57:23
举报
文章被收录于专栏:开源服务指南开源服务指南

mifi/lossless-cut[1]

Stars: 17.3k License: GPL-2.0

LosslessCut 是一款跨平台的 FFmpeg GUI 工具,它可以对视频、音频和字幕等相关媒体文件进行快速无损操作。该软件最主要的功能是无损剪切和裁剪音视频文件,可以使用它快速提取出好的部分并丢弃其余片段而不会损失质量,这非常适合用于处理从摄像机、GoPro 或者无人机中获取到的大型视频文件以节省存储空间。此外它还能在不需要重新编码的情况下添加音乐或字幕轨道到视频中,所以速度非常快。

特点:

  • 支持多数格式的无损剪切
  • 实验性质功能:自动检测静默段(例如电视广告)
  • 重排任意顺序下的音视频段落
  • 流编辑处理
  • 将多个源组合到一个输出里 (比如给一个视频加上背景音乐)
  • 提取、编辑和移除各种类型轨道 (包括但不限于视频/音频/字幕/附件)
  • 快速批次流程 (注意:尚未有批量输出)
  • 无损重编码视频/音频到不同格式的文件中
  • 可以从视频中提取全分辨率快照,保存为 JPEG/PNG 格式(低或高质量)
  • 将一段时间范围内的帧导出为图像 (每n个帧、秒数、场景变化等)

bigcode-project/starcoder[2]

Stars: 5.8k License: Apache-2.0

StarCoder 是一个基于源代码和自然语言文本训练的语言模型 (LM)。它的训练数据包括 80 多种不同编程语言以及从 GitHub 问题、提交记录和笔记中提取出来的文本。这个项目展示了该 LM 的能力概览。

以下是 StarCoder 项目的关键特性和核心优势:

  • 可用于完成函数实现或推断一行代码中后续字符
  • 基于 ?'s transformers 库,可以进行代码生成
  • 支持快速启动,并列举了安装步骤、使用方法等详细说明
  • 提供精调功能,可在具体下游任务上应用
  • 通过 PEFT 和 bitsandbytes 简化并高效地进行精调操作
  • 支持 Stack Exchange 数据集 fine-tuning,在指令方面表现良好
  • 评估工具 BigCode-Evaluation-Harness 对其衍生产品也有很好支持

请注意:在使用之前需要接受协议,并确保已登录 Hugging Face hub。此外,请参考 Readme 中给出的硬件要求信息。

bentoml/OpenLLM[3]

Stars: 5.1k License: Apache-2.0

OpenLLM 是一个用于在生产环境中操作大型语言模型 (LLMs) 的开放平台。

主要功能:

  • 支持各种最先进的开源 LLMs,包括 StableLM、Falcon、Dolly 等。
  • 提供灵活的 API,可以通过 RESTful API 或 gRPC 进行服务,并支持 WebUI、CLI 和 Python/Javascript 客户端查询。
  • 可以自由构建 AI 应用程序,与 LangChain、BentoML 和 Hugging Face 无缝集成。
  • 简化部署流程,可自动生成 LLM 服务器 Docker 镜像或作为 Serverless 端点部署。

baichuan-inc/Baichuan-7B[4]

Stars: 4.7k License: Apache-2.0

Baichuan-7B 是一个由百川智能开发的大规模预训练语言模型。该项目基于 Transformer 结构,使用了 70 亿参数,在约 1.2 万亿个 tokens 上进行了训练。这个开源项目支持中英双语,并且具有 4096 长度的上下文窗口。

以下是 Baichuan-7B 的关键特性和核心优势:

  • 在标准的中文和英文 benchmark (C-Eval/MMLU) 上取得同尺寸更好效果
  • 支持多领域学科评测数据集 C-Eval 和 Gaokao
  • 具备认知与问题解决相关任务能力评估 AGIEval 数据集

mosaicml/llm-foundry[5]

Stars: 2.9k License: Apache-2.0

LLM Foundry 是一个用于训练 MosaicML 基础模型的代码库。它旨在提供易于使用、高效和灵活的功能,以便快速尝试最新技术。

以下是该项目的核心优势和关键特性:

  • 提供了各种模型、数据集、回调函数和实用工具等源代码。
  • 包含运行 LLM 工作负载所需的脚本。
  • 可将原始文本数据转换为 StreamingDataset 格式,并存储在 data_prep/ 目录下。
  • 支持从 125M 到 70B 参数范围内对 HuggingFace 和 MPT 模型进行训练或微调。
  • 可通过 benchmarking 文件夹中提供的工具评估培训吞吐量、MFU (Most Frequently Used) 等指标。
  • 能够将模型转换为 HuggingFace 或 ONNX 格式,并生成响应结果,位于 inference/ 目录下。

liou666/polyglot[6]

Stars: 1.4k License: MIT

Polyglot 是一款多平台的桌面端应用程序,旨在提供一个易于使用的语言练习平台,方便进行多语种的口语练习。它基于 ChatGPT 和 Azure 人工智能语言模型作为底层服务,并使用 Vue3+TS 技术栈构建。该项目具有以下特点:

  • 多国语言口语练习:内置了英文AI角色,其他非英文支持自定义。
  • 智能对话功能:基于 ChatGPT 服务实现。
  • 支持暗黑模式、文字翻译等功能。
  • 用户可自定义配置 Azure key、头像以及对话场景。

如果您想要提高外语水平或者掌握一门新的外语,那么这个开源项目将是一个不错的选择。

本文参与?腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-09-09 23:38,如有侵权请联系?cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • bigcode-project/starcoder[2]
  • bentoml/OpenLLM[3]
  • baichuan-inc/Baichuan-7B[4]
  • mosaicml/llm-foundry[5]
  • liou666/polyglot[6]
相关产品与服务
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com