Hadithi 是一款创新的开源工具,专为 AI 和 ML 开发人员设计,用于创建高质量视频数据集以优化大型语言模型 (LLM)。这个基于 bash 的命令行工具简化了视频内容的生成过程,使开发人员更容易有效地微调他们的模型。
借助 Hadithi,开发者可以将来自各种来源(包括 YouTube、Torrent 和企业平台)的视频转换为适合训练法学硕士的数据集。通过将视频组织到文件夹中、对其进行分段、检测场景以及执行其他预处理任务,Hadithi 简化了模型训练的数据准备过程。
该工具提供了一系列功能,例如使用时间戳重命名视频、删除音频、过滤短视频、调整视频大小和提取帧。通过提供这些功能,Hadithi 充当生成视频模型的数据工厂,使开发人员能够轻松创建和完善大型语言模型。
要了解有关 Hadithi 及其功能的更多信息,您可以访问其 GitHub 存储库:Hadithi GitHub。
如果您无法正常访问官网,可能是您的网络设置!