探索 Easy Dataset:高效构建大模型训练数据的全流程指南
在大模型时代,高质量训练数据的重要性不言而喻。本文全面介绍了 Easy Dataset 这一强大工具,它能帮助开发者和数据科学家从各种文档中快速构建结构化的问答数据集,大幅简化大模型训练数据的准备过程。
在大模型时代,高质量训练数据的重要性不言而喻。本文全面介绍了 Easy Dataset 这一强大工具,它能帮助开发者和数据科学家从各种文档中快速构建结构化的问答数据集,大幅简化大模型训练数据的准备过程。
上一篇中介绍了 Agent、Function Calling、MCP 等概念,这篇则分享如何实现自己的 MCP Server,并将其添加到 Cline 进行验证。
之前通过一系列文章分析了 HAMI vGPU 部署使用以及背后的实现原理,本文则是分析海光 DCU 设备如何通过 HAMi 完成虚拟化,实现统一纳管与调度。
本文将从基础概念出发,逐步解析Agent(智能体)、Function Calling(函数调用)、MCP(模型上下文协议)及A2A(智能体协作协议),帮助读者理解 LLM 应用知识体系。
上一篇分享了 LabelStudio 的智能标注(预标注),通过对接 ML 后端实现自动标注,解放双手。本文主要记录如何使用 LabelStudio 标注数据、导出数据集并用于训练模型,通过本教程,您将学习如何将 LabelStudio 标注的数据转换为 YOLO 格式,并用作模型训练。
上一篇分享了 LabelStudio 的部署以及手动标注流程,本文分享另一个功能:智能标注(预标注),通过对接 ML 后端实现自动标注,解放双手。