DeepSeek 3.1 和 DeepSeek R1 的区别
DeepSeek 3.1 和 DeepSeek R1 的区别主要体现在以下几个方面: 总结来说,DeepSeek 3.1 是更加强大和全面的版本,强调深度理解和多模态能力,而 DeepSeek R1 则更注重速度和逻辑推理,适合快速且结构化的任务。
AI开源项目
2025 年 8 月 18 日
5.5K
DeepSeek开源现状及与其他开源大模型的对比(含Qwen、Llama等)
DeepSeek开源现状及与其他开源大模型的对比(含Qwen、Llama等) 1. DeepSeek的开源定位与核心优势 2. 与其他主流开源模型对比 模型 许可证 参数量 优势领域 主要局限 DeepSeek-V3 R1 MIT(完全开源) 671B MoE 低成本、数学/代码/中文 训练数据清洗细节未公开5 Qwen 2.5 部分开源(商用授权) 未公开…
AI开源项目
2025 年 3 月 26 日
1.2K
通义千问(Qwen)技术全景与开源生态
通义千问(Qwen)技术全景与开源生态 版本演进与核心功能 Qwen1.5系列(2024年2月) Qwen2系列(2024年6月) Qwen2.5系列(2024年9月) 专项模型 参数规模 性能指标 Qwen2.5-Coder 1.5B/7B/32B HumanEval 85+ Qwen2.5-Math 1.5B/7B/72B MATH基准80+ Qwen2…
AI开源项目
2025 年 3 月 26 日
1.2K
2025年顶级开源多模态大语言模型
2025年顶级开源多模态大语言模型 前沿技术矩阵 1. Llama 3.2 Vision系列 2. Qwen-VL 2.5 72B Instruct 3. InternVL-Chat-V1.5 4. 新兴竞争者 部署方案对比 模型名称 推荐硬件配置 量化支持 典型推理延迟 Llama3.2-11B-V RTX 4090(24GB) GGUF/GPQT/AWQ…
AI开源项目
2025 年 3 月 26 日
1.0K
开源多模态大模型精选指南
开源多模态大模型精选指南 前沿技术动态 开发者工具链 性能对比参考 模型名称 参数量 核心优势 典型应用场景 Qwen-VL-Chat 7B 中文优化 跨语言图文分析 LLaVa-OneVision 7B 轻量化部署 移动端视觉问答 NVLM-1.0-D 72B 文本任务无损增强 科研文献解析 实践建议 当前开源多模态模型已形成完整技术矩阵,在图文问答、视频…
AI开源项目
2025 年 3 月 26 日
652