DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

作者:Jam 发布时间: August 20, 2025 分类:技术 No Comments

DeepSeek V3.1 是DeepSeek推出的最新开源 AI 模型，基于混合专家（MoE）架构，上下文窗口扩展至 128k，能处理更长的文本。模型在自然语言处理上表现出色，生成的创意文本生动有趣，回答问题时信息量大且语气自然。模型的编程能力显著提升，支持生成复杂度更高的代码，帮助开发者快速搭建框架。在数学和逻辑方面，模型能准确解答基础算术题，物理模拟效果更符合实际定律。DeepSeek V3.1的Base 版本已开源至 Hugging Face，能广泛应用在内容创作、编程辅助、教育和科学研究等领域。

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

作者:Jam 发布时间: August 19, 2025 分类:技术 No Comments

Genie Envisioner（GE）是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象，后行动”的方式，让机器人更好地理解和执行任务。GE的核心包括三个部分：GE-Base、GE-Act和GE-Sim。GE-Base是一个指令驱动的视频扩散模型，能捕捉机器人在真实世界中的交互动态。GE-Act基于GE-Base，将潜在的表示转化为可执行的动作轨迹，支持不同形态的机器人。GE-Sim是一个动作条件的神经模拟器，能生成高保真的模拟视频，用于训练和评估。

Mureka：昆仑万维推出的AI生成原创音乐工具

作者:Jam 发布时间: August 19, 2025 分类:技术 No Comments

Mureka V7.5 是昆仑万维推出的先进 AI 音乐生成模型，专注于中文歌曲创作。模型能精准还原音色与演奏技法，生成自然流畅且富有情感的歌声。基于优化的自动语音识别（ASR）技术，Mureka V7.5 支持分析真实演唱中的细节，精准识别唱词并捕捉情感起伏，生成更自然的人声。Mureka V7.5 能深度理解中文音乐的文化背景和艺术神韵，支持从传统民歌到流行金曲等多种风格。Mureka V7.5 能为音乐人提供高效创作工具，为影视、游戏、虚拟角色等提供定制化音乐，拓展音乐创作的边界。

Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

作者:Jam 发布时间: August 19, 2025 分类:技术 No Comments

Hunyuan-GameCraft 是腾讯 Hunyuan 团队开源的交互式游戏视频生成框架。框架能从单张图片和提示生成高动态的游戏视频，支持用户通过键盘和鼠标实时控制视频内容。框架将输入统一到共享的相机表示空间，实现精细的动作控制，同时用混合历史条件训练策略，确保视频的长期连贯性。借助模型蒸馏技术，显著提高推理速度，适合实时部署。Hunyuan-GameCraft在超过100款AAA游戏的海量数据上训练，生成的视频具有高视觉保真度和真实感，广泛应用在游戏视频生成、游戏测试、内容扩展及互动视频创作等领域。

XiaoYao 快速跳转，让你一键直达目标路径，效率飙升

作者:Jam 发布时间: August 19, 2025 分类:技术 No Comments

效率党必备的神器来咯，通常软件「打开/保存」对话框，你都需要层层点击文件夹，去打开或者保存相关的文件，这样非常繁琐，那么能不能一键直达常用的文件夹？并且支持分组分类？今天要分享的这款「XiaoYao 快速跳转」免费开源工具可以让你秒速直达常用文件夹！简单来说：当你在任何软件（如Word、PS、代码编辑器）中打开“打开/保存”对话框时，它能帮你一键跳转到当前正在使用的文件管理器路径，或快速调用常用文件夹、收藏夹，彻底省去层层点击的时间！ 20250818

一文搞懂VR/AR/MR/XR的区别及关系

作者:Jam 发布时间: August 19, 2025 分类:技术 No Comments

VR（Virtual Reality）、AR（Augmented Reality）、MR（Mixed Reality）和XR（Extended Reality）是四种不同的现实技术，它们在应用场景、技术原理和实现方式上都有所区别。一文搞懂VR/AR/MR/XR的区别及关系

DINOv3 - Meta AI推出的新一代自监督视觉基础模型

作者:Jam 发布时间: August 18, 2025 分类:技术 No Comments

DINOv3 是 Meta AI 推出的新一代自监督视觉基础模型，采用自监督学习范式，无需标注数据即可学习图像特征。通过改进数据准备和引入 Gram anchoring 解决了特征退化问题，提升了泛化能力。DINOv3 提供 ViT 和 ConvNeXt 两种骨干网络架构，其中 ViT-7B 是目前规模最大的版本，包含 67 亿参数。模型能生成高质量的密集特征表示，精准捕捉图像的局部关系和空间信息。在图像分类、目标检测、语义分割等多种视觉任务中表现出色，无需任务特定微调即可超越许多专业模型。DINOv3 支持高分辨率特征提取，适用于医学影像分析、环境监测等需要高精度特征的场景。

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

作者:Jam 发布时间: August 18, 2025 分类:技术 No Comments

Genie Envisioner（GE）是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象，后行动”的方式，让机器人更好地理解和执行任务。GE的核心包括三个部分：GE-Base、GE-Act和GE-Sim。GE-Base是一个指令驱动的视频扩散模型，能捕捉机器人在真实世界中的交互动态。GE-Act基于GE-Base，将潜在的表示转化为可执行的动作轨迹，支持不同形态的机器人。GE-Sim是一个动作条件的神经模拟器，能生成高保真的模拟视频，用于训练和评估。

«
1
...
21
22
23
24
25
26
27
...
116
»