SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI是商汤科技发布的开源空间智能大模型,专注于提升AI在空间理解与推理方面的能力。模型在空间测量、重构、关系判断、视角转换、形变分析和空间推理等六个核心维度上表现出色,显著优于其他开源和闭源模型。例如,在复杂道路场景中,SenseNova-SI能精准判断车辆的后续动作,而其他模型则难以做到。SenseNova-SI采用系统化的训练方法,通过大规模高质量数据训练,验证了“尺度效应”,显著提升空间认知能力。基于多模态基础模型构建,通过持续训练,使模型在复杂场景中具备更强的空间理解能力。SenseNova-SI - 商汤科技开源的空间智能大模型系列

>>展开阅读

Frappe Builder - 开源的AI低代码网站构建工具,拖拽组件快速搭建

Frappe Builder是开源的低代码建站工具,由Frappe公司开发,核心特点是提供类似Figma的可视化编辑器,支持拖拽组件快速搭建网站。属于Frappe生态(Frappeverse)的一部分,相比传统AI建站工具,Frappe Builder的优势在于操作直观可控,用户可以直接通过界面调整样式和布局,无需编程基础。开源特性允许自由扩展,适合个人展示或小型企业快速部署网站。Frappe Builder - 开源的AI低代码网站构建工具,拖拽组件快速搭建

>>展开阅读

Omnilingual ASR - Meta推出的多语言语音识别框架

Omnilingual ASR是Meta推出的多语言语音识别框架,覆盖1600+语言,78%语言字符错误率低于10%。其70亿参数wav2vec 2.0编码器结合CTC与Transformer解码器,支持零样本转录未见语言,仅需少量示例即可适配新语种。模型开源,含350种低资源语言语料库,推动全球濒危语言数字化与语音技术普惠。Omnilingual ASR - Meta推出的多语言语音识别框架

>>展开阅读

最新公共聊天室系统源码 ChatNet V1.11-V1.9 完整汉化版源码

最近看一个聊天室源码界面很好看,聊天也很流畅,支持发送图片语音文件等,还可以以游客身份登录参与,很强大的一款应用。于是我就想自己也搭建一个玩玩。 去网上找了一圈,基本确定是ChatNet程序。不过网上找到的这个程序,几乎都是英文版本的,没有完整汉化,要么版本就比较老。我今天要分享的这个是V1.11经典版到V1.9 的chatnet程序包,而且已经完全汉化了。应该是花钱买的翻译版本,总共接近1000多个英文字段,反复校对,根据场景做了详细调整,追求精准无误。1.jpg

>>展开阅读

DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR 是开源复刻项目,实现 DeepSeek-OCR 的核心架构,通过光学压缩技术高效处理文本信息。核心是 DeepEncoder,由 SAM-base(处理高分辨率图像)、16×卷积压缩器(减少 token 数量)和 CLIP-large(处理压缩后的特征)组成。这种设计在保持高分辨率处理能力的同时,显著降低了激活内存和 token 数量。DeepOCR 采用两阶段训练流程:第一阶段使用 LLaVA-CC3M 数据集进行视觉 - 语言对齐训练;第二阶段使用 olmOCR 数据集进行 OCR 特定预训练。通过这种训练方法,DeepOCR 在 OmniDocBench 和 olmOCR 基准测试中表现出色,尤其在英文文本识别和表格解析任务中,验证了光学压缩的有效性。DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

>>展开阅读