爱可可微博热门分享(2.3)
No 1. Open-R1:开源社区携手复现DeepSeek R1的训练管线和数据集。亮点:1. 成功复现DeepSeek在MATH-500基准上的评估结果,平均准确率超90%;2. 高效的合成数据生成,每秒可处理32个请求;3. 社区贡献丰富,涵盖多种模型和数据集 No 2. 《零基础入门:如何用 RAG (检索增强生成) 打造知识库 QA 系统》 No 3. MIT 6.0002课程:计算思维与数据科学导论。为初学者提供零基础的计算思维与数据科学入门课程。帮你快速掌握利用Python解决实际问题的能力。亮点:1. 由MIT顶尖教授授课,零基础也能轻松入门;2. 课程涵盖优化问题、随机模拟、机器学习等前沿内容;3. 提供5套编程作业,实战中提升技能 No 4. [276星]DeepSeekAI:一款智能浏览器扩展,让网页浏览更高效、更智能!亮点:1. 选中网页文本即可触发AI分析,秒出结果;2. 支持多轮对话,交互更流畅;3. 实时流式响应,答案即刻呈现 No 5. 北京邮电大学的AI入门课《AI在大前》
No 6. 梁文锋深度访谈,探讨中国公司在科技创新方面的机遇和挑战,这个采访太牛逼了,头脑清晰,冷静自信,值得一看。不少网友表示:这一代终于有领军人物了,相信 ...... No 7. A Little Bit of Reinforcement Learning from Human Feedback:一本深入浅出介绍人工反馈强化学习(RLHF)的免费书。亮点:1. 从多学科角度出发,涵盖经济学、哲学和最优控制理论;2. 详细解读热门算法,助你快速掌握前沿技术;3. 提供完整的PDF下载,学习资源触手可及 No 8. RL_Reasoning_Writing_GRPO_on_base:基于强化学习的诗歌创作模型训练项目。亮点:1. 使用350M参数的多语言基础模型Pleias-350m,无需指令微调即可生成诗歌;2. 通过GRPO方法优化生成效果,避免重复和提升诗歌结构;3. 支持多种语言的诗歌创作,展现强大的跨语言能力 No 9. [390星]AI-Bootcamp:一个自定进度的... No 10. [199星]Rowfill:开源文档处理平台,为知识工作者量身打造。亮点:1. 高精度OCR,从复杂文档中提取文本、表格和手写内容;2. 自动化工作流,轻松创建定制化任务处理流程;3. 支持本地LLM,保护隐私的同时享受AI的强大能力 No 11. [24星]SpatialVLA:一个强大的空间增强型视觉-语言-行动模型,专为机器人任务设计。亮点:1. 基于110万真实机器人场景训练,性能卓越;2. 仅需8.5GB GPU内存即可运行,部署简单;3. 在多种机器人任务中表现优异,零样本学习能力突出 No 12. Deep Research:OpenAI推出的深度... No 13. 早![太阳] No 14. [LG]《Towards General-Purpose Model-Free Reinforcement Learning》 No 15. Karpathy的“Vibe编程”模式——放飞自我,完全跟着感觉走,甚至忘记代码的存在。想到什么,说点什么,运行一下,复制粘贴,神奇的是居然大多时候都能用。当LLM解决不了bug,就随机改改或绕过去,反正是周末项目,能跑就行。这种体验既有趣又离谱:确实是在做webapp,但这真的算编程吗?更像是在跟AI玩 ...... No 16. [406星]node-DeepResearch:一个深度研究型的AI搜索工具,能持续搜索和阅读网页,直到找到答案(或超出token预算)。亮点:1. 支持多步推理,最多可达13步;2. 集成Gemini、Brave/Duckduckgo等强大工具;3. 提供Web Server API,方便集成 No 17. [LG] Challenges in Ensuring AI Safety in DeepSeek-R1 Models: ...... No 18. [110星]CUDA_Kernel_Samples:用代码写成的CUDA算子面试秘籍!亮点:1. 涵盖高频面试算子,如reduce、softmax等,手撕代码一步到位;2. 从naive到优化版本,代码全,性能分析透;3. 附赠GPU知识点,面试备战超高效 No 19. [15星]Encoder-Decoder-SLM:... No 20. [74星]RapidUDF:高性能C++表达式/脚本执行引擎,为在线系统提供极速计算支持。亮点:1. 基于LLVM JIT编译,启动和执行性能与原生C++相当;2. 支持SIMD向量化加速,性能提升显著;3. 提供丰富的内置数据类型、操作符和函数,满足复杂计算需求 No 21. 通俗版解读 No 22. [480星]R1-V:用不到3美元的成本,让视觉语言模型(VLM)在少样本情况下实现超强泛化能力!亮点:1. 仅用2.62美元的训练成本,8个A100 GPU,30分钟完成训练;2. 2B模型在100步训练后,OOD测试性能超越72B模型;3. 全部代码、模型、数据集开源,助力研究和开发 No 23. DeepSeek现象折射的中国科技创新转型思考:1、创新需要文化土壤和生态环境;2、年轻一代将成为创新主力;3、中国正在从技术追随者向贡献者转变;4、坚持原创创新需要战略定力和文化自信//梁文锋深度访谈,探讨中国公司在科技创新方面的机遇和挑战,这个采访太牛逼了,头脑清晰,冷静自信,值得一看。不少网友表示:这一代终于有领军人物了,相信 ...... No 24. [34k星]ToolJet:低代码开发的“瑞士军刀”,让企业应用搭建像搭积木一样简单。亮点:1. 45+内置组件,快速搭建复杂界面;2. 50+数据源集成,轻松对接各类数据库和API;3. 支持多平台部署,从Docker到Kubernetes,满足各种需求 No 25. 如何打造一台本地运行Deepseek-R1完整版的服务器?(预算6000美元的全套方案) No 26. [LG]《LLM-AutoDiff: Auto-Differentiate Any LLM Workflow》 No 27. 用不到2000美元在本地运行671B参数的全量Deepseek-R1模型 No 28. [153星]Chaplin:一款实时无声语音识别工具,将唇语变成文字!亮点:1. 实时识别,即刻输出文字;2. 完全本地运行,隐私无忧;3. 支持多种语言模型,识别准确率高达90%以上 No 29. [70星]Extract-chat:通过聊天提取任意网站信息的AI工具。亮点:1. 集成Firecrawl,实时提取结构化数据;2. 支持多种LLM提供商,灵活切换;3. 使用Next.js和Vercel技术栈,性能卓越 No 30. [LG]《Sparse Autoencoders Can Interpret Randomly Initialized Transformers》 No 31. [302星]Distr:企业级软件分发平台,轻松将软件部署到客户可控或共享责任环境中。亮点:1. 提供直观的Web UI,轻松管理所有部署和连接的代理;2. 支持白标客户门户,让客户自主控制部署;3. 提供丰富的SDK,方便开发者集成 No 32. 2025年AI创业指南 No 33. [LG] Open Problems in Mechanistic Interpretability 本文全面审视了机制可解释性领域中亟待解决的开放性问题,强调了在方法、应用及社会技术层面存在的挑战,并指明了未来研究的关键方向,旨在推动该领域突破瓶颈,最终实现对复杂人工智能系统更深层次的理解和更有效的 ...... No 34. [661星]Meridian:谷歌推出的营销组合模型(MMM)框架,帮助广告商搭建和运行自己的内部模型。亮点:1. 基于贝叶斯因果推断,高度可定制化;2. 支持大规模地理级数据处理,提升模型精度;3. 提供优化目标广告频率的方法,助力精准营销 No 35. DeepSeek R1最大的创新不在单个技术点,而是将多项创新有机结合:用GRPO实现高效RL训练、MLA降低计算复杂度、MoE实现大规模参数扩展,这些技术的协同作用使其达到了与闭源模型相当的水平//发布了头条文章:《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 36. [45星]Diffusion-Planner:基于扩散模型的自动驾驶规划方案,让自动驾驶更智能、更灵活!亮点:1. 创新性地将扩散模型应用于运动规划,无需过度依赖后处理优化;2. 实现20Hz的实时规划性能,响应速度更快;3. 在nuPlan数据集上表现卓越,多项指标领先 No 37. [1.7k星]Eko:用自然语言构建生产级智能工作流的框架。亮点:1. 支持从简单命令到复杂多步工作流的生成;2. 兼容浏览器和计算机环境,适用范围广;3. 高开发效率,快速实现复杂任务自动化 No 38. [CL]《Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs》 No 39. 本地运行DeepSeek R1的全面入门指南 No 40. NVIDIA将全量版DeepSeek-R1打包成NIM微服务,在配备8张H200 GPU的服务器上,每秒可处理近4000个Token!可以在自己的基础设施上部署,确保数据安全 No 41. 通俗版解读 查看图片//[LG] Challenges in Ensuring AI Safety in DeepSeek-R1 ...... No 42. 你用Ollama跑起来的不是真正的DeepSeek R1 No 43. [684星]DeepRant:游戏玩家的多语言交流神器!一键翻译,让语言不再成为跨服竞技的障碍。亮点:1. 快捷键翻译,无需切出游戏;2. 多种翻译模式,包括“嘴臭模式”和“专业玩家模式”;3. 支持全球主流语言,覆盖超多游戏场景 No 44. [58星]ComfyUI_LoRA_Sidebar:为ComfyUI打造的快速、可视化且高度可定制的LoRA侧边栏,让LoRA管理变得轻松又高效。亮点:1. 自动生成LoRA视觉库,支持9000+模型;2. 智能搜索功能,涵盖类型、标签、名称等多维度;3. 预览拖拽功能,一键创建或更新LoRA节点 No 45. [1.5k星]Calibre-Web-Automated:让电子书管理变得轻松又智能!核心价值在于将Calibre的强大功能与Calibre-Web的现代化界面完美结合,实现电子书的自动化管理和高效转换。亮点:1. 自动化处理27种电子书格式,一键转换;2. 自动备份处理文件,安全无忧;3. 一键切换深色/浅色模式,阅读体验更佳 No 46. [6星]Track-On:基于Transformer的在线点跟踪模型,专为实时视频点跟踪设计。亮点:1. 实时性高,支持逐帧处理,适用于直播视频;2. 内存高效,通过紧凑的记忆模块优化性能 No 47. 发布了头条文章:《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 48. 今日推介(第1670期):稀疏自编码器可解释随机初始化Transformer、关于o1类大语言模型欠思考的研究、通过操纵投票提高模型在Chatbot ...... No 49. [LG]《Improving Your Model Ranking on Chatbot Arena by Vote Rigging》 No 50. [832星]Swift Build:基于llbuild的高级构建系统,为Swift开发者提供高效、灵活的构建解决方案。亮点:1. 被Xcode、Swift Playground和Swift Package Manager广泛采用;2. 支持跨平台构建,包括Windows;3. 提供丰富的文档和测试支持