爱可可微博热门分享(2.2)
No 1. 用不到2000美元在本地运行671B参数的全量Deepseek-R1模型 No 2. A Little Bit of Reinforcement Learning from Human Feedback:一本深入浅出介绍人工反馈强化学习(RLHF)的免费书。亮点:1. 从多学科角度出发,涵盖经济学、哲学和最优控制理论;2. 详细解读热门算法,助你快速掌握前沿技术;3. 提供完整的PDF下载,学习资源触手可及 No 3. [34k星]ToolJet:低代码开发的“瑞士军刀”,让企业应用搭建像搭积木一样简单。亮点:1. 45+内置组件,快速搭建复杂界面;2. 50+数据源集成,轻松对接各类数据库和API;3. 支持多平台部署,从Docker到Kubernetes,满足各种需求 No 4. DeepSeek现象折射的中国科技创新转型思考:1、创新需要文化土壤和生态环境;2、年轻一代将成为创新主力;3、中国正在从技术追随者向贡献者转变;4、坚持原创创新需要战略定力和文化自信//梁文锋深度访谈,探讨中国公司在科技创新方面的机遇和挑战,这个采访太牛逼了,头脑清晰,冷静自信,值得一看。不少网友表示:这一代终于有领军人物了,相信 ...... No 5. 如何打造一台本地运行Deepseek-R1完整版的服务器?(预算6000美元的全套方案) No 6. [726星]Swark:用AI自动生成代码架构图,让复杂代码一目了然!亮点:1. 免费开源,无额外成本;2. 支持所有语言,无需单独适配;3. 无缝集成GitHub Copilot,无需额外设置 No 7. DeepSeek R1最大的创新不在单个技术点,而是将多项创新有机结合:用GRPO实现高效RL训练、MLA降低计算复杂度、MoE实现大规模参数扩展,这些技术的协同作用使其达到了与闭源模型相当的水平//发布了头条文章:《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 8. 本地运行DeepSeek R1的全面入门指南 No 9. 梁文锋深度访谈,探讨中国公司在科技创新方面的机遇和挑战,这个采访太牛逼了,头脑清晰,冷静自信,值得一看。不少网友表示:这一代终于有领军人物了,相信 ...... No 10. NVIDIA将全量版DeepSeek-R1打包成NIM微服务,在配备8张H200 GPU的服务器上,每秒可处理近4000个Token!可以在自己的基础设施上部署,确保数据安全 No 11. 试了一下OpenAI刚放出来的o3-mini,见图。是一个大模型经常容易犯错误的例子,o3-mini答对了,但奇怪的是,它的最终答案虽然正确,但给出的推理过程错误百出,且不说它的推理过程没有用中文,内容也是很奇怪,比如我的问题问的是小明,它的推理过程中却说是Xiaohong,题目中说是两个哥哥三个妹妹,推理 ...... No 12. [1.7k星]Eko:用自然语言构建生产级智能工作流的框架。亮点:1. 支持从简单命令到复杂多步工作流的生成;2. 兼容浏览器和计算机环境,适用范围广;3. 高开发效率,快速实现复杂任务自动化 No 13. 真这样就是“数据投毒”了,推理过程一致性对模型可信度很重要,刻意混淆会直接影响模型的实际应用价值。//试了一下OpenAI刚放出来的o3-mini,见图。是一个大模型经常容易犯错误的例子,o3-mini答对了,但奇怪的是,它的最终答案虽然正确,但给出的推理过程错误百出,且不说它的推理过程没有用中文,内容也是很奇怪,比如我的问题问的是小明,它的推理过程中却说是Xiaohong,题目中说是两个哥哥三个妹妹,推理 ...... No 14. 你用Ollama跑起来的不是真正的DeepSeek R1 No 15. [547星]smolGPT:从零开始训练自己的迷你大语言模型,轻松搞定小规模文本生成任务。亮点:1. 纯PyTorch实现,代码简洁无冗余;2. 高效训练,支持混合精度和梯度累积;3. 预训练模型仅需18.5小时,快速上手 No 16. [LG]《Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge》 No 17. 正是外部约束和限制,反而可能催生出更有效率和创新性的解决方案,这或许才是AI真正可持续发展之道。//模型时代 ...... No 18. [161星]LinuxPDF:在PDF里运行Linux!亮点:1. 利用RISC-V模拟器,将Linux系统嵌入PDF文件,颠覆传统认知;2. 基于TinyEMU,支持32位和64位系统;3. 仅用浏览器即可运行Linux,无需额外软件 No 19. [699星]RamaLama:让AI工作变得简单无聊的神器。亮点:1. 一键运行AI模型,无需复杂配置;2. 支持多种硬件,包括CPU、GPU和Apple Silicon;3. 支持多种模型注册表,如Hugging Face和Ollama No 20. 发布了头条文章:《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 21. [6.6k星]PR-Agent (Qodo Merge open-source):AI赋能的代码审查工具,让Pull Request分析、反馈和改进建议自动化!亮点:1. 支持GitHub、GitLab、Bitbucket等多平台;2. 提供代码审查、改进建议、自动更新CHANGELOG等10+功能;3. 适配GPT-4等多模型,效率提升超30% No 22. 我们与AI No 23. 早![太阳] No 24. [20星]Awesome-Token-Merge-for-MLLMs:为多模态大语言模型(MLLM)提供高效的Token合并、减少、重采样和丢弃方法的精选论文列表 No 25. [122星]100天挑战,用CUDA解锁GPU并行计算的无限可能!亮点:1. 每天一个CUDA内核,从基础到高级,逐步深入;2. 覆盖矩阵运算、深度学习、图像处理等实用场景;3. 详细记录学习过程,附带代码和教程,新手也能轻松上手 No 26. 2025年AI创业指南 No 27. [1.1k星]Perforator:一款专为大规模数据中心设计的集群级持续性能分析工具,帮助开发者轻松定位和解决生产环境中的性能瓶颈。亮点:1. 采用eBPF技术,高效收集内核和用户空间栈信息;2. 支持无帧指针和无调试符号的反向调用;3. 提供强大的查询语言和火焰图界面,直观展示CPU使用情况 No 28. 今日推介(第1669期):基于重叠通信的流式DiLoCo分布式训练、拒绝指令偏好:一种新的数据筛选方法、基于Thinking-LLM-as-a-Judge的面向评估的规划和推理学习、经常用ChatGPT写作的人能准确鲁棒地检测AI生成文本、面向语言模型高效知识迁移的时间自适应插值蒸馏 ...... No 29. [CV]《LLMs can see and hear without any training》 No 30. 晚安~ [月亮] No 31. [6.5k星]Youki:用Rust语言编写的高性能容器运行时,为容器化应用提供更安全、更高效的运行环境。亮点:1. 内存占用低,比runc低60%;2. 启动速度快,比runc快2倍;3. 支持Rootless模式,提升安全性 No 32. o3-mini发布简评 No 33. 通俗解读 DeepSeek-R1 训练过程 No 34. [81星]pydantic.run:Python浏览器沙盒,让你在浏览器中轻松写代码、跑代码。亮点:1. 无需安装Python,直接在浏览器运行;2. 支持代码分享,可快速创建在线沙盒链接;3. 自动安装依赖,运行代码更便捷 No 35. [106星]Awesome-Multi-Camera-3D-Occupancy-Prediction:一站式多视角3D空间预测资源库,助力自动驾驶与机器人视觉研究。亮点:1. 汇集100+前沿论文与代码,涵盖CVPR、ICCV等顶会;2. 提供最新研究动态,助力快速掌握行业趋势;3. 开源免费,适合学术与工业界 No 36. [199星]Rowfill:开源文档处理平台,为知识工作者量身打造。亮点:1. 高精度OCR,从复杂文档中提取文本、表格和手写内容;2. 自动化工作流,轻松创建定制化任务处理流程;3. 支持本地LLM,保护隐私的同时享受AI的强大能力 No 37. [LG]《Diverse Preference Optimization》 No 38. 英特尔前CEO帕特·基辛格(Pat Gelsinger)谈DeepSeek带给他的三个启示。我确实没想到基辛格会出来发文,他这篇博文可以说客观深刻。从一个芯片/ ...... No 39. [7星]TextArena:基于文本的游戏环境框架,为语言模型评估和强化学习打造。亮点:1. 提供多种文本游戏环境,支持单人、双人和多人模式;2. 支持本地和在线对战,实时评分和Elo排行榜;3. 采用OpenAI Gym风格接口,易于与多种框架集成 No 40. 开源AI是大势所趋 No 41. 关于DeepSeek的十条谣言 No 42. [7星]colmap_cameras_pytorch:用PyTorch实现COLMAP相机模型,让3D重建和相机标定变得轻松又高效!亮点:1. 支持自动微分,可直接优化相机参数;2. 完整支持COLMAP所有相机模型,适配性强;3. 提供实用工具,如相机模型重映射和根求解器 No 43. DeepSeek如何实现10倍效率提升? No 44. [CL]《People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text》 No 45. [13星]GigaMIDI Dataset:音乐生成领域的超大MIDI数据集,为音乐创作和研究提供强大支持!亮点:1. 拥有143万MIDI文件,530万音轨和18亿音符,数据量超大;2. 新增循环检测和音乐表现力评估指标,助力音乐生成更富有表现力;3. 提供详细元数据和预训练模型,方便研究和应用开发 No 46. 一份值得参考的2025年AI书单1. 《AI Engineering》 No 47. [277星]r1-web:在浏览器中运行DeepSeek-R1 Qwen蒸馏版!亮点:1. 完全在客户端运行,无需服务器支持;2. 使用WebGPU技术,性能卓越;3. 支持DeepSeek-R1-Distill-Qwen-1.5B模型,带来强大的语言处理能力 No 48. 通俗版解读 No 49. 在中国算力受限的背景下,系统软件优化或将成为产业突围的关键路径。我们不仅要提升效率,更要探索一条符合中国现实的发展道路。这需要软硬件深度协同,需要完整的基础软件体系支撑,需要算法到系统的创新。只有这样,才能真正实现“用最少的资源,发挥最大的效能”。//#DeepSeek 百倍算力效能背后的系统革命# 本期《智者访谈》 No 50. [LG]《TAID: Temporally Adaptive Interpolated Distillation for Efficient Knowledge Transfer in Language Models》