爱可可微博热门分享(2.20)
No 1. Ultra-Scale Playbook:超大规模模型训练实战指南
No 2. [370星]simple_GRPO:一个简单的 G...
No 3. [LG] A Survey of In-Context Reinforcement Learning 本文全面综述了新兴的上下文强化学习 ......
No 4. Google推出AI co-scientist辅助科研系统
No 5. kg-gen:从任何文本中提取知识图谱的AI工具。亮点:1. 支持多种输入格式,包括纯文本和对话消息;2. 自动分块处理长文本,支持高达5000字符的分块;3. 聚类相似实体和关系,让知识图谱更简洁易懂
No 6. [122星]funtrace:一款为C/C++开发者量身打造的高性能函数调用追踪工具。亮点:1. 极低开销,单次调用开销小于10纳秒;2. 支持多线程、异常处理和共享库;3. 与ftrace集成,直观展示线程调度状态
No 7. [218星]YOLOv12:实时目标检测的全新突破,让速度与精度兼得!亮点:1. 速度飞快,YOLOv12-N在T4 GPU上仅需1.64ms完成推理;2. 精度卓越,mAP高达40.6%,超越同级别模型;3. 强大的注意力机制,性能提升显著
No 8. [90星]Open-R1-Video:为视频理解任务引入R1范式,开源训练代码和数据,助力多模态模型的高效训练。亮点:1. 仅用视频、查询和答案即可训练,无需额外标注;2. 使用GRPO训练,显著提升模型推理能力;3. 开源数据集包含4K视频,适配多种硬件环境
No 9. 有点恐怖:“一个无脸、解剖学精确的合成人,拥有超过200个自由度、超过1000块肌纤维肌肉和500个传感器” ......
No 10. [21k星]Marker:将PDF和图像快速、高精度地转换为Markdown、JSON和HTML的神器。亮点:1. 支持多语言,涵盖所有类型的文档;2. 性能卓越,单页转换仅需0.18秒;3. 可选LLM增强模式,进一步提升准确率至96%以上
No 11. 多无人机协同3D打印
No 12. [225星]Native Sparse Attention PyTorch:高效稀疏注意力机制(NSA)的PyTorch实现,让模型训练更省时省力!亮点:1. 硬件对齐设计,加速训练效率;2. 原生可训练,无需复杂预处理;3. 支持多种稀疏模式,灵活适配不同任务
No 13. 最大的AI生物模型Evo 2发布
No 14. R1-Nature:在小模型上复现R1推理能力,探索强推理的核心——思考过程性内容。亮点:1. 仅用0.5B到3B的小模型,成功复现R1推理效果;2. 提出“思维链推理爆炸”现象及解决方案;3. 通过实验验证,思考内容是AGI/ASI的核心
No 15. #转发赠书#携手@博文视点Broadview 送出3本《零基础开发AI Agent——手把手教你用扣子做智能体》
No 16. [16.3k观看]GPU Programming(可视化GPU编程教程):带你深入探索GPU编程的世界,从基础到高级,轻松掌握并行计算的核心技能。亮点:1. 11个精心制作的视频教程,涵盖从入门到进阶的全部知识点;2. 超过1.6万次观看,学习者反馈极佳;3. 深入解析GPU架构与性能优化,助力高效开发
No 17. [CL]《Reasoning on a Spectrum: Aligning LLMs to System 1 and System 2 Thinking》
No 18. academic-project-template:为学术项目打造的优雅网页模板,用React和UIKit搭建,支持Markdown和KaTeX公式,轻松搞定学术项目展示。亮点:1. 仅需一个template.yaml文件,配置轻松搞定;2. 自动部署到GitHub Pages,零配置;3. 支持自定义主题,适配多种学术风格
No 19. 早![太阳]
No 20. [387星]MultiPost-Extension:一键同步内容到多个社交媒体平台的浏览器扩展。亮点:1. 支持超过10个主流平台,如知乎、微博、小红书、抖音等;2. 无需登录、注册或API Key,完全免费;3. 支持文本、图片和视频等多种内容类型
No 21. 最全面的Grok 3已知信息汇总与解读
No 22. Awesome-Robotics-Diffusion:机器人学习领域的扩散模型精选资源库。亮点:1. 汇集了40多篇前沿的机器人学习与扩散模型结合的学术论文;2. 涵盖多种机器人任务,如操作、导航、规划等;3. 提供丰富的代码和数据资源,助力研究和开发
No 23. [155星]OpenDWM:开源的自动驾驶世界模型...
No 24. Awesome-RL-based-LLM-Reas...
No 25. [15星]arxiv-markdown-parser-plugin:一键将arXiv论文转换为Markdown代码,让学术研究更高效。亮点:1. 一键转换,秒变Markdown格式;2. 完美支持方程式、表格和引用;3. 助力LLM集成,提升研究效率
No 26. [9.5k星]MiniMind:从零开始,仅需2小时和3块钱,就能训练出26M参数的迷你GPT模型!亮点:1. 2小时快速训练,适合个人GPU用户;2. 仅需3块钱的服务器成本,超低门槛;3. 提供完整训练代码,涵盖预训练、微调、蒸馏等全过程
No 27. [LG]《Agentic Deep Graph Reasoning Yields Self-Organizing Knowledge Networks》
No 28. [317星]ComfyUI-RMBG:一键式智能图像背景移除与分割神器,让复杂背景处理变得轻而易举!亮点:1. 支持多种模型(如RMBG-2.0、INSPYRENET、SAM等),满足不同场景需求;2. 高精度边缘检测,完美保留细节;3. 提供透明、纯色等多种背景选项,灵活应对各种输出需求
No 29. [298星]frames_of_mind:旨在通过...
No 30. [29星]Auto-Deep-Research:你的个人AI助理,开源且低成本的OpenAI Deep Research替代方案。亮点:1. 性能卓越,开源方法中排名第一,媲美OpenAI的深度研究;2. 支持多种LLM,无缝对接OpenAI、Anthropic等;3. 一键启动,无需配置,即刻体验
No 31. [618星]MoBA:名为 MoBA(Mixture of Block Attention)的新型注意力机制,旨在提高大型语言模型(LLM)处理长文本上下文的效率和性能。亮点:1. 长文本处理效率提升,支持1M上下文长度;2. 参数无偏的Top-k门控机制,精准筛选关键信息;3. 无缝切换全注意力与稀疏注意力模式,性能与效率兼得
No 32. [59星]ThinkDiff:让扩散模型具备多模态...
No 33. [812星]SkyReels-V1:开源的人中心视...
No 34. [90星]Lisa:一个用现代Common Lisp编写的高质量专家系统外壳,为复杂问题提供高效推理引擎。亮点:1. 基于Rete算法,解决多对多匹配难题,效率极高;2. 支持多种Common Lisp实现,如SBCL、LispWorks等;3. 近期完成代码优化,性能大幅提升
No 35. SWE Arena:一个开源平台,为自动化软件工程提供强大的代码执行和评估能力。亮点:1. 提供安全的沙箱环境,支持多种编程语言;2. 自动管理依赖,支持NPM和PIP;3. 实时代码修改与反馈,提升开发效率
No 36. SakugaDataset:为动画研究提供超大规模数据集,助力动画创作与研究。亮点:1. 包含4200万关键帧,是首个如此大规模的卡通动画数据集;2. 提供多种预处理工具,方便研究人员快速上手;3. 支持学术研究,免费提供数据下载链接
No 37. microsoft/wham:微软开发的一个世界与...
No 38. PaliGemma 2 mix:Google推出的...
No 39. Apple Lamp-like Robot:传闻中苹果设计的桌面机器人,让家居生活更智能、更有温度。亮点:1. 拥有类似皮克斯《Luxo Jr.》的可爱外观;2. 能通过表情和动作增强用户互动;3. 预计2026或2027年推出,有望成为高端智能家居设备
No 40. Awesome LLM OS:一个关于大型语言模型操作系统的精选资源库。它帮助开发者和研究人员快速了解和探索LLM-OS的前沿研究、工具和项目。亮点:1. 涵盖20多篇顶级研究论文;2. 提供多种开发接口和项目示例;3. 社区驱动,持续更新
No 41. [15星]OctoTools:一个无需训练、易于扩展的智能工具框架,专为复杂推理而生。亮点:1. 标准化工具卡片,轻松集成新工具,无需额外训练;2. 在16个多样化任务中,平均准确率比GPT-4o高出9.3%;3. 提供任务特定工具优化算法,性能提升显著
No 42. [196星]SkyReels-A1:用视频扩散变换器实现生动的肖像动画,让静态照片也能“活”起来!亮点:1. 基于Transformer架构,生成效果自然流畅;2. 提供预训练模型权重,快速上手;3. 支持Gradio交互界面,操作简单易懂
No 43. FAMPNN:一款用于全原子蛋白质序列设计的AI工具。亮点:1. 显著提升蛋白质设计的精准度,通过侧链建模优化序列设计;2. 提供多种预训练模型权重,支持不同应用场景;3. 支持无条件和条件序列设计,满足多样化研究需求
No 44. [125星]FLARE:从稀疏未标定视图中快速估计相机姿态、重建3D几何并合成新视图的前沿模型。亮点:1. 仅需2-8张未标定图像即可完成高质量重建;2. 推理时间小于0.5秒,效率极高;3. 采用3D高斯建模,实现逼真的新视图合成
No 45. Knowledge Distillation Tu...
No 46. [LG]《Electron flow matching for generative reaction mechanism prediction obeying conservation laws》
No 47. Dynasor:一个简单的 vLLM 扩展,旨在加速大型语言模型(LLM)的推理过程,而无需进行训练或微调。亮点:1. 基于vLLM,无需额外训练即可提升推理效率;2. 提供CLI界面和OpenAI兼容服务器,使用灵活;3. 通过动态执行和提前停止,显著减少推理延迟
No 48. [LG]《LLM-Powered Proactive Data Systems》
No 49. COMPSCI 687: 强化学习讲义(2022秋季学期):由马萨诸塞大学阿默斯特分校计算机科学系教授 Bruno C. da Silva 编写,详细介绍了强化学习(RL)的基础知识和关键概念
No 50. 通俗版解读