aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(2.3)

Open fly51fly opened this issue 10 months ago • 0 comments

No 1. Open-R1：开源社区携手复现DeepSeek R1的训练管线和数据集。亮点：1. 成功复现DeepSeek在MATH-500基准上的评估结果，平均准确率超90%；2. 高效的合成数据生成，每秒可处理32个请求；3. 社区贡献丰富，涵盖多种模型和数据集 No 2. 《零基础入门：如何用 RAG (检索增强生成) 打造知识库 QA 系统》 No 3. MIT 6.0002课程：计算思维与数据科学导论。为初学者提供零基础的计算思维与数据科学入门课程。帮你快速掌握利用Python解决实际问题的能力。亮点：1. 由MIT顶尖教授授课，零基础也能轻松入门；2. 课程涵盖优化问题、随机模拟、机器学习等前沿内容；3. 提供5套编程作业，实战中提升技能 No 4. [276星]DeepSeekAI：一款智能浏览器扩展，让网页浏览更高效、更智能！亮点：1. 选中网页文本即可触发AI分析，秒出结果；2. 支持多轮对话，交互更流畅；3. 实时流式响应，答案即刻呈现 No 5. 北京邮电大学的AI入门课《AI在大前》

No 6. 梁文锋深度访谈，探讨中国公司在科技创新方面的机遇和挑战，这个采访太牛逼了，头脑清晰，冷静自信，值得一看。不少网友表示：这一代终于有领军人物了，相信 ...... No 7. A Little Bit of Reinforcement Learning from Human Feedback：一本深入浅出介绍人工反馈强化学习（RLHF）的免费书。亮点：1. 从多学科角度出发，涵盖经济学、哲学和最优控制理论；2. 详细解读热门算法，助你快速掌握前沿技术；3. 提供完整的PDF下载，学习资源触手可及 No 8. RL_Reasoning_Writing_GRPO_on_base：基于强化学习的诗歌创作模型训练项目。亮点：1. 使用350M参数的多语言基础模型Pleias-350m，无需指令微调即可生成诗歌；2. 通过GRPO方法优化生成效果，避免重复和提升诗歌结构；3. 支持多种语言的诗歌创作，展现强大的跨语言能力 No 9. [390星]AI-Bootcamp：一个自定进度的... No 10. [199星]Rowfill：开源文档处理平台，为知识工作者量身打造。亮点：1. 高精度OCR，从复杂文档中提取文本、表格和手写内容；2. 自动化工作流，轻松创建定制化任务处理流程；3. 支持本地LLM，保护隐私的同时享受AI的强大能力 No 11. [24星]SpatialVLA：一个强大的空间增强型视觉-语言-行动模型，专为机器人任务设计。亮点：1. 基于110万真实机器人场景训练，性能卓越；2. 仅需8.5GB GPU内存即可运行，部署简单；3. 在多种机器人任务中表现优异，零样本学习能力突出 No 12. Deep Research：OpenAI推出的深度... No 13. 早！[太阳] No 14. [LG]《Towards General-Purpose Model-Free Reinforcement Learning》 No 15. Karpathy的“Vibe编程”模式——放飞自我，完全跟着感觉走，甚至忘记代码的存在。想到什么，说点什么，运行一下，复制粘贴，神奇的是居然大多时候都能用。当LLM解决不了bug，就随机改改或绕过去，反正是周末项目，能跑就行。这种体验既有趣又离谱：确实是在做webapp，但这真的算编程吗？更像是在跟AI玩 ...... No 16. [406星]node-DeepResearch：一个深度研究型的AI搜索工具，能持续搜索和阅读网页，直到找到答案（或超出token预算）。亮点：1. 支持多步推理，最多可达13步；2. 集成Gemini、Brave/Duckduckgo等强大工具；3. 提供Web Server API，方便集成 No 17. [LG] Challenges in Ensuring AI Safety in DeepSeek-R1 Models: ...... No 18. [110星]CUDA_Kernel_Samples：用代码写成的CUDA算子面试秘籍！亮点：1. 涵盖高频面试算子，如reduce、softmax等，手撕代码一步到位；2. 从naive到优化版本，代码全，性能分析透；3. 附赠GPU知识点，面试备战超高效 No 19. [15星]Encoder-Decoder-SLM：... No 20. [74星]RapidUDF：高性能C++表达式/脚本执行引擎，为在线系统提供极速计算支持。亮点：1. 基于LLVM JIT编译，启动和执行性能与原生C++相当；2. 支持SIMD向量化加速，性能提升显著；3. 提供丰富的内置数据类型、操作符和函数，满足复杂计算需求 No 21. 通俗版解读 No 22. [480星]R1-V：用不到3美元的成本，让视觉语言模型（VLM）在少样本情况下实现超强泛化能力！亮点：1. 仅用2.62美元的训练成本，8个A100 GPU，30分钟完成训练；2. 2B模型在100步训练后，OOD测试性能超越72B模型；3. 全部代码、模型、数据集开源，助力研究和开发 No 23. DeepSeek现象折射的中国科技创新转型思考：1、创新需要文化土壤和生态环境；2、年轻一代将成为创新主力；3、中国正在从技术追随者向贡献者转变；4、坚持原创创新需要战略定力和文化自信//梁文锋深度访谈，探讨中国公司在科技创新方面的机遇和挑战，这个采访太牛逼了，头脑清晰，冷静自信，值得一看。不少网友表示：这一代终于有领军人物了，相信 ...... No 24. [34k星]ToolJet：低代码开发的“瑞士军刀”，让企业应用搭建像搭积木一样简单。亮点：1. 45+内置组件，快速搭建复杂界面；2. 50+数据源集成，轻松对接各类数据库和API；3. 支持多平台部署，从Docker到Kubernetes，满足各种需求 No 25. 如何打造一台本地运行Deepseek-R1完整版的服务器？（预算6000美元的全套方案） No 26. [LG]《LLM-AutoDiff: Auto-Differentiate Any LLM Workflow》 No 27. 用不到2000美元在本地运行671B参数的全量Deepseek-R1模型 No 28. [153星]Chaplin：一款实时无声语音识别工具，将唇语变成文字！亮点：1. 实时识别，即刻输出文字；2. 完全本地运行，隐私无忧；3. 支持多种语言模型，识别准确率高达90%以上 No 29. [70星]Extract-chat：通过聊天提取任意网站信息的AI工具。亮点：1. 集成Firecrawl，实时提取结构化数据；2. 支持多种LLM提供商，灵活切换；3. 使用Next.js和Vercel技术栈，性能卓越 No 30. [LG]《Sparse Autoencoders Can Interpret Randomly Initialized Transformers》 No 31. [302星]Distr：企业级软件分发平台，轻松将软件部署到客户可控或共享责任环境中。亮点：1. 提供直观的Web UI，轻松管理所有部署和连接的代理；2. 支持白标客户门户，让客户自主控制部署；3. 提供丰富的SDK，方便开发者集成 No 32. 2025年AI创业指南 No 33. [LG] Open Problems in Mechanistic Interpretability 本文全面审视了机制可解释性领域中亟待解决的开放性问题，强调了在方法、应用及社会技术层面存在的挑战，并指明了未来研究的关键方向，旨在推动该领域突破瓶颈，最终实现对复杂人工智能系统更深层次的理解和更有效的 ...... No 34. [661星]Meridian：谷歌推出的营销组合模型（MMM）框架，帮助广告商搭建和运行自己的内部模型。亮点：1. 基于贝叶斯因果推断，高度可定制化；2. 支持大规模地理级数据处理，提升模型精度；3. 提供优化目标广告频率的方法，助力精准营销 No 35. DeepSeek R1最大的创新不在单个技术点，而是将多项创新有机结合：用GRPO实现高效RL训练、MLA降低计算复杂度、MoE实现大规模参数扩展，这些技术的协同作用使其达到了与闭源模型相当的水平//发布了头条文章：《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 36. [45星]Diffusion-Planner：基于扩散模型的自动驾驶规划方案，让自动驾驶更智能、更灵活！亮点：1. 创新性地将扩散模型应用于运动规划，无需过度依赖后处理优化；2. 实现20Hz的实时规划性能，响应速度更快；3. 在nuPlan数据集上表现卓越，多项指标领先 No 37. [1.7k星]Eko：用自然语言构建生产级智能工作流的框架。亮点：1. 支持从简单命令到复杂多步工作流的生成；2. 兼容浏览器和计算机环境，适用范围广；3. 高开发效率，快速实现复杂任务自动化 No 38. [CL]《Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs》 No 39. 本地运行DeepSeek R1的全面入门指南 No 40. NVIDIA将全量版DeepSeek-R1打包成NIM微服务，在配备8张H200 GPU的服务器上，每秒可处理近4000个Token！可以在自己的基础设施上部署，确保数据安全 No 41. 通俗版解读查看图片//[LG] Challenges in Ensuring AI Safety in DeepSeek-R1 ...... No 42. 你用Ollama跑起来的不是真正的DeepSeek R1 No 43. [684星]DeepRant：游戏玩家的多语言交流神器！一键翻译，让语言不再成为跨服竞技的障碍。亮点：1. 快捷键翻译，无需切出游戏；2. 多种翻译模式，包括“嘴臭模式”和“专业玩家模式”；3. 支持全球主流语言，覆盖超多游戏场景 No 44. [58星]ComfyUI_LoRA_Sidebar：为ComfyUI打造的快速、可视化且高度可定制的LoRA侧边栏，让LoRA管理变得轻松又高效。亮点：1. 自动生成LoRA视觉库，支持9000+模型；2. 智能搜索功能，涵盖类型、标签、名称等多维度；3. 预览拖拽功能，一键创建或更新LoRA节点 No 45. [1.5k星]Calibre-Web-Automated：让电子书管理变得轻松又智能！核心价值在于将Calibre的强大功能与Calibre-Web的现代化界面完美结合，实现电子书的自动化管理和高效转换。亮点：1. 自动化处理27种电子书格式，一键转换；2. 自动备份处理文件，安全无忧；3. 一键切换深色/浅色模式，阅读体验更佳 No 46. [6星]Track-On：基于Transformer的在线点跟踪模型，专为实时视频点跟踪设计。亮点：1. 实时性高，支持逐帧处理，适用于直播视频；2. 内存高效，通过紧凑的记忆模块优化性能 No 47. 发布了头条文章：《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 48. 今日推介(第1670期)：稀疏自编码器可解释随机初始化Transformer、关于o1类大语言模型欠思考的研究、通过操纵投票提高模型在Chatbot ...... No 49. [LG]《Improving Your Model Ranking on Chatbot Arena by Vote Rigging》 No 50. [832星]Swift Build：基于llbuild的高级构建系统，为Swift开发者提供高效、灵活的构建解决方案。亮点：1. 被Xcode、Swift Playground和Swift Package Manager广泛采用；2. 支持跨平台构建，包括Windows；3. 提供丰富的文档和测试支持

Feb 03 '25 15:02 fly51fly