爱可可微博热门分享(1.24)
No 1. 受@宝玉xp 老师启发,分享几个用大模型做翻译的常用“密码”: 1. 强调精确和准确性: “准确翻译” (Accurately ...... No 2. OpenAI 的 Sebastien Bubeck 认为,o1 学习范式带来了一种 AI 能力的“涌现”:模型自主学习推理和解决问题,无需预先编程。这意味着AI ...... No 3. DeepSeek AI在Transformer/GPT架构上做出的三大核心创新: 1、巧妙解决了内存瓶颈:设计了低秩线性缓存机制,通过即时计算K/V的方式,大幅降低了内存占用。这就像是把一个庞大的仓库优化成了智能存储系统,既节省空间又提高效率。 ...... No 4. [1.4k星] 《系统设计面试:内幕指南(中文翻译)》系统设计面试的宝典,帮助求职者掌握大厂面试必备的系统设计知识,从基础到实战案例一应俱全 No 5. The Complete Mathematics of Neural Networks and Deep Learning:16岁小伙5小时手推深度学习数学原理 No 6. DeepSeek如何训练最前沿的推理模型 No 7. 人工智能的数学:探讨了数学在人工智能中的关键作用,强调数学工具如何帮助我们更好地理解和提升AI系统,同时指出AI如何推动新数学的发展。本文聚焦于神经网络架构的建模和优化,鼓励更多数学家投身这一领域 No 8. 从单个模型到多模型协作:AI开发新趋势 No 9. [166星]Quant-Wiki:一个开源的量化金融知识百科,致力于打破国内外量化金融行业的信息差,通过汉化和开源的方式帮助更多人学习量化投资的核心知识和实战策略 No 10. Beej's Guide to C Programming:Beej的C语言入门到进阶的超级指南,从基础语法到高级特性,帮你轻松掌握C语言的核心知识 No 11. [128星]CUDA学习资源库:为初学者和进阶者准备的CUDA编程学习指南,包含丰富的教程、实用示例和优化技巧,帮助你轻松掌握GPU加速应用开发 No 12. [245星]Pica:完整的Agent基础设施,帮开发者轻松构建、部署和扩展AI代理,提供100+ API和工具的全面接入 No 13. [382星]Cellm:为 Excel 提供使用大型语言模型(LLM)的扩展,允许用户在公式中调用 LLMs,如 ChatGPT,进行数据处理和分析 No 14. 早![太阳] No 15. [92星]UltraRAG:基于模块化构建和敏捷部署的RAG系统框架,旨在通过自动化的 “数据构建 - 模型微调 - 推理评估” 知识适应技术系统,为研究人员和开发者提供一站式的解决方案 No 16. 为什么“快乐学习”并不总是最理想的方式 No 17. [372星]Math-To-Manim:基于 DeepSeek AI 的数学动画生成器,它使用 Manim 库来自动化地将复杂的数学概念转换为动画,并且支持通过模型优化和训练直接一次性生成高质量的动画 No 18. [44星]Reasoning Gym:用于训练推理模型的Python库,可以生成无限多的推理任务,帮助模型通过强化学习提升逻辑和算法推理能力 No 19. 一句简单的提示词就可以让 LLM 在翻译的时候更好的“意译”以前为了让 LLM 达到更好的翻译效果,我尝试了很多方式,比如最初的先直译再意译,后来的直译、反思和意译。虽然效果好了,但是却复杂了。现在随着模型能力增强,不再追求复杂的提示词技巧,而是尝试返璞归真,找到更好更简单的提示词方法 ...... No 20. [143星]Flows-AI:一个简化复杂AI工作流程的工具,能够将多个AI任务像拼积木一样组合起来,让AI的使用更加灵活高效 No 21. [LG]《A Probabilistic Model for Self-Supervised Learning》 No 22. [CL]《Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback》 No 23. [181星]FilmAgent:一个虚拟3D空间中的电影自动化制作框架,通过模拟电影制作中的关键角色(如导演、编剧、演员和摄影师),实现电影制作的自动化。项目遵循传统电影工作流程,将电影制作过程分为三个阶段:构思发展、编剧与摄影,并采用 “批评 - 纠正 - 验证” 和 “辩论 - 判决” 的协作策略 No 24. [72星]vLLM Production Stack:提供参考部署架构的项目,旨在帮助用户从单个 vLLM 实例扩展到分布式部署,并提供监控和性能优化功能 No 25. 如何在书/论文上做笔记 No 26. [162星]Notate:一款强大的桌面研究助手,结合AI驱动的分析和先进的向量搜索技术,能够智能处理、组织和检索来自多种格式的文档、音频和文本信息,帮助研究人员、学者和知识工作者优化工作流程 No 27. 500+页的Nvidia官方CUDA编程指南 No 28. 晚安~ [月亮] No 29. DeepSeek-R1 项目展现了开源的真谛——不仅开放了一系列模型,更罕见地公开了完整的训练细节。在开源社区中,他们或许是首个展示出强化学习持续突破性进展的项目。 ...... No 30. [593星]Bunster:将Shell脚本编译成静态二进制文件的工具,让脚本运行更快、更安全,还能跨平台使用 No 31. [34星]Euclidean Fast Attention:一种高效的注意力算法实现,能在保持高性能的同时大幅降低计算成本,适合需要快速处理大量数据的场景 No 32. [15.3k星]Teable:新一代无代码数据库工具,旨在提供一个无需编码的 PostgreSQL 数据库解决方案,作为 Airtable 的替代品,像电子表格一样简单,却能支持团队协作、实时更新和海量数据处理,适合非技术人员快速搭建强大的数据库应用 No 33. [197星]基于 RAG (Retrieval-Augmented Generation) 的知识库管理(RAG Web UI):基于智能检索增强生成技术的对话系统,从文档处理 -> 入向量数据库 -> Query召回 -> Open API,帮助企业或个人基于自己的知识库快速搭建智能问答系统,提供精准可靠的知识问答服务 No 34. 免费书:《微分几何:曲线与曲面》,一本详细的微分几... No 35. 如何打造与众不同的创造性? No 36. [128星]CHRONOS:新闻时间线生成工具,通过迭代提问的方式从海量新闻中提取关键事件,生成清晰的时间线总结,帮助快速了解事件全貌 No 37. [308星]listen:Solana瑞士军刀工具包,为交易者提供一站式的区块链交易辅助功能,包括实时交易监控、多平台代币兑换和性能监控,助力用户高效管理交易 No 38. [LG]《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》 No 39. [LG]《Optimizing Return Distributions with Distributional Dynamic Programming》 No 40. [537星]AI视频创作工具箱:在浏览器里用AI生成和编辑视频,让视频创作变得更简单 No 41. [CL]《Autonomy-of-Experts Models》 No 42. (可免费书)学术写作指南:由哈佛大学学者编写的 3... No 43. [204星]BrowserAI:在浏览器中运行本地AI模型,无需服务器,保护隐私的同时实现快速推理 No 44. [LG]《MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking》 No 45. [126星]Evo:一种更简单直观的版本控制系统,让团队协作开发变得轻松愉快,不再为复杂的分支管理和合并冲突烦恼 No 46. [176星]IntellAgent:用于对会话Agent进行全面诊断和评估的框架,通过模拟真实的合成互动来测试Agent的性能 No 47. [44星]Pulsar:本地运行的AI推理平台,允许用户在不依赖外部服务的情况下,利用自己的计算机处理 AI 模型推理 No 48. [CL]《Chain-of-Reasoning: Towards Unified Mathematical Reasoning in Large Language Models via a Multi-Paradigm Perspective》 No 49. [50星]Awesome_Test_Time_LLMs:关于测试时计算的资源库,从直觉式思维(System-1)过渡到理性式思维(System-2),汇集了大量关于如何在测试阶段提升大型语言模型性能的研究和方法,帮助模型在面对新任务时更好地适应和推理 No 50. [LG]《Aligning Instruction Tuning with Pre-training》