爱可可微博热门分享(1.26)
No 1. Deepseek R1 原理解析:介绍了 Deepseek R1 模型的工作原理及其训练过程,包括思维链推理(Chain of Thought Reasoning)、强化学习(Reinforcement Learning)、组相对策略优化(GRPO)和知识蒸馏(Distillation)等技术 No 2. [1.9k星]Open-R1:完全开源的DeepSeek-R1复现项目,助力研究人员和开发者轻松复现和扩展R1模型。亮点:1. 完整复现流程,涵盖模型训练、评估和数据生成;2. 支持多种硬件加速,包括DDP和DeepSpeed ZeRO-2/3;3. 提供详尽的安装指南和示例代码,降低入门门槛 No 3. [100星]Cuda-120-Days-Challenge:120天系统掌握CUDA编程的高效学习计划!亮点:1. 每天都有明确的学习目标、实践练习和常见坑点提醒;2. 包含6个大型综合项目,巩固所学知识;3. 提供丰富的学习资源和参考书籍 No 4. [471星]Awesome-Framework-Gallery:为科研人员提供海量精美框架图的灵感宝库!亮点:1. 涵盖LLM、Diffusion、NeRF等前沿领域,超500张高清框架图;2. 持续更新,紧跟学术热点;3. 提供丰富工具资源,助力快速设计 No 5. [401星]simpleRL-reason:用极小数据和小模型实现高效强化学习推理,让AI推理训练更简单高效。 亮点:1. 仅用8K数据训练,模型性能提升显著,平均准确率提升近20个百分点;2. 无需复杂奖励模型,简化训练流程;3. 小模型也能展现强大推理能力,与大模型效果相当 No 6. [765星]moon-dev-ai-agents-for-trading:用AI打造智能交易的未来!它能解决交易中的情绪干扰、决策不一致和疲劳等问题。亮点:1. 12种AI交易代理,涵盖风险、策略、情绪分析等;2. 集成深度学习技术,提升交易决策效率;3. 提供全面的API访问和数据支持 No 7. 为什么对我们来说对话更容易 No 8. [2.3k星]Nutlope/logocreator:完全免费开源的AI驱动的Logo生成器,能在几秒钟内创建出专业级的标志。亮点:1. 由Together AI的Flux Pro 1.1提供支持,生成效果超乎想象;2. 支持自定义风格,满足你的个性化需求;3. 项目开源,你可以自由使用并参与改进 No 9. DeepSeek AI在Transformer/GPT架构上做出的三大核心创新: 1、巧妙解决了内存瓶颈:设计了低秩线性缓存机制,通过即时计算K/V的方式,大幅降低了内存占用。这就像是把一个庞大的仓库优化成了智能存储系统,既节省空间又提高效率。 ...... No 10. [24星]Thoughtful Claude:让Claude变得更聪明!通过整合DeepSeek R1的先进推理引擎,为Claude提供强大的推理能力。亮点:1. 复杂多步推理任务轻松搞定;2. 企业级安全,API密钥全程保密;3. 现代Python架构,高效处理,代码清晰 No 11. [401星]One Small Step:技术科普不再难!这个项目用5分钟带你领略前沿技术的魅力。亮点:1. 每篇科普文章5分钟读完,轻松掌握核心概念;2. 涵盖AI、系统、硬件等多个热门领域,内容丰富;3. 已更新超20篇优质教程,持续更新中 No 12. 免费书:《离散数学及其应用》,完美地平衡了五大核心主题:数学推理:培养严谨的逻辑思维、组合分析:掌握解决实际问题的技能、离散结构:建立抽象思维的桥梁、算法思维:为程序设计打下基础、应用建模:联系现实世界的纽带 No 13. 受@宝玉xp 老师启发,分享几个用大模型做翻译的常用“密码”: 1. 强调精确和准确性: “准确翻译” (Accurately ...... No 14. 早![太阳] No 15. [245星]Pippin:打造你的专属数字分身,让AI自主完成任务!亮点:1. 支持多种LLM模型,灵活选择;2. 一键连接250+工具,轻松扩展技能;3. 自动化任务生成,动态优化代码 No 16. [67星]llmpeg:用自然语言操作ffmpeg,告别繁琐命令行!亮点:1. 将自然语言指令转换为ffmpeg命令,无需学习复杂语法;2. 支持多平台(Windows、MacOS、Linux);3. 提供上下文感知,根据系统和ffmpeg版本生成适配命令 No 17. [1.2k星]TinyZero:用不到30美元的成本,重现大型语言模型的自我进化能力。 亮点:1. 仅需30美元即可体验大型模型的推理能力;2. 3B基础模型通过强化学习自主发展推理能力;3. 提供完整的实验日志和开源代码,方便复现和学习 No 18. [134星]LangFair:一个Python库,用于评估大型语言模型(LLM)在具体用例中的偏见和公平性。亮点:1. 提供超过20种偏见和公平性评估指标;2. 支持文本生成、分类、推荐等多种LLM用例;3. 提供自动化评估工具,简化评估流程 No 19. [LG] A Survey on Memory-Efficient Large-Scale Model Training ...... No 20. [439星]Open Operator:一个开源的Web自动化操作平台,让你轻松构建自己的Web Agent。亮点:1. 基于Browserbase和Stagehand,强大的浏览器自动化能力;2. 集成OpenAI,实现自然语言理解与决策;3. 使用Next.js构建,性能卓越,开发体验佳 No 21. 博弈论博士课程笔记,涵盖了博弈论的基本概念、理论和应用,包括博弈论的基础知识,包括博弈论的定义、历史发展、以及它在经济学中的应用 No 22. [2.5k星]Lightpanda Browser:为AI和自动化任务打造的超轻量级无头浏览器。亮点:1. 内存占用极低,仅为Chrome的1/9;2. 执行速度超快,比Chrome快11倍;3. 兼容Playwright和Puppeteer,轻松集成现有自动化工具 No 23. [246星]Microsoft DocumentDB:为PostgreSQL量身定制的文档型NoSQL数据库扩展。亮点:1. 原生支持BSON数据类型,无缝对接PostgreSQL;2. 提供强大的CRUD操作,支持复杂查询和全文检索;3. 开源免费,基于MIT许可,灵活部署 No 24. AI降本提效新趋势:思维链蒸馏 No 25. [LG]《Can Bayesian Neural Networks Make Confident Predictions?》 No 26. [811星]vlms-zero-to-hero:从NLP和计算机视觉基础到视觉-语言模型前沿的进阶指南。亮点:1. 系统性学习路径,涵盖从基础到前沿的完整知识体系;2. 提供丰富的教程和代码示例,助力快速上手;3. 涵盖最新模型和技术,如LLaVA、BLIP-2等 No 27. [389星]Refly:开源的 AI 原生创作引擎... No 28. [43星]ComplexFuncBench:复杂函数调用的终极测试基准!它能解决复杂场景下函数调用的评估难题,帮助开发者优化模型性能。亮点:1. 包含1000个复杂函数调用样本,覆盖多步调用、参数推理等场景;2. 支持长参数(超500 tokens)和128k长文本上下文;3. 提供自动化评估框架,快速验证模型效果 No 29. [CV]《Learning segmentation from point trajectories》 No 30. [253星]RustOwl:Rust语言的可视化调... No 31. [4.1k星]Roo-Code:AI驱动的VS Code插件,让编程更智能、更高效!亮点:1. 支持多模型,可与OpenAI等主流API无缝对接;2. 自定义模式,可创建专属的编程助手;3. 代码行动集成,直接在VS Code中提供快速修复和重构选项 No 32. [6.1k星]Upsonic:为企业级任务和垂直AI Agent提供强大的任务导向型AI框架。亮点:1. 支持多种LLM模型,包括OpenAI和Anthropic;2. 提供生产级可扩展性,可无缝部署于AWS、GCP或本地;3. 通过MCP服务器支持复杂自动化任务 No 33. [616星]Dither3D:一种新型的3D场景表面稳定分形抖动技术,让3D图形在视觉上更加稳定和逼真!亮点:1. 独特的表面稳定性,无论物体如何移动或缩放,抖动点始终“粘”在表面上;2. 支持多种3D纹理,可自由切换;3. 适用于Unity 2019.4和2022.3,兼容性强 No 34. DeepSeek如何训练最前沿的推理模型 No 35. [2.2k星]Blinko:一个开源、自托管的个人AI笔记工具,让你在保护隐私的同时,轻松捕捉和整理每一个灵感瞬间。亮点:1. AI增强检索,通过自然语言查询快速找到所需笔记;2. 完全自托管,数据100%属于你;3. 支持Markdown,笔记格式化更高效 No 36. [226星]backend-api-kit:轻松打造可扩展、可盈利的后端API,一站式解决开发难题!亮点:1. 集成API密钥管理和限流功能,保障API安全与稳定;2. 支持多种认证方式,包括会话和Bearer令牌;3. 提供完整的开发工具链,从数据库到测试一应俱全 No 37. [69星]SimpleDSPy:让Python中的DSPy管道构建变得轻而易举!只需几行代码,即可实现高效的数据处理。亮点:1. 自动从输入/输出名称创建模块,省心省力;2. 提供简洁、直观的API,新手也能快速上手;3. 内置缓存和配置功能,大幅提升运行效率 No 38. [CL]《FilmAgent: A Multi-Agent Framework for End-to-End Film Automation in Virtual 3D Spaces》 No 39. [293星]RAT-retrieval-augmented-thinking:让AI回答问题时更有条理、更有深度!它能解决AI回答问题时逻辑不清晰、缺乏深度的问题。亮点:1. 两步思考法,先推理再回答,让AI更有条理;2. 支持多种模型,自由切换,满足不同需求;3. 显示AI思考过程,让你知其然更知其所以然! No 40. [1.4k星] 《系统设计面试:内幕指南(中文翻译)》系统设计面试的宝典,帮助求职者掌握大厂面试必备的系统设计知识,从基础到实战案例一应俱全 No 41. 通俗版解读 No 42. [LG]《Lossless Compression of Vector IDs for Approximate Nearest Neighbor Search》 No 43. [73星]Open Operator:打造全能型计算机任务AI Agent,让AI成为你的超级助手!亮点:1. 覆盖开发、数据管理、自动化、网络交互和系统操作五大领域;2. 提供WebArena和OSWorld两大基准测试,助力模型评估;3. 汇聚开源与闭源解决方案,满足多样化需求 No 44. 对 预训练 MoE、upcycled MoE 和 FrankenMoE 三类 MoE 模型的简介。 - 预训练 MoE 预训练 ...... No 45. [166星]Quant-Wiki:一个开源的量化金融知识百科,致力于打破国内外量化金融行业的信息差,通过汉化和开源的方式帮助更多人学习量化投资的核心知识和实战策略 No 46. 扫地机器人的进化:最新的扫地机器人配备了机械臂,功能大大拓展。想象一下,在开始打扫之前,它会先巡视整个空间,识别并用机械臂清理可能会卡住吸尘器的小物件。相当于在正式大扫除前,先有个细心的助手帮你预处理一遍。在一些场景下还有有点用的。 ...... No 47. [LG] A Comprehensive Survey on Spectral Clustering with Graph ...... No 48. 今日推介(第1662期):虚拟3D空间端到端电影制作自动化多Agent框架、近似最近邻搜索的向量ID无损压缩、从点轨迹学习分割、贝叶斯神经网络能否做出自信的预测、神经网络中神经切线核方法的问题 ...... No 49. a reinforcement learning ... No 50. 这篇论文反直觉地发现并验证了LLM的幻觉在药物发现领域可以提升性能,通过将LLM生成的幻觉描述融入提示,显著提高了药物特性分类任务的准确率,揭示了幻觉在特定情境下的创造性潜力,并引发了对AI“缺陷”价值的深刻思考。//[CL]《Hallucinations Can Improve Large Language Models in Drug Discovery》