爱可可微博热门分享(2.10)
No 1. [161星]Train LLM From Scratch:从零开始训练自己的大型语言模型。亮点:1. 提供从下载数据到生成文本的完整流程;2. 仅需单个GPU即可训练高达20亿参数的模型;3. 详细教程和代码,轻松上手 No 2. Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步解析Transformer的每一个细节;2. 结合矩阵运算、注意力机制等关键知识点,深入浅出;3. 提供丰富的代码实现和资源链接,助力快速上手 No 3. [4.9k星]强化学习数学基础:一本面向强化学习的数学基础教材,帮助读者深入理解强化学习的核心概念和算法。亮点:1. 数学推导与通俗讲解相结合,适合初学者和进阶者;2. 提供丰富的代码实现和教学视频,便于学习和实践 No 4. 斯坦福大学 CS229 机器学习 Andrew Ng 完整讲义(227页):概述了从监督学习、深度学习到无监督学习和强化学习的各种机器学习主题 No 5. DeepSeek提示词速查表 No 6. [1.1k星]RAG Web UI:基于RAG技术... No 7. [512星]DeepClaude:最强AI模型组合的开源实现,让DeepSeek r1和Claude 3.5 Sonnet完美搭档,释放最强推理能力!亮点:1. 支持OpenAI流式输出,无缝对接ChatBox等软件;2. 提供按量付费API服务,使用更灵活;3. 本地和服务器部署双支持,满足多样化需求 No 8. DeepSeek-R1(全量版)候选平台汇总: 1、英伟达NIM:http://t.cn/A63Hb85B ...... No 9. 从零开始做MVP产品最佳实践 No 10. YC告诉你创业之路该如何规划 No 11. open-r1-text2graph:开源复现DeepSeek R1的文本到图谱抽取训练方案。亮点:1. 基于GRPO强化学习,提升模型对结构化信息的提取能力;2. 提供完整的数据生成、监督训练到强化学习的全流程;3. 支持多种奖励机制,优化模型输出质量 No 12. [11.9k星]Xournal++:一款强大的手写笔记软件,支持PDF标注,让你的笔记更加高效和个性化。亮点:1. 支持多种操作系统,包括Linux、macOS和Windows;2. 支持多种笔输入设备,如Wacom平板;3. 提供丰富的绘图工具和PDF注释功能 No 13. #转发赠书#携手@机械工业出版社 送出3本《心态制胜》 No 14. [25星]grpo_unsloth_docker:在本地轻松运行GRPO策略训练,感受AI策略优化的魅力!亮点:1. 支持单GPU本地运行,无需复杂配置;2. 提供简洁的Makefile命令,快速启动和停止训练环境;3. 基于Unsloth团队的优秀工作,快速上手 No 15. [186星]qcp:用QUIC协议实现的超快速远程文件传输工具。亮点:1. 比传统SCP快数倍,尤其在高延迟网络下;2. 支持配置文件,轻松管理传输参数;3. 安全性与SCP相当,使用现有成熟机制 No 16. [132星]Tinker:一款开源的迷你双足机器人,为机器人爱好者和开发者提供了一个动手实践的平台。亮点:1. 基于强化学习的控制,让机器人动作更智能;2. 详细的组装指南,新手也能轻松上手;3. 支持个性化定制和功能扩展,激发无限创意! No 17. [207星]Deep Research Py:在终端里就能进行深度研究的AI工具,每月帮你省下200刀!亮点:1. 交互式研究,通过提问深入了解需求;2. 自定义研究深度和广度,精准控制信息量;3. 生成Markdown报告,清晰呈现研究结果 No 18. 后训练知识蒸馏:监督式蒸馏 vs. 合成数据蒸馏 vs. 在线策略蒸馏 No 19. [655星]obs-localvocal:一款强大的OBS插件,让本地语音识别和字幕生成变得轻而易举!亮点:1. 实时语音转文字,支持100种语言;2. 隐私优先,数据本地处理,无云端风险;3. 支持多种硬件加速,性能强劲 No 20. [3.8k星]LLM4Decompile:用大语言模型反编译二进制代码,让机器代码“回归”人类可读的源代码。亮点:1. 支持Linux x86_64二进制文件,覆盖GCC O0到O3优化级别;2. 最新模型版本在基准测试中重执行率高达64.94%;3. 提供多种模型版本,参数规模从13亿到220亿不等,满足不同需求 No 21. AxBench:斯坦福NLP团队开发的Python库,用于评估大型语言模型(LLM)可解释性方法的实用性。亮点:1. 提供16K概念训练数据,助力模型精准理解;2. 包含10+种可解释性方法,涵盖微调和提示基线;3. 支持LLM-in-the-loop训练,生成数据成本低至0.01美元/概念 No 22. Sam Altman关于人工智能发展的三点洞察。亮点:1. 揭示AI智力与资源投入的对数关系;2. 预测AI使用成本每年下降10倍;3. 强调AGI将带来超级指数级的社会经济价值 No 23. 早![太阳] No 24. AgentRecSys:一个专注于基于大型语言模型(LLM)的智能体(Agent)在推荐系统(RecSys)中的应用的前沿研究项目。亮点:1. 汇集了超过30篇最新学术论文,涵盖LLM在推荐系统中的多种创新应用;2. 提供了详细的模型分类和研究方向,帮助研究者快速定位;3. 部分模型附带开源代码,便于实践和复现 No 25. [7.7k星]Ryujinx:用C#编写的任天堂Switch模拟器,让你在PC上畅玩Switch游戏。亮点:1. 高精度模拟,支持大多数Switch游戏;2. 多种图形增强功能,如分辨率缩放和抗锯齿;3. 支持多种输入设备,包括键盘、鼠标和手柄 No 26. [253星]Deeper Seeker:一款开源的智能研究工具,能帮你快速完成市场调研、竞品分析和投资报告!核心价值:将复杂的多步研究任务简化,一键生成专业报告。亮点:1. 支持多步任务规划,自动迭代优化;2. 结合OpenAI和Exa API,搜索结果更精准;3. 输出格式清晰,支持多种报告生成 No 27. [369星]xhs_ai_publisher:小红书AI运营助手,一键生成并发布小红书风格内容,让内容创作和发布变得轻松又高效!亮点:1. 利用大模型技术自动生成文章标题和内容,节省创作时间;2. 自动下载并预览封面图和内容图片,提升视觉效果;3. 通过Selenium实现自动化发布,无需手动操作 No 28. [159星]口袋AI-zh:将世界知识装进口袋的离线AI助手,在手机上本地运行DeepSeek-R1蒸馏版。亮点:1. 离线运行,无需联网即可随时随地使用;2. 中文优化,适配DeepSeek等优秀中文模型,对话更自然;3. 多模型支持,适配多种设备,从4G到16G内存设备都能找到合适模型 No 29. 用 Unsloth 训练自己的 R1 推理模型:Unsloth让本地训练推理模型变得轻而易举,仅需7GB显存即可训练推理模型!亮点:1. 仅需7GB显存即可训练1.5B参数模型;2. 比Hugging Face + FA2节省80%显存;3. 支持多种模型,如Llama 3.1、Phi-4等 No 30. 讲义:优化理论在机器学习中的应用,特别是梯度下降法、随机梯度下降法、在线学习、非凸优化、极小极大问题以及多臂老虎机问题的详细讲解和分析 No 31. [974星]video-subtitle-master:批量为视频或音频生成字幕并翻译成其他语言的客户端工具。亮点:1. 跨平台支持Mac和Windows系统;2. 支持多种翻译服务,如百度,火山,deeplx, openai, deepseek, ollama 等;3. 生成速度快,苹果芯片上支持Core ML加速 No 32. [475星]AIaW:AI as Workspace,一个精心设计的AI客户端,让你的AI使用体验更高效、更便捷。亮点:1. 多工作区管理,轻松分类不同主题的对话;2. 本地优先+实时云同步,数据安全又便捷;3. 支持Artifacts,可将助手回答转为可编辑、带版本控制的文档 No 33. [540星]Liubai:基于 WeChat 的 DeepSeek R1 应用,提供笔记、日程、待办清单和任务管理功能,并集成了 AI 技术。亮点:1. 支持原子化附着,可添加文本、图片、多级标签等;2. 云端同步,多设备无缝协同;3. 隐私保护,支持“仅保存本地”或“拒绝AI读取” No 34. [1.2k星] Cloudflare DDNS:一个超轻量级、功能强大的动态DNS更新器,能自动同步你的公网IP到Cloudflare DNS,让你的自建服务始终在线!亮点:1. Docker镜像压缩后小于5MB,极致轻量;2. 支持IPv4和IPv6双栈,适配各种网络环境;3. 支持国际域名和通配符域名,灵活管理你的域名资源 No 35. [168星]SpeeD:让扩散模型训练速度提升三倍的神奇工具!亮点:1. 三倍加速,显著提升训练效率;2. 重新采样+重新加权策略,优化时间步处理;3. 代码易于兼容,快速上手 No 36. DeepSeek-R1(全量版)候选平台汇总(2.6版): 1、英伟达NIM:http://t.cn/A63Hb85B ...... No 37. [25星]FlashVideo:高效的高分辨率视频生成工具,支持从文本描述生成高质量视频。只需简单几步,就能将低分辨率视频升级为高清,甚至从文字描述直接生成视频。亮点:1. 从270p到1080p,仅需4步,耗时约72秒;2. 支持长文本提示,生成效果更精细;3. 提供完整模型权重和推理代码,轻松上手 No 38. [CL]《Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning》 No 39. [117星]NVIDIA-AI-Blueprints/pdf-to-podcast:将PDF文档转化为AI音频播客,让知识随时随地陪伴你。亮点:1. 利用NVIDIA强大的AI技术,精准提取PDF核心内容;2. 支持多PDF输入,丰富播客背景信息;3. 生成2人或单人播客模式,满足不同场景需求 No 40. [40星]Awesome-Unified-Multimodal:一站式汇聚多模态统一模型研究的大列表。亮点:1. 汇集了超过30篇前沿多模态研究论文,涵盖视觉与语言的融合;2. 提供丰富的代码资源,助力快速上手和研究;3. 持续更新,紧跟多模态领域的最新进展 No 41. Nanospeech:一个基于 PyTorch 和 MLX 的简单、可定制的文本到语音(TTS)系统。亮点:1. 仅需单个H100 GPU,几天内即可训练完成,模型参数仅82M;2. 支持语音匹配,可从参考语音样本中生成相似语音;3. 生成速度快,比实时快3-5倍 No 42. gh200-llm:为NVIDIA GH200芯片优化的大型语言模型训练与部署解决方案。亮点:1. 支持H100和GH200多架构,适配性强;2. 集成VLLM、XFormers和Flash Attention,可轻松部署和微调8B模型;3. 能在单个GH200节点上以fp8模式全上下文长度部署70B或72B模型 No 43. OpenAI发布的最新CHatGPT宣传片:接下来我们要创造什么? [酷] No 44. [LG]《Language Models Use Trigonometry to Do Addition》 No 45. [229星]LynxHub:一站式AI平台,让AI管理和使用变得前所未有的简单!亮点:1. 模块化设计,支持20+ AI接口,满足多样化需求;2. 扩展性强,提供5大核心扩展功能,提升工作效率;3. 人性化界面,支持暗黑/明亮主题,自由定制布局 No 46. Aperture:可视化Stable Diffusion注意力层的工具。亮点:1. 支持Stable Diffusion 2.1和Flux Dev模型;2. 可视化每个提示词在UNet中的每一层注意力;3. 提供完整的前后端代码,方便二次开发 No 47. [282星]ChatWise:超快AI聊天机器人,为任何LLM加速!亮点:1. 完全离线运行(除需外部API的LLM外);2. 支持多模态输入,包括文本、PDF、音频和图像;3. 提供文本转语音功能,支持OpenAI和ElevenLabs No 48. [138星]Unlock-DeepSeek:深入解读、扩展和复现DeepSeek系列工作,助力AI研究爱好者从0到1掌握前沿LLM技术!亮点:1. 面向从初学者到从业者的广泛受众,提供全方位学习路径;2. 深度拆解MoE、推理模型等关键技术,结合实际案例;3. 提供中文复现教程,降低学习门槛 No 49. [5.4k星]Skim:用Rust编写的超快模糊查找工具,帮你快速找到文件、代码和命令!亮点:1. 交互式模式,动态调用命令,效率翻倍;2. 高效模糊搜索算法,比传统工具快数倍;3. 支持多种自定义选项,如颜色方案、按键绑定,个性化体验满分 No 50. [9.8k星]CuPy:让GPU加速变得简单易用的NumPy/SciPy替代品。亮点:1. 无缝兼容NumPy/SciPy代码,无需修改即可加速;2. 支持CUDA和ROCm平台,适配多种GPU环境;3. 提供低级CUDA功能访问,性能优化更灵活