aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(2.2)

Open fly51fly opened this issue 10 months ago • 0 comments

No 1. 用不到2000美元在本地运行671B参数的全量Deepseek-R1模型 No 2. A Little Bit of Reinforcement Learning from Human Feedback：一本深入浅出介绍人工反馈强化学习（RLHF）的免费书。亮点：1. 从多学科角度出发，涵盖经济学、哲学和最优控制理论；2. 详细解读热门算法，助你快速掌握前沿技术；3. 提供完整的PDF下载，学习资源触手可及 No 3. [34k星]ToolJet：低代码开发的“瑞士军刀”，让企业应用搭建像搭积木一样简单。亮点：1. 45+内置组件，快速搭建复杂界面；2. 50+数据源集成，轻松对接各类数据库和API；3. 支持多平台部署，从Docker到Kubernetes，满足各种需求 No 4. DeepSeek现象折射的中国科技创新转型思考：1、创新需要文化土壤和生态环境；2、年轻一代将成为创新主力；3、中国正在从技术追随者向贡献者转变；4、坚持原创创新需要战略定力和文化自信//梁文锋深度访谈，探讨中国公司在科技创新方面的机遇和挑战，这个采访太牛逼了，头脑清晰，冷静自信，值得一看。不少网友表示：这一代终于有领军人物了，相信 ...... No 5. 如何打造一台本地运行Deepseek-R1完整版的服务器？（预算6000美元的全套方案） No 6. [726星]Swark：用AI自动生成代码架构图，让复杂代码一目了然！亮点：1. 免费开源，无额外成本；2. 支持所有语言，无需单独适配；3. 无缝集成GitHub Copilot，无需额外设置 No 7. DeepSeek R1最大的创新不在单个技术点，而是将多项创新有机结合：用GRPO实现高效RL训练、MLA降低计算复杂度、MoE实现大规模参数扩展，这些技术的协同作用使其达到了与闭源模型相当的水平//发布了头条文章：《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 8. 本地运行DeepSeek R1的全面入门指南 No 9. 梁文锋深度访谈，探讨中国公司在科技创新方面的机遇和挑战，这个采访太牛逼了，头脑清晰，冷静自信，值得一看。不少网友表示：这一代终于有领军人物了，相信 ...... No 10. NVIDIA将全量版DeepSeek-R1打包成NIM微服务，在配备8张H200 GPU的服务器上，每秒可处理近4000个Token！可以在自己的基础设施上部署，确保数据安全 No 11. 试了一下OpenAI刚放出来的o3-mini，见图。是一个大模型经常容易犯错误的例子，o3-mini答对了，但奇怪的是，它的最终答案虽然正确，但给出的推理过程错误百出，且不说它的推理过程没有用中文，内容也是很奇怪，比如我的问题问的是小明，它的推理过程中却说是Xiaohong，题目中说是两个哥哥三个妹妹，推理 ...... No 12. [1.7k星]Eko：用自然语言构建生产级智能工作流的框架。亮点：1. 支持从简单命令到复杂多步工作流的生成；2. 兼容浏览器和计算机环境，适用范围广；3. 高开发效率，快速实现复杂任务自动化 No 13. 真这样就是“数据投毒”了，推理过程一致性对模型可信度很重要，刻意混淆会直接影响模型的实际应用价值。//试了一下OpenAI刚放出来的o3-mini，见图。是一个大模型经常容易犯错误的例子，o3-mini答对了，但奇怪的是，它的最终答案虽然正确，但给出的推理过程错误百出，且不说它的推理过程没有用中文，内容也是很奇怪，比如我的问题问的是小明，它的推理过程中却说是Xiaohong，题目中说是两个哥哥三个妹妹，推理 ...... No 14. 你用Ollama跑起来的不是真正的DeepSeek R1 No 15. [547星]smolGPT：从零开始训练自己的迷你大语言模型，轻松搞定小规模文本生成任务。亮点：1. 纯PyTorch实现，代码简洁无冗余；2. 高效训练，支持混合精度和梯度累积；3. 预训练模型仅需18.5小时，快速上手 No 16. [LG]《Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge》 No 17. 正是外部约束和限制，反而可能催生出更有效率和创新性的解决方案，这或许才是AI真正可持续发展之道。//模型时代 ...... No 18. [161星]LinuxPDF：在PDF里运行Linux！亮点：1. 利用RISC-V模拟器，将Linux系统嵌入PDF文件，颠覆传统认知；2. 基于TinyEMU，支持32位和64位系统；3. 仅用浏览器即可运行Linux，无需额外软件 No 19. [699星]RamaLama：让AI工作变得简单无聊的神器。亮点：1. 一键运行AI模型，无需复杂配置；2. 支持多种硬件，包括CPU、GPU和Apple Silicon；3. 支持多种模型注册表，如Hugging Face和Ollama No 20. 发布了头条文章：《一位Meta机器学习研究员的DeepSeek R1技术简报》 No 21. [6.6k星]PR-Agent (Qodo Merge open-source)：AI赋能的代码审查工具，让Pull Request分析、反馈和改进建议自动化！亮点：1. 支持GitHub、GitLab、Bitbucket等多平台；2. 提供代码审查、改进建议、自动更新CHANGELOG等10+功能；3. 适配GPT-4等多模型，效率提升超30% No 22. 我们与AI No 23. 早！[太阳] No 24. [20星]Awesome-Token-Merge-for-MLLMs：为多模态大语言模型（MLLM）提供高效的Token合并、减少、重采样和丢弃方法的精选论文列表 No 25. [122星]100天挑战，用CUDA解锁GPU并行计算的无限可能！亮点：1. 每天一个CUDA内核，从基础到高级，逐步深入；2. 覆盖矩阵运算、深度学习、图像处理等实用场景；3. 详细记录学习过程，附带代码和教程，新手也能轻松上手 No 26. 2025年AI创业指南 No 27. [1.1k星]Perforator：一款专为大规模数据中心设计的集群级持续性能分析工具，帮助开发者轻松定位和解决生产环境中的性能瓶颈。亮点：1. 采用eBPF技术，高效收集内核和用户空间栈信息；2. 支持无帧指针和无调试符号的反向调用；3. 提供强大的查询语言和火焰图界面，直观展示CPU使用情况 No 28. 今日推介(第1669期)：基于重叠通信的流式DiLoCo分布式训练、拒绝指令偏好：一种新的数据筛选方法、基于Thinking-LLM-as-a-Judge的面向评估的规划和推理学习、经常用ChatGPT写作的人能准确鲁棒地检测AI生成文本、面向语言模型高效知识迁移的时间自适应插值蒸馏 ...... No 29. [CV]《LLMs can see and hear without any training》 No 30. 晚安～ [月亮] No 31. [6.5k星]Youki：用Rust语言编写的高性能容器运行时，为容器化应用提供更安全、更高效的运行环境。亮点：1. 内存占用低，比runc低60%；2. 启动速度快，比runc快2倍；3. 支持Rootless模式，提升安全性 No 32. o3-mini发布简评 No 33. 通俗解读 DeepSeek-R1 训练过程 No 34. [81星]pydantic.run：Python浏览器沙盒，让你在浏览器中轻松写代码、跑代码。亮点：1. 无需安装Python，直接在浏览器运行；2. 支持代码分享，可快速创建在线沙盒链接；3. 自动安装依赖，运行代码更便捷 No 35. [106星]Awesome-Multi-Camera-3D-Occupancy-Prediction：一站式多视角3D空间预测资源库，助力自动驾驶与机器人视觉研究。亮点：1. 汇集100+前沿论文与代码，涵盖CVPR、ICCV等顶会；2. 提供最新研究动态，助力快速掌握行业趋势；3. 开源免费，适合学术与工业界 No 36. [199星]Rowfill：开源文档处理平台，为知识工作者量身打造。亮点：1. 高精度OCR，从复杂文档中提取文本、表格和手写内容；2. 自动化工作流，轻松创建定制化任务处理流程；3. 支持本地LLM，保护隐私的同时享受AI的强大能力 No 37. [LG]《Diverse Preference Optimization》 No 38. 英特尔前CEO帕特·基辛格（Pat Gelsinger）谈DeepSeek带给他的三个启示。我确实没想到基辛格会出来发文，他这篇博文可以说客观深刻。从一个芯片/ ...... No 39. [7星]TextArena：基于文本的游戏环境框架，为语言模型评估和强化学习打造。亮点：1. 提供多种文本游戏环境，支持单人、双人和多人模式；2. 支持本地和在线对战，实时评分和Elo排行榜；3. 采用OpenAI Gym风格接口，易于与多种框架集成 No 40. 开源AI是大势所趋 No 41. 关于DeepSeek的十条谣言 No 42. [7星]colmap_cameras_pytorch：用PyTorch实现COLMAP相机模型，让3D重建和相机标定变得轻松又高效！亮点：1. 支持自动微分，可直接优化相机参数；2. 完整支持COLMAP所有相机模型，适配性强；3. 提供实用工具，如相机模型重映射和根求解器 No 43. DeepSeek如何实现10倍效率提升？ No 44. [CL]《People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text》 No 45. [13星]GigaMIDI Dataset：音乐生成领域的超大MIDI数据集，为音乐创作和研究提供强大支持！亮点：1. 拥有143万MIDI文件，530万音轨和18亿音符，数据量超大；2. 新增循环检测和音乐表现力评估指标，助力音乐生成更富有表现力；3. 提供详细元数据和预训练模型，方便研究和应用开发 No 46. 一份值得参考的2025年AI书单1. 《AI Engineering》 No 47. [277星]r1-web：在浏览器中运行DeepSeek-R1 Qwen蒸馏版！亮点：1. 完全在客户端运行，无需服务器支持；2. 使用WebGPU技术，性能卓越；3. 支持DeepSeek-R1-Distill-Qwen-1.5B模型，带来强大的语言处理能力 No 48. 通俗版解读 No 49. 在中国算力受限的背景下，系统软件优化或将成为产业突围的关键路径。我们不仅要提升效率，更要探索一条符合中国现实的发展道路。这需要软硬件深度协同，需要完整的基础软件体系支撑，需要算法到系统的创新。只有这样，才能真正实现“用最少的资源，发挥最大的效能”。//#DeepSeek 百倍算力效能背后的系统革命# 本期《智者访谈》 No 50. [LG]《TAID: Temporally Adaptive Interpolated Distillation for Efficient Knowledge Transfer in Language Models》

Feb 02 '25 14:02 fly51fly