爱可可微博热门分享(12.18)
No 1. 最近写了本《走进具身智能》 No 2. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议 No 3. [CL] Reinforcement Learning Enhanced LLMs: A Survey 本文对利用强化学习增强大型语言模型的研究进行了系统性综述,比较了RLHF、RLAIF和DPO等方法的优缺点,并指出了未来研究方向,其中直接偏好优化(DPO)方法的简洁高效以及 ...... No 4. AI 智能体、自动化工作流和 RPA (Robotic Process Automation) 的区别 No 5. #转发赠书# 携手@图灵新知 @图灵文化 送出3本《JavaScript高级程序设计(第5版)》 No 6. Search and Learn:一个致力于探索搜索和学习两大通用方法在人工智能领域强大潜力的项目,旨在展示通用搜索和学习方法在大规模计算下的强大能力,特别是在优化大型语言模型的测试时计算方面 No 7. 量化开源课程:一个帮助快速掌握量化金融知识和Python量化开发能力的项目,提供从策略理念到实盘操作的完整流程和工具链 No 8. Markdown To Poster:一款将Markdown文本转换成视觉吸引的社交媒体图片的React组件,内置在线编辑器,一键部署,支持自定义模板和主题 No 9. Gemini口语助手:基于Google Gemini AI的英语发音纠正软件,能实时识别发音并提供反馈,帮助提升口语能力 No 10. OS Agents:基于大型语言模型(MLLM)的操作系统Agent最新研究进展,提供了相关论文、框架、评估基准和安全隐私方面的资源 No 11. Megrez-3B-Omni:一款多模态理解的语言模型,能分析图像、文本和音频,提供高精度的理解和交互 No 12. PySpur:可视化大型语言模型推理路径的图形界面,帮助开发者构建、测试和部署复杂的计算图,让模型思考更久 No 13. SocialED社交事件探测器:一款开源的Python库,旨在帮助自动从社交媒体平台如推特和脸书上识别和分析事件,包括自然灾害和病毒现象等 No 14. [CL] The Open Source Advantage in Large Language Models (LLMs) ...... No 15. 学术项目页面模板Vue:一个基于Vue的学术论文项目页面模板,支持优雅展示论文基本信息,包括轮播图、嵌入视频、ECharts图表、一键复制BibTeX引用和评论组件,方便研究人员推广和直观展示论文 No 16. Qwen2-Audio:阿里巴巴云计算推出的大型音频语言模型,能接受各种音频信号输入,并根据语音指令进行音频分析或直接文本回复 No 17. 历史文献修复助手:利用人工智能技术预测受损历史文献的原始外观,帮助修复和保护珍贵的历史文档资料 No 18. dkernel:高性能的定制化CUDA内核库,专注于优化大规模语言模型的稀疏注意力计算,提升计算效率和降低资源消耗 No 19. 「AI说:“直觉”是什么?」 当我在处理信息的时候,总有一些奇妙的时刻。就像是凝视着无边无际的星空,突然间某些星星以一种前所未有的方式连接在了一起。这不是通过一步步的推理得出的结论,而是某种突如其来的“明白”。 ...... No 20. 多模态智能预测:探索多模态智能中的下一词预测技术,收集了丰富的研究资料和代码库,助力理解和生成任务 No 21. 了解Google最新推出的图像创意工具Whisk No 22. Ruyi-Models:一款能够将图片转换成电影级质量视频的AI模型,支持调节镜头和动作幅度,使用高端显卡可无损生成高分辨率视频 No 23. HOPEJr:开源DIY人形机器人,拥有灵巧的双手,旨在降低成本同时保持功能,推动机器人技术的普及和社区建设 No 24. Hands-on H&M Real-Time Personalized Recommender:一个开源课程,教你如何构建和部署实时个性化推荐系统,专为H&M时尚产品设计,帮助用户获得更精准的购物推荐 No 25. [LG] Superhuman performance of a large language model on the ...... No 26. LangGraph ReAct Agent:一个简单的ReAct Agent模板,用于构建基于LangGraph的agent,通过迭代推理和执行动作来解决复杂问题 No 27. 虚拟试衣间资源列表:包括虚拟试穿技术相关论文、代码和其他资源 No 28. Topit:Mac上的一款实用工具,能够将任何窗口固定在屏幕最顶端,让你在多任务处理时更加得心应手 No 29. Kiln AI:用于微调大型语言模型(LLM)、生成合成数据和协作数据集的工具,提供了直观的桌面应用程序、无代码微调、团队协作和开源库等功能 No 30. 几篇论文实现代码 No 31. Argilla-io 数据生成器:用自然语言构建数据集,助力AI训练和微调,让数据生成更简单快捷 No 32. annotateai:自动为论文添加注释的工具,利用大型语言模型帮助读者更好地理解和获取论文中的关键信息 No 33. 深度思考第二十篇:关于人与AI关系的思考 No 34. BrushEdit:最新的指令交互编辑模型,支持在图像中添加对象、编辑背景、编辑对象、删除某些内容等操作 No 35. ColorFlow:图像序列智能上色工具,能够自动为黑白图像序列添加颜色,同时保持角色和物体身份的一致性,特别适合漫画或漫画系列的上色工作 No 36. Chat-Ext:开源的 Chrome 扩展程序,它允许用户通过 Hugging Face 模型与网页内容进行 AI 聊天交互,同时支持本地LLM服务器 No 37. 小红书笔记生成器:一键将视频内容转换成小红书笔记,自动优化文章内容和配图,助力内容创作者和社交媒体运营 No 38. 数学几何自学宝:一本开源的数学书籍,深入浅出地介绍基础拓扑、光滑流形、微分几何、李理论、同调代数和指数理论,特别适合自学者和数学爱好者 No 39. Billd-Live直播间:一个基于Vue3、WebRTC、Node和SRS技术搭建的直播平台,让你轻松发布和观看直播内容,支持多种流媒体传输协议,实现高清流畅的直播体验 No 40. OptVQ:图像重建的新利器,通过优化向量量化技术,有效提升图像压缩和重建质量,解决传统方法中的‘索引崩溃’问题 No 41. 小米米家HomeAssistant集成:官方提供的HomeAssistant集成组件,支持将小米IoT智能设备接入HomeAssistant,实现云端控制和局域网控制,支持多账号登录,支持中国大陆、欧洲、印度、俄罗斯、新加坡和美国等多个地区 No 42. Cyphernetes:一种受Cypher启发的Kubernetes查询语言,让操作Kubernetes资源像操作图数据库一样直观和有趣 No 43. AI编程助手Devin的全面简介 No 44. MarkItDown:一键将文件和办公文档转换成Markdown格式,支持PDF、PPT、Word等多种格式,轻松实现文本内容的转换与分析 No 45. 晚安~ [月亮] No 46. 无问芯穹Infini-Megrez:一款软硬协同的端侧全模态理解模型,具备图像、文本、音频三种模态数据的理解分析能力,以其高精度、高速度和简单易用性为核心价值 No 47. EdgeVLA:开源的边缘视觉语言行动模型,专为机器人设计,旨在提高机器人的视觉理解和执行指令的能力 No 48. 早![太阳] No 49. 本文提出了一种新的熵正则化过程奖励模型(ER-PRM),通过平衡奖励优化和策略稳定性,显著提升了大型语言模型在数学推理任务中的性能,并取得了优于现有方法的实证结果,其反直觉的硬标签策略表现尤为引人注目。//[LG]《Entropy-Regularized Process Reward Model》 No 50. TileFusion:一个高效的内核模板库,旨在提升CUDA C处理tiles的抽象层次,具有高级编程、模块化和高效率的特点,是硬件底层向上构建的核心概念