爱可可-爱生活

https://weibo.com/fly51fly

PRIS BeiJing BUPT prof | Sharing latest AI papers & insights | Join me in embracing the AI revolution! #MachineLearning #AI #Innovation

Results 339 issues of


                                            爱可可-爱生活

爱可可微博热门分享(12.22)

No 1. Tiny LLM zh：从零开始的小参数量中文大语言模型，旨在快速入门学习大模型相关知识，提供公开数据和代码，支持多阶段训练和人类对齐技术 No 2. [LG]《Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective》 No 3. kubesre 多平台镜像加速：提供Docker Hub、GitHub、Google等镜像仓库的加速服务，帮助用户快速下载容器镜像 No 4. Picotron：最小化的分布式训练框架，专为教育目的设计，让你轻松学习并实验预训练Llama类模型 No...

爱可可微博热门分享(12.21)

No 1. 开源机器人大全：汇集了各种完全开源的机器人项目，包括软件、硬件和两者兼备的机器人，是机器人爱好者和开发者的宝贵资源库 No 2. 构建高效的基于大语言模型（LLM）的Agent系统：强调了简单、可组合的设计模式的重要性，并提供了实际的开发建议和最佳实践 No 3. 微信数据宝：一键导出PC微信聊天记录的神器，帮你永久保存微信对话记录，界面友好，操作简单，支持多种消息类型 No 4. [CL] A Survey on LLM Inference-Time Self-Improvement 网页链接本文首次系统性地综述了大型语言模型推理时间自我改进方法，提出了一个新的分类体系，并讨论了其挑战、局限性和伦理影响，为该领域未来的研究提供了宝贵的参考。 No 5. kubesre 多平台镜像加速：提供Docker Hub、GitHub、Google等镜像仓库的加速服务，帮助用户快速下载容器镜像 No 6. Picotron：最小化的分布式训练框架，专为教育目的设计，让你轻松学习并实验预训练Llama类模型 No 7....

爱可可微博热门分享(12.20)

No 1. KeymouseGo：像按键精灵一样的自动化操作软件，能记录你的鼠标和键盘动作，然后自动重复执行，是简化重复性工作的利器 No 2. Genesis：一个为通用机器人和具身AI学习打造的生成世界，集成了物理引擎、仿真平台、渲染系统和数据生成引擎，致力于降低物理仿真门槛、统一先进物理求解器，并减少机器人领域数据收集的人力需求 No 3. [LG] GUI Agents: A Survey 这篇综述文章系统地梳理了GUI Agent的研究现状，提出了一个统一的框架，并指出了该领域未来发展面临的关键挑战，特别是多模态理解、安全隐私以及实时性与复杂性之间的权衡，为该领域未来的研究提供了重要的指导。 ...... No 4. Bodo：高性能的Python计算引擎，专为数据处理和人工智能设计，能够自动并行化Python程序，无需重写代码，大幅提升计算效率 No 5. ImPlot3D：一个直观的3D绘图工具，让你轻松创建和操作3D图表，支持多种图表类型和互动式操作，是数据可视化的得力助手 No 6. 微信数据宝：一键导出PC微信聊天记录的神器，帮你永久保存微信对话记录，界面友好，操作简单，支持多种消息类型 No 7. 智慧收藏家：一个能帮你收藏网页、用AI分类标签、还能跨平台分享的智能工具，让信息管理更高效 No 8....

爱可可微博热门分享(12.19)

No 1. Gemini 英语口语助手：一款基于Google Gemini AI的英语发音练习工具，能实时识别发音并提供反馈和纠正建议，特别适合想要提高英语口语能力的学习者 No 2. GitHub Copilot也能白嫖了！ No 3. Markdown To Poster：一款将Markdown文本转换成视觉吸引的社交媒体图片的React组件，内置在线编辑器，一键部署，支持自定义模板和主题 No 4. ImPlot3D：一个直观的3D绘图工具，让你轻松创建和操作3D图表，支持多种图表类型和互动式操作，是数据可视化的得力助手 No 5. PromptWizard：一个智能的提示优化框架，能够自我进化生成、批评和完善大型语言模型的提示和示例，通过迭代反馈和合成不断改进，提升任务性能 No 6. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议...

爱可可微博热门分享(12.18)

No 1. 最近写了本《走进具身智能》 No 2. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议 No 3. [CL] Reinforcement Learning Enhanced LLMs: A Survey 本文对利用强化学习增强大型语言模型的研究进行了系统性综述，比较了RLHF、RLAIF和DPO等方法的优缺点，并指出了未来研究方向，其中直接偏好优化（DPO）方法的简洁高效以及 ...... No 4. AI 智能体、自动化工作流和 RPA (Robotic...

爱可可微博热门分享(12.17)

No 1. 最近写了本《走进具身智能》 No 2. Hands-on H&M Real-Time Personalized Recommender：一个开源课程，教你如何构建和部署实时个性化推荐系统，专为H&M时尚产品设计，帮助用户获得更精准的购物推荐 No 3. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议 No 4. AI 智能体、自动化工作流和 RPA (Robotic Process Automation) 的区别 No 5....

爱可可微博热门分享(12.16)

No 1. Hands-on H&M Real-Time Personalized Recommender：一个开源课程，教你如何构建和部署实时个性化推荐系统，专为H&M时尚产品设计，帮助用户获得更精准的购物推荐 No 2. TidyBot++：一款开源全向移动操作机器人，专为机器人学习设计，能够支持任意机械臂，实现家庭环境中的多种移动操作任务，其特色在于使用动力转向轮实现全向移动，提高操作灵活性 No 3. SiteOne Crawler：跨平台网站爬虫和分析工具，适用于SEO、安全、可访问性和性能优化，开发者、DevOps、QA工程师和顾问的得力助手 No 4. Syllabus：为强化学习代理设计的课程学习API，让复杂的课程学习方法更易于研究者使用，支持多进程环境同步课程 No 5. lite_llama：轻量级推理框架，专为大型语言模型优化，提供高达3.4倍的加速比，支持最新模型和流式输出 No 6. ComfyUI TRELLIS：3D资产生成工具，能够根据不同的输入提示生成多种格式的3D模型，如辐射场、3D高斯和网格 No 7. Apollo视频理解系列模型：专为视频理解设计的一系列大型多模态模型，能处理视频语言任务，包括长视频理解、时间推理和多轮视频对话，具有高效扩展性和优异的性能表现 No 8. annotateai：自动为论文添加注释的工具，利用大型语言模型帮助读者更好地理解和获取论文中的关键信息...

爱可可微博热门分享(12.15)

No 1. 数学几何自学宝：一本开源的数学书籍，深入浅出地介绍基础拓扑、光滑流形、微分几何、李理论、同调代数和指数理论，特别适合自学者和数学爱好者 No 2. Taming LLMs：实用指南，教你如何驾驭大型语言模型（LLM）的陷阱，通过Python示例和开源解决方案，让你深入了解LLM的限制和实施中的挑战 No 3. TidyBot++：一款开源全向移动操作机器人，专为机器人学习设计，能够支持任意机械臂，实现家庭环境中的多种移动操作任务，其特色在于使用动力转向轮实现全向移动，提高操作灵活性 No 4. 集合了基于大型语言模型（LLM）评估方法的综合调研项目，旨在为开发者、研究者和实践者提供如何有效利用LLM作为评估工具的资源 No 5. [IR]《Semantic Retrieval at Walmart》 No 6. Research Rabbit：一个本地网络研究和报告撰写助手，能够自动深入探索用户定义的任何主题，使用大型语言模型（LLM）生成搜索查询，获取网络搜索结果，并总结信息，填补知识空白 No 7. DeepSeek-VL2：DeepSeek的先进视觉语言模型，在多模态理解方面取得了显著进展，特别是在视觉问题回答、光学字符识别、文档 / 表格 / 图表理解和视觉定位等任务上表现出色...

爱可可微博热门分享(12.14)

No 1. MarkItDown：一键将文件和办公文档转换成Markdown格式，支持PDF、PPT、Word等多种格式，轻松实现文本内容的转换与分析 No 2. 数学几何自学宝：一本开源的数学书籍，深入浅出地介绍基础拓扑、光滑流形、微分几何、李理论、同调代数和指数理论，特别适合自学者和数学爱好者 No 3. Ollama OCR：一款强大的图片文字识别工具，通过先进的视觉语言模型提取图像中的文字，支持多种输出格式，实现高效便捷的文本提取。支持多种视觉模型，如 LLaVA 7B 和 Llama 3.2 Vision，以及多种输出格式，包括 Markdown、纯文本、JSON、结构化数据和键值对 No 4. DeepSeek-VL2：DeepSeek的先进视觉语言模型，在多模态理解方面取得了显著进展，特别是在视觉问题回答、光学字符识别、文档 / 表格 / 图表理解和视觉定位等任务上表现出色 No 5. 《我们到底该如何记录AI行业这一年》 No 6. 机器学习系统设计：一个专注于机器学习系统设计的资源库，提供端到端的示例和设计文档，帮助理解和应用机器学习系统设计的核心概念...

爱可可微博热门分享(12.13)

No 1. 独立开发者工具箱：为独立开发者和出海创业者量身打造的工具集合，收录各类技术栈及工具，助力项目快速启动和高效开发 No 2. PyTorch每步容错工具：帮助保持训练连续性，即使出现错误也不会中断整个训练任务，基于PyTorch的大型训练技术 No 3. MarkItDown：一键将文件和办公文档转换成Markdown格式，支持PDF、PPT、Word等多种格式，轻松实现文本内容的转换与分析 No 4. Ollama OCR：一款强大的图片文字识别工具，通过先进的视觉语言模型提取图像中的文字，支持多种输出格式，实现高效便捷的文本提取。支持多种视觉模型，如 LLaVA 7B 和 Llama 3.2 Vision，以及多种输出格式，包括 Markdown、纯文本、JSON、结构化数据和键值对 No 5. #转发赠书# 携手@博文视点Broadview 送出3本《可解释机器学习：黑盒模型可解释性理解指南（第2版）》 No 6. Diagen：一键生成数据图表的智能工具，通过AI技术将复杂数据转化为美观的图表，支持多种图表类型，让数据可视化变得简单快捷 No 7....