爱可可-爱生活

Results 339 issues of 爱可可-爱生活

No 1. Tiny LLM zh:从零开始的小参数量中文大语言模型,旨在快速入门学习大模型相关知识,提供公开数据和代码,支持多阶段训练和人类对齐技术 No 2. [LG]《Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective》 No 3. kubesre 多平台镜像加速:提供Docker Hub、GitHub、Google等镜像仓库的加速服务,帮助用户快速下载容器镜像 No 4. Picotron:最小化的分布式训练框架,专为教育目的设计,让你轻松学习并实验预训练Llama类模型 No...

No 1. 开源机器人大全:汇集了各种完全开源的机器人项目,包括软件、硬件和两者兼备的机器人,是机器人爱好者和开发者的宝贵资源库 No 2. 构建高效的基于大语言模型(LLM)的Agent系统:强调了简单、可组合的设计模式的重要性,并提供了实际的开发建议和最佳实践 No 3. 微信数据宝:一键导出PC微信聊天记录的神器,帮你永久保存微信对话记录,界面友好,操作简单,支持多种消息类型 No 4. [CL] A Survey on LLM Inference-Time Self-Improvement 网页链接 本文首次系统性地综述了大型语言模型推理时间自我改进方法,提出了一个新的分类体系,并讨论了其挑战、局限性和伦理影响,为该领域未来的研究提供了宝贵的参考。 No 5. kubesre 多平台镜像加速:提供Docker Hub、GitHub、Google等镜像仓库的加速服务,帮助用户快速下载容器镜像 No 6. Picotron:最小化的分布式训练框架,专为教育目的设计,让你轻松学习并实验预训练Llama类模型 No 7....

No 1. KeymouseGo:像按键精灵一样的自动化操作软件,能记录你的鼠标和键盘动作,然后自动重复执行,是简化重复性工作的利器 No 2. Genesis:一个为通用机器人和具身AI学习打造的生成世界,集成了物理引擎、仿真平台、渲染系统和数据生成引擎,致力于降低物理仿真门槛、统一先进物理求解器,并减少机器人领域数据收集的人力需求 No 3. [LG] GUI Agents: A Survey 这篇综述文章系统地梳理了GUI Agent的研究现状,提出了一个统一的框架,并指出了该领域未来发展面临的关键挑战,特别是多模态理解、安全隐私以及实时性与复杂性之间的权衡,为该领域未来的研究提供了重要的指导。 ...... No 4. Bodo:高性能的Python计算引擎,专为数据处理和人工智能设计,能够自动并行化Python程序,无需重写代码,大幅提升计算效率 No 5. ImPlot3D:一个直观的3D绘图工具,让你轻松创建和操作3D图表,支持多种图表类型和互动式操作,是数据可视化的得力助手 No 6. 微信数据宝:一键导出PC微信聊天记录的神器,帮你永久保存微信对话记录,界面友好,操作简单,支持多种消息类型 No 7. 智慧收藏家:一个能帮你收藏网页、用AI分类标签、还能跨平台分享的智能工具,让信息管理更高效 No 8....

No 1. Gemini 英语口语助手:一款基于Google Gemini AI的英语发音练习工具,能实时识别发音并提供反馈和纠正建议,特别适合想要提高英语口语能力的学习者 No 2. GitHub Copilot也能白嫖了! No 3. Markdown To Poster:一款将Markdown文本转换成视觉吸引的社交媒体图片的React组件,内置在线编辑器,一键部署,支持自定义模板和主题 No 4. ImPlot3D:一个直观的3D绘图工具,让你轻松创建和操作3D图表,支持多种图表类型和互动式操作,是数据可视化的得力助手 No 5. PromptWizard:一个智能的提示优化框架,能够自我进化生成、批评和完善大型语言模型的提示和示例,通过迭代反馈和合成不断改进,提升任务性能 No 6. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议...

No 1. 最近写了本《走进具身智能》 No 2. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议 No 3. [CL] Reinforcement Learning Enhanced LLMs: A Survey ​​​ 本文对利用强化学习增强大型语言模型的研究进行了系统性综述,比较了RLHF、RLAIF和DPO等方法的优缺点,并指出了未来研究方向,其中直接偏好优化(DPO)方法的简洁高效以及 ...... No 4. AI 智能体、自动化工作流和 RPA (Robotic...

No 1. 最近写了本《走进具身智能》 No 2. Hands-on H&M Real-Time Personalized Recommender:一个开源课程,教你如何构建和部署实时个性化推荐系统,专为H&M时尚产品设计,帮助用户获得更精准的购物推荐 No 3. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议 No 4. AI 智能体、自动化工作流和 RPA (Robotic Process Automation) 的区别 No 5....

No 1. Hands-on H&M Real-Time Personalized Recommender:一个开源课程,教你如何构建和部署实时个性化推荐系统,专为H&M时尚产品设计,帮助用户获得更精准的购物推荐 No 2. TidyBot++:一款开源全向移动操作机器人,专为机器人学习设计,能够支持任意机械臂,实现家庭环境中的多种移动操作任务,其特色在于使用动力转向轮实现全向移动,提高操作灵活性 No 3. SiteOne Crawler:跨平台网站爬虫和分析工具,适用于SEO、安全、可访问性和性能优化,开发者、DevOps、QA工程师和顾问的得力助手 No 4. Syllabus:为强化学习代理设计的课程学习API,让复杂的课程学习方法更易于研究者使用,支持多进程环境同步课程 No 5. lite_llama:轻量级推理框架,专为大型语言模型优化,提供高达3.4倍的加速比,支持最新模型和流式输出 No 6. ComfyUI TRELLIS:3D资产生成工具,能够根据不同的输入提示生成多种格式的3D模型,如辐射场、3D高斯和网格 No 7. Apollo视频理解系列模型:专为视频理解设计的一系列大型多模态模型,能处理视频语言任务,包括长视频理解、时间推理和多轮视频对话,具有高效扩展性和优异的性能表现 No 8. annotateai:自动为论文添加注释的工具,利用大型语言模型帮助读者更好地理解和获取论文中的关键信息...

No 1. 数学几何自学宝:一本开源的数学书籍,深入浅出地介绍基础拓扑、光滑流形、微分几何、李理论、同调代数和指数理论,特别适合自学者和数学爱好者 No 2. Taming LLMs:实用指南,教你如何驾驭大型语言模型(LLM)的陷阱,通过Python示例和开源解决方案,让你深入了解LLM的限制和实施中的挑战 No 3. TidyBot++:一款开源全向移动操作机器人,专为机器人学习设计,能够支持任意机械臂,实现家庭环境中的多种移动操作任务,其特色在于使用动力转向轮实现全向移动,提高操作灵活性 No 4. 集合了基于大型语言模型(LLM)评估方法的综合调研项目,旨在为开发者、研究者和实践者提供如何有效利用LLM作为评估工具的资源 No 5. [IR]《Semantic Retrieval at Walmart》 No 6. Research Rabbit:一个本地网络研究和报告撰写助手,能够自动深入探索用户定义的任何主题,使用大型语言模型(LLM)生成搜索查询,获取网络搜索结果,并总结信息,填补知识空白 No 7. DeepSeek-VL2:DeepSeek的先进视觉语言模型,在多模态理解方面取得了显著进展,特别是在视觉问题回答、光学字符识别、文档 / 表格 / 图表理解和视觉定位等任务上表现出色...

No 1. MarkItDown:一键将文件和办公文档转换成Markdown格式,支持PDF、PPT、Word等多种格式,轻松实现文本内容的转换与分析 No 2. 数学几何自学宝:一本开源的数学书籍,深入浅出地介绍基础拓扑、光滑流形、微分几何、李理论、同调代数和指数理论,特别适合自学者和数学爱好者 No 3. Ollama OCR:一款强大的图片文字识别工具,通过先进的视觉语言模型提取图像中的文字,支持多种输出格式,实现高效便捷的文本提取。支持多种视觉模型,如 LLaVA 7B 和 Llama 3.2 Vision,以及多种输出格式,包括 Markdown、纯文本、JSON、结构化数据和键值对 No 4. DeepSeek-VL2:DeepSeek的先进视觉语言模型,在多模态理解方面取得了显著进展,特别是在视觉问题回答、光学字符识别、文档 / 表格 / 图表理解和视觉定位等任务上表现出色 No 5. 《我们到底该如何记录AI行业这一年》 No 6. 机器学习系统设计:一个专注于机器学习系统设计的资源库,提供端到端的示例和设计文档,帮助理解和应用机器学习系统设计的核心概念...

No 1. 独立开发者工具箱:为独立开发者和出海创业者量身打造的工具集合,收录各类技术栈及工具,助力项目快速启动和高效开发 No 2. PyTorch每步容错工具:帮助保持训练连续性,即使出现错误也不会中断整个训练任务,基于PyTorch的大型训练技术 No 3. MarkItDown:一键将文件和办公文档转换成Markdown格式,支持PDF、PPT、Word等多种格式,轻松实现文本内容的转换与分析 No 4. Ollama OCR:一款强大的图片文字识别工具,通过先进的视觉语言模型提取图像中的文字,支持多种输出格式,实现高效便捷的文本提取。支持多种视觉模型,如 LLaVA 7B 和 Llama 3.2 Vision,以及多种输出格式,包括 Markdown、纯文本、JSON、结构化数据和键值对 No 5. #转发赠书# 携手@博文视点Broadview 送出3本《可解释机器学习:黑盒模型可解释性理解指南(第2版)》 No 6. Diagen:一键生成数据图表的智能工具,通过AI技术将复杂数据转化为美观的图表,支持多种图表类型,让数据可视化变得简单快捷 No 7....