爱可可微博热门分享(8.14)
No 1. Awesome Robotics 3D:精选的机器人3D视觉论文列表,专注于机器人领域的大型模型(LLMs/VLMs),包含相关论文、代码和相关网站 No 2. SD变现宝:一键将comfyui工作流转换为小程序的自动化工具,支持微信、抖音等平台的小程序和H5页面,实现快速变现 No 3. In-browser Postgres with AI Assistant:浏览器内PostgreSQL沙盒环境,配备AI辅助功能,实现即时创建无限数量的数据库,支持CSV文件拖放导入、生成和导出报告、构建数据库图表等 No 4. Tapir模型推理助手:基于Pytorch的轻量级实时追踪模型,优化了模型推理速度,适用于视频和摄像头输入,简化了深度学习模型在实时追踪任务中的应用 No 5. MathLive:数学公式编辑的Web组件,提供易于使用的数学公式输入界面,支持多种数学表达式格式输出,适用于移动端设备和屏幕阅读器 No 6. Dify智能助手:微信生态下的智能对话机器人,集成了LLMOps平台Dify,支持智能助手模式,调用工具和知识库,实现Dify工作流 No 7. ROSA机器人操作系统Agent:用于自然语言查询的AI Agent,与基于ROS的机器人系统交互,支持生成系统报告、解析ROS日志文件,可适应不同机器人和环境,简化机器人研究与开发过程 No 8. #免费##抽奖# @博文视点Broadview 送出3本《AIGC大语言模型轻松学: 从个人应用到企业实践》 No 9. 像素艺术编辑助手:支持动画和脚本的轻量级像素画编辑器,适用于Windows、macOS和Linux系统,满足独立游戏开发者和其他艺术创作者的需求,简化快速迭代创作过程 No 10. AI科学家:全面自动化开放科学发现的系统,使基础模型如大型语言模型能够独立进行科学研究 No 11. 电子书3D书架:为电子书浏览设计的动态3D书架,自动从Calibre图书库提取元数据和封面图,根据封面图像的长宽比确定书籍高度,所有书籍宽度一致,使用页数数据(如果可用)确定书籍厚度 No 12. OceanBase数据库:企业级分布式关系型数据库,具有高可用性、高性能、水平扩展性和对SQL标准的兼容性,由蚂蚁集团完全自主研发 No 13. RAGoon:用于批量生成嵌入、极速基于Web的RAG和量化索引处理的高级库,提升语言模型性能,通过搜索查询、网页抓取和数据增强技术提供上下文相关信息 No 14. Shell360:跨平台的SSH客户端,支持多操作系统和多种SSH密钥,提供主题切换和终端个性化设置,参与Beta测试计划 No 15. 今日推介(第1497期):半监督单样本模仿学习、用相互推理提升小型语言模型的推理能力、非线性独立表示的持续学习、全自动开放式科学发现研究、利用机器人具身的策略学习 ...... No 16. SpecOS:从零开始的x86_64操作系统内核,仍在早期开发阶段 No 17. AI Agent服务工具包:基于LangGraph、FastAPI和Streamlit构建的AI Agent服务完整工具包,提供从Agent定义到用户界面的完整架构蓝图,简化了使用LangGraph框架构建项目的过程 No 18. [LG]《Semi-Supervised One-Shot Imitation Learning》 No 19. [RO]《Body Transformer: Leveraging Robot Embodiment for Policy Learning》 No 20. 1.5-Pints:9天内使用高质量数据预训练的紧凑型大型语言模型,旨在成为与Apple OpenELM和Microsoft Phi相当的AI助手 No 21. Omni Engineer:集成AI能力的开发者控制台,提升开发工作流程的智能助手,支持代码查询、文件管理、网页搜索和图像处理等功能 No 22. [LG]《Continual Learning of Nonlinear Independent Representations》 No 23. MacFLUX:基于Huggingface Diffusers实现的本地Mac机器学习模型,专为Apple MLX设计,实现高效图像生成 No 24. [CL]《Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers》 No 25. Llama Parse CLI:基于LlamaIndex Parser的非官方命令行界面工具,用于解析文档,支持多种格式输出,简化文档解析和信息提取过程 No 26. [CL]《HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction》 No 27. [CL] Med42-v2: A Suite of Clinical LLMs 介绍了Med42-v2临床语言模型系列,使用专业医学数据和多阶段偏好校准进行了定制化优化,在医学基准测试上表现优异,旨在提供可靠的医疗环境智能助手。 ...... No 28. [LG]《The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery》 No 29. 几篇论文实现代码 No 30. [CV] FruitNeRF: A Unified Neural Radiance Field based Fruit ...... No 31. 欢迎收听「走近大模型」系列节目,带你领略大语言模型的神奇魅力! 第九集:通才 or 专才?大模型的评估与选择 ...... No 32. DerwenAI知识图谱构建助手:从非结构化数据源构建知识图谱的自动化工具,使用开源库和深度学习模型,简化知识图谱构建过程并提高数据质量 No 33. 研究了变分自编码器框架下基于顺序到达分布的连续非线性因果表示学习问题,并提出了一种新的方法在理论和实验上证明了其可识别性的渐进提升性质。//[LG]《Continual Learning of Nonlinear Independent Representations》 No 34. Timelinize:个人数据整合与时间线管理工具,可将来自不同账户和设备的各类数据汇总至单一的时间线,实现数据的本地化存储与永久保存 No 35. 3D视觉定位精选资源库:相关论文、方法和资源列表,为3D视觉研究社区提供了丰富的参考和指导 No 36. 晚安~ [月亮] No 37. unibench:用于评估视觉语言模型在多样化基准测试中的鲁棒性的Python库,提供60种VLM模型和40种评估基准的全面工具和脚本,支持大规模模型和大规模训练样本,简化视觉语言模型的评估过程 No 38. 轻量级多DNS提供商动态DNS更新器:支持周期性更新DNS记录的容器化程序,提供Web界面管理,适用于多种DNS服务商 No 39. Python-WebUI:使用任意网页浏览器作为GUI,以Python作为后端,HTML5作为前端的轻量级Python包,实现跨平台和多浏览器的Web界面开发 No 40. 欢迎收听「爱可可AI前沿快报」,用最通俗的语言,介绍最前沿的学术进展,思考新成果带给我们的启发,即使你是中学生,也能有所收获! ...... No 41. [CL] FLEURS-R: A Restored Multilingual Speech Corpus for Generation ...... No 42. 早![太阳] No 43. 提出使用LLM实现端到端自动机器学习科研框架,取得初步成果,但仍存在很多局限性。//[LG]《The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery》 No 44. Sonic Visualiser:音乐音频可视化、分析与注释的跨平台桌面应用,支持多种音频格式,提供波形图、频谱图等视图,以及丰富的音频处理功能 No 45. 多智能体客户服务系统实现,通过分离的Agent来完成复杂的任务,如用户认证、查询股票价格、查询账户余额和转账等 No 46. ComfyUI AI图像生成工作流:提供一系列用于生成AI图像的通用工作流程和资源,支持使用ComfyUI进行高效图像创作,包含多种优化技术和模型,简化AI图像生成过程 No 47. GitHub Copilot编程助手使用心得 No 48. LLM-Distillery:大语言模型蒸馏的自动化管道,支持单教师和多教师模型的蒸馏,适用于指令和完成文本的蒸馏,支持离线蒸馏和跨平台操作,具备丰富的自定义选项 No 49. 自动驾驶车辆路径规划:使用约束iLQR算法进行路径规划,优化车辆动态和安全约束 No 50. free-music-demixer:免费的客户端静态网站,用于音乐分离(也称为音源分离),使用了Open-Unmix的AI模型(UMX-L权重)