爱可可微博热门分享(11.26)
No 1. 密歇根大学工程数学笔记:为工程师准备的实用数学参考手册,包含大量常用数学公式、定义和标准化处理,旨在简化数学公式的查找和使用 No 2. GraphRAG-SDK:一个面向图数据检索增强生成(RAG)的开发工具包,提供自动化知识图谱构建和管理功能,支持OpenAI等LLM模型集成,具备本体管理、知识图谱构建、多智能体协作等特性,可用于高级数据查询和知识图谱应用开发 No 3. RAGLite:一个轻量级Python RAG工具... No 4. OmniSearch:多模态RAG检索增强系统,首创自适应规划代理,能根据问题解决阶段和当前检索内容实时规划检索动作。项目包含全新的动态VQA数据集(Dyn-VQA),可用于评估多模态RAG方法在真实场景中的表现。支持中英双语,已在ModelScope上线开放API No 5. firecrawl-simple:精简版网站爬虫工具,专为自托管优化的网页抓取和转换工具。可将任意网站内容抓取并转换为LLM友好的markdown格式,移除了原版中的计费逻辑和AI功能,支持批量爬取和格式转换,适合需要构建AI训练数据的场景 No 6. #转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 7. Saplings:一个强大的AI智能体框架,基于树搜索算法提升AI代理的决策能力。支持多种搜索算法如蒙特卡洛树搜索(MCTS)、A*和贪心最佳优先搜索,可帮助AI代理探索和评估不同的工具使用路径,避免错误并做出更好的决策。仅需两行代码即可为代理添加搜索功能 No 8. aisuite:一个统一的生成式AI接口工具,为开发者提供标准化的多LLM调用接口。支持OpenAI、Anthropic、Azure、Google等主流AI服务商,使用类似OpenAI的接口设计,让开发者可以无缝切换不同的LLM提供商进行测试和对比,无需修改代码 No 9. llama-ocr:基于Llama 3.2视觉模型的文档OCR工具库,可将图像文档转换为Markdown格式。使用Together AI的免费Llama 3.2端点进行图像解析,支持不同规模的模型选择(免费版、11B和90B),提供npm包方便集成,未来将支持PDF文档和JSON输出 No 10. #转发赠书# 携手@异步图书 送出5本《AI群星闪耀时》 No 11. Awesome-Scene-Graph-Generation:一个场景图生成(SGG)相关论文的精选集,包含了图像、视频、音频、3D等多模态场景图生成研究论文,并归纳了场景图数据集、评估指标以及在图像检索、图像生成等领域的应用 No 12. imscore:一个轻量级的图像评分库,集成了多种可微分的图像美学和偏好评分模型,包括PickScore、MPS、HPSv2、LAION等主流评分器,可用于生成模型的基准测试和后期训练优化,支持图像与文本的多模态评分 No 13. [LG]《Understanding LLM Embeddings for Regression》 No 14. PearAI:一个集成多种顶级AI工具的统一平台,提供统一的用户界面让用户便捷使用不同AI工具,包含VSCode fork和Continue fork两大核心功能模块,支持AI代码编辑和AI聊天功能,基于TypeScript/Electron.js开发 No 15. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 16. openai-workers-relay:Cloudflare开发的OpenAI实时API中继服务器,基于Cloudflare Workers部署。允许前端应用无需共享OpenAI API密钥即可连接使用OpenAI服务,支持WebSocket连接,提供本地开发和生产部署方案,可自定义授权和速率限制等安全措施 No 17. 中国独立开发者项目列表:一个展示中国独立开发者作品的精选合集,收录了1000多个优秀项目,涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理,每个项目都包含开发者、项目名称、链接和简介等详细信息 No 18. 深度思考系列第一篇:《AI Coding的范式革命:从工具演进到认知重构》 No 19. [CL]《Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics》 No 20. nGPT:NVIDIA开发的标准化Transformer模型,基于nanoGPT改进。其主要特点是通过在超球面上的表示学习和标准化过程来提升训练效率,在1k、4k和8k上下文长度设置中分别实现了4倍、10倍的训练加速。使用RoPE位置编码和SwiGLU激活函数,对低精度运算具有更好的鲁棒性 No 21. rectified-flow:基于PyTorch从零实现的Flow Matching生成模型框架,支持MNIST数据集的有条件和无条件生成。包含MiniUnet模型结构,支持classifier-free guidance,可在CPU上运行。提供了完整的训练推理代码和详细注释,适合学习和理解Flow Matching算法原理 No 22. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 23. [LG]《Safe Multi-Agent Reinforcement Learning with Convergence to Generalized Nash Equilibrium》 No 24. EchoMimicV2:开源人体动画生成模型,支持通过音频驱动半身人物生成逼真的动画效果。具有引人注目的动作表现力、简化的生成流程和半身人物动画特点,可实现音频驱动的人物说话、表情和肢体动作的协调一致 No 25. PostBot 3000:开源的AI智能体实现示例项目,展示如何构建强大的AI代理系统并实现响应流式处理和生成内容。使用LangGraph和FastAPI构建后端,Next.js和TailwindCSS构建前端,集成了Clerk认证和Upstash Redis,为开发类似AI应用提供完整参考 No 26. Subjects200K:大规模图像对数据集,包含20万对保持主体一致但场景背景不同的图像对。该数据集是OminiControl项目的组成部分,每个样本包含主体描述、左右两张512x512的图像、对应的文本描述,以及合并后的1024x512图像 No 27. AI前沿:大模型、视觉控制与安全多智能体 No 28. 晚安~ [月亮] No 29. 深度思考系列第三篇:深度分析AI引发的维度重构 No 30. Voice-Lab:一个全面的语音智能体测试和评估框架,帮助开发者优化LLM驱动的语音助手。支持多种语言模型和提示词的对比测试,可自定义评估指标,实现模型迁移和成本优化,能够系统地测试不同场景下的代理表现,特别适合语音助手的开发和迭代优化 No 31. [CV]《OminiControl: Minimal and Universal Control for Diffusion Transformer》 No 32. Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决 No 33. 大型语言模型并非通过算法或记忆来进行算术推理,而是通过组合许多简单的、记忆的启发式规则,形成一个“启发式方法的集合”来实现,这一机制在训练早期就已出现,并逐步完善。 No 34. RePlay:一个全面的端到端推荐系统框架,集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、全面的评估指标、模型集成和混合,以及从离线实验到在线生产的无缝切换。支持CPU/GPU、分布式计算,适用于大规模推荐系统的构建和评估 No 35. Rustfinity:一个专注于Rust编程语言学习和实践的开源教育平台,提供系统化的学习内容和实战挑战。该项目包含CLI工具、编程挑战题集等模块,旨在帮助开发者以更有效的方式掌握Rust语言 No 36. LLM资源中心:为大语言模型提供一站式学习资源的平台,包含免费资源、视频教程、学术课程、研究论文等 No 37. Model Context Protocol Servers:一个面向大语言模型的工具和数据源访问协议服务器集合。提供多种预置服务器实现,包括文件系统、GitHub、Google Drive、PostgreSQL等集成,让LLM能够以安全可控的方式访问各类外部资源。支持TypeScript和Python两种SDK开发 No 38. 早![太阳] No 39. AutoGluon Assistant:强大的零代码机器学习助手,将AutoGluon的自动化机器学习能力与大语模结合,用户只需使用自然语言描述问题并提供数据,即可获得高精度的ML解决方案。支持Web UI和CLI两种使用方式,可自动完成从数据处理到模型训练的全流程 No 40. indie-hacker-tools-plus:专为独立开发者打造的精选技术栈和工具合集。涵盖Web开发模板、前后端框架、数据库、支付系统、部署工具等全方位资源。特色是注重效率和成本优化,收录经过市场验证的热门工具,包含详细的使用场景和推荐说明 No 41. XGrammar 通过巧妙地将 LLM 词汇表标记分类、利用自适应缓存和持久化堆栈等技术,并与 LLM 推理引擎协同设计,显著提升了大型语言模型结构化生成的效率,实现了近乎零开销的结构化输出。 No 42. MCTS:一个用Python实现的蒙特卡洛树搜索(Monte Carlo Tree Search)算法库,包含了基础的MCTS实现和一些实验性游戏示例。该项目提供了一个简单的数值累加游戏作为测试用例,可用于学习和理解MCTS算法的工作原理 No 43. OminiControl 提出了一种参数高效且通用的框架,通过多模态注意力机制和自适应位置嵌入,在Diffusion Transformer模型中实现了对空间对齐和非空间对齐图像条件的统一控制,并通过公开发布Subjects200K数据集推动了主题一致性图像生成领域的研究,取得了显著的性能提升。//[CV]《OminiControl: Minimal and Universal Control for Diffusion Transformer》 No 44. Article2Card:一个实用的文章转卡片工具,能将长文自动转换为结构化的摘要卡片和图片。基于Kimi AI进行内容重构和总结,支持自定义背景图片,可快速生成适合社交媒体分享的精美内容卡片 No 45. torchrunx:一个简化PyTorch分布式训练的工具库,能够轻松地将PyTorch函数部署到多台机器和GPU上。特点是支持Pythonic风格的API,可以从worker返回对象,支持SLURM集成,提供细粒度的日志和环境变量控制,无需手动设置分布式初始化和SSH连接 No 46. 今日推介(第1601期):理解面向回归的LLM嵌入、扩散Transformer的最小通用控制 、灵活高效的大型语言模型结构化生成引擎、语言模型靠启发式方法集合求解算术问题、收敛于广义纳什均衡的安全多智能体强化学习公·众·号:爱可可爱生活 ...... No 47. DRL-Pytorch:最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法。包括从入门级的Q-learning到高阶的SAC、TD3等,每个算法都配有详细文档、完整训练曲线和论文引用。项目还提供了丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文等 No 48. pglite-fusion:一个创新的PostgreSQL扩展,允许在PostgreSQL表中嵌入SQLite数据库。通过这种方式优雅地解决了多租户架构问题。支持PostgreSQL 12-17版本,提供完整的SQLite操作API,包括数据库初始化、查询执行和数据提取等功能 No 49. AutoFlow:开源的图谱型对话知识库工具,基于TiDB矢量存储构建。具备类Perplexity的对话式搜索功能、网站爬虫采集、知识图谱编辑以及JavaScript嵌入等特性。支持文档站点的智能爬取和检索,可通过可视化界面编辑知识图谱,适合构建智能客服和知识库系统 No 50. Social_Science:一个创新的多智能体科研合作系统,通过模拟科研团队的组建和科研想法生成过程,实现端到端的科研协作。该系统基于真实数据进行角色扮演,能够改进科研创意生成质量,其模拟结果与科学研究领域的重要发现相符,如新团队更容易产生创新性研究等