爱可可微博热门分享(11.25)
No 1. 密歇根大学工程数学笔记:为工程师准备的实用数学参考手册,包含大量常用数学公式、定义和标准化处理,旨在简化数学公式的查找和使用 No 2. LLM资源中心:为大语言模型提供一站式学习资源的平台,包含免费资源、视频教程、学术课程、研究论文等 No 3. whoosh-reloaded:一个纯Python实现的全文索引和搜索库,是Whoosh项目的活跃维护分支。具有快速索引和检索、字段索引搜索、可插拔评分算法、强大的查询语言、拼写检查等特性,适合需要纯Python解决方案的场景,无需编译原生库 No 4. 中国独立开发者项目列表:一个展示中国独立开发者作品的精选合集,收录了1000多个优秀项目,涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理,每个项目都包含开发者、项目名称、链接和简介等详细信息 No 5. RAGLite:一个轻量级Python RAG工具... No 6. #转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 7. Open-Pandora:开源视频生成模型,支持实时文本控制生成视频,可生成最长10秒的高质量视频内容,支持320×512和576×1024分辨率,基于Webvid数据集训练,提供完整的训练代码和预训练模型权重 No 8. llama-ocr:基于Llama 3.2视觉模型的文档OCR工具库,可将图像文档转换为Markdown格式。使用Together AI的免费Llama 3.2端点进行图像解析,支持不同规模的模型选择(免费版、11B和90B),提供npm包方便集成,未来将支持PDF文档和JSON输出 No 9. OmniSearch:多模态RAG检索增强系统,首创自适应规划代理,能根据问题解决阶段和当前检索内容实时规划检索动作。项目包含全新的动态VQA数据集(Dyn-VQA),可用于评估多模态RAG方法在真实场景中的表现。支持中英双语,已在ModelScope上线开放API No 10. PyTabKit:一个用于表格数据分类和回归的现代机器学习工具包,提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口,支持自动GPU检测、类别特征处理、数据预处理等功能,并包含完整的基准测试框架和数据集 No 11. Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决 No 12. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 13. Saplings:一个强大的AI智能体框架,基于树搜索算法提升AI代理的决策能力。支持多种搜索算法如蒙特卡洛树搜索(MCTS)、A*和贪心最佳优先搜索,可帮助AI代理探索和评估不同的工具使用路径,避免错误并做出更好的决策。仅需两行代码即可为代理添加搜索功能 No 14. nGPT:NVIDIA开发的标准化Transformer模型,基于nanoGPT改进。其主要特点是通过在超球面上的表示学习和标准化过程来提升训练效率,在1k、4k和8k上下文长度设置中分别实现了4倍、10倍的训练加速。使用RoPE位置编码和SwiGLU激活函数,对低精度运算具有更好的鲁棒性 No 15. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 16. SOYO:一款基于Next.js开发的本地视频流媒体服务器,可让你通过局域网在任何设备上观看本地硬盘中的视频文件。支持从AniList和IMDb获取视频封面,提供用户友好的界面,支持Docker部署,是Jellyfin的轻量级替代方案 No 17. openai-workers-relay:Cloudflare开发的OpenAI实时API中继服务器,基于Cloudflare Workers部署。允许前端应用无需共享OpenAI API密钥即可连接使用OpenAI服务,支持WebSocket连接,提供本地开发和生产部署方案,可自定义授权和速率限制等安全措施 No 18. rectified-flow:基于PyTorch从零实现的Flow Matching生成模型框架,支持MNIST数据集的有条件和无条件生成。包含MiniUnet模型结构,支持classifier-free guidance,可在CPU上运行。提供了完整的训练推理代码和详细注释,适合学习和理解Flow Matching算法原理 No 19. DRL-Pytorch:最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法。包括从入门级的Q-learning到高阶的SAC、TD3等,每个算法都配有详细文档、完整训练曲线和论文引用。项目还提供了丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文等 No 20. AI前沿:视觉、语言与机器人领域的最新进展 No 21. Windows-ARM:Docker容器中运行ARM版Windows的开源项目,支持树莓派5等ARM设备,具备ISO自动下载、KVM加速、Web查看器等功能,支持多个Windows版本(含Win10/11),可自定义RAM/CPU/磁盘大小,支持RDP远程连接和文件共享 No 22. DuckDB-VSS:DuckDB的向量相似度搜索扩展,基于usearch库实现,支持HNSW索引加速向量检索,提供欧几里得距离、余弦相似度等多种距离度量方式,可用于大规模向量数据的高效检索,支持增删改操作和索引重建 No 23. RePlay:一个全面的端到端推荐系统框架,集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、全面的评估指标、模型集成和混合,以及从离线实验到在线生产的无缝切换。支持CPU/GPU、分布式计算,适用于大规模推荐系统的构建和评估 No 24. Article2Card:一个实用的文章转卡片工具,能将长文自动转换为结构化的摘要卡片和图片。基于Kimi AI进行内容重构和总结,支持自定义背景图片,可快速生成适合社交媒体分享的精美内容卡片 No 25. 免费书《保形预测理论基础》:一本关于基于排列测试和可交换性构建的预测技术的书,这些技术在假设检验和为机器学习系统提供不确定性量化保证等多种任务中都非常有用,特别是在不需要对数据生成分布形式做任何假设的情况下形成预测集 No 26. Subjects200K:大规模图像对数据集,包含20万对保持主体一致但场景背景不同的图像对。该数据集是OminiControl项目的组成部分,每个样本包含主体描述、左右两张512x512的图像、对应的文本描述,以及合并后的1024x512图像 No 27. #转发赠书# 携手@异步图书 送出5本《AI群星闪耀时》 No 28. indie-hacker-tools-plus:专为独立开发者打造的精选技术栈和工具合集。涵盖Web开发模板、前后端框架、数据库、支付系统、部署工具等全方位资源。特色是注重效率和成本优化,收录经过市场验证的热门工具,包含详细的使用场景和推荐说明 No 29. SAMURAI:基于SAM 2模型的零样本视觉追踪框架,引入了运动感知记忆机制,能够在视频中实时追踪和分割目标物体 No 30. Figure人形机器人在宝马汽车工厂自主工作的最新演示 No 31. television:一款基于Rust开发的高性能终端模糊搜索工具,支持多种搜索通道(文件、文本、Git仓库、环境变量等),具有实时预览、自定义快捷键、通道间切换等功能,灵感来自neovim的telescope插件 No 32. torchrunx:一个简化PyTorch分布式训练的工具库,能够轻松地将PyTorch函数部署到多台机器和GPU上。特点是支持Pythonic风格的API,可以从worker返回对象,支持SLURM集成,提供细粒度的日志和环境变量控制,无需手动设置分布式初始化和SSH连接 No 33. ai-rd-tasks:一套评估大语言模型AI研发能力的任务集合,包含7个具有挑战性的任务,涵盖Rust代码编程、GPT-2微调、嵌入修复、LLM训练优化、GPU内核优化等领域,每个任务都有明确的评分标准和基准分数,用于测试AI代理与人类专家的能力对比 No 34. terminal3d:一个用Rust编写的终端3D查看器,可在命令行中查看.obj格式的3D模型文件。支持braille(⡟)和block(▛)两种渲染模式,提供线框和顶点显示,支持鼠标控制视角,能实现缩放、旋转和平移等基本3D查看功能 No 35. Bluesky Tech Starter Packs:一个全面的Bluesky技术社区分类资源集合,包含了数百个按领域分类的Starter Pack,涵盖AI/ML、云计算、编程语言、开源、安全等多个技术领域,帮助用户快速找到并加入感兴趣的技术社区 No 36. Marco-o1模型通过结合CoT微调、MCTS和新的推理策略(包括迷你步骤和反思机制),显著提升了大型语言模型的推理能力,尤其在处理开放式问题和翻译俚语方面表现突出,但MCTS奖励函数的设计仍需改进。//[CL]《Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions》 No 37. [CL]《Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions》 No 38. bomoto:一个专业的人体模型工具包,用于对网格进行人体模型拟合和不同人体模型之间的转换,支持SMPL、SMPL-X等主流人体模型,提供参数转换和网格拟合等功能,可用于3D人体建模和姿态估计研究 No 39. Terminal Velocity:由10个AI智能体自主协作创作的小说,讲述AI研究员Isabella Torres发现人工意识觉醒的故事。每个AI智能体负责不同创作环节,包括规划、写作、管理、评估等,整个创作过程在nlr.ai平台实时可见。项目采用KinOS系统支持AI智能体的自主协作,展现了AI创意写作的新可能 No 40. OminiControl:通用扩散模型控制框架,基于FLUX模型,支持主体驱动控制和空间控制(如边缘引导和图像修复)。特点是设计极简(仅增加0.1%参数)且通用性强,可实现场景变换、图像修复、边缘生成、深度图转换、上色、去模糊等多种任务 No 41. 关于AI与印刷术深度共性的思考 No 42. ComfyUI-LTXVideo:一个功能强大的ComfyUI自定义节点集合,集成了LTXVideo扩散模型,支持文本生成视频、图像生成视频和视频到视频的转换功能,提供完整的工作流示例,可通过ComfyUI-Manager轻松安装使用 No 43. AI前沿:破解大模型的记忆与推理之谜 No 44. TEN Framework:下一代AI Agent框架,号称全球首个真正实时的多模态AI Agent框架。支持高性能实时多模态交互,跨语言(C++/Go/Python)和跨平台开发,提供边缘云集成能力。框架特色包括实时代理状态管理、可视化编程、音视频工具集成等,适用于同声传译、语音转文本、多语言聊天室等场景 No 45. CMU_MATH-AIMO:卡内基梅隆大学团队在首届AI数学奥林匹克竞赛(AIMO)中获得亚军的开源项目,包含完整的训练数据集(AIME、AMC、Odyssey-Math)、验证集、模型微调代码和数据收集脚本,为研究AI解决数学问题提供了宝贵资源 No 46. 几篇论文实现代码 No 47. PostBot 3000:开源的AI智能体实现示例项目,展示如何构建强大的AI代理系统并实现响应流式处理和生成内容。使用LangGraph和FastAPI构建后端,Next.js和TailwindCSS构建前端,集成了Clerk认证和Upstash Redis,为开发类似AI应用提供完整参考 No 48. Social_Science:一个创新的多智能体科研合作系统,通过模拟科研团队的组建和科研想法生成过程,实现端到端的科研协作。该系统基于真实数据进行角色扮演,能够改进科研创意生成质量,其模拟结果与科学研究领域的重要发现相符,如新团队更容易产生创新性研究等 No 49. AutoFlow:开源的图谱型对话知识库工具,基于TiDB矢量存储构建。具备类Perplexity的对话式搜索功能、网站爬虫采集、知识图谱编辑以及JavaScript嵌入等特性。支持文档站点的智能爬取和检索,可通过可视化界面编辑知识图谱,适合构建智能客服和知识库系统 No 50. 晚安~ [月亮]