爱可可微博热门分享(11.27)
No 1. LLMForEverybody:一个面向所有人的大模型知识分享项目,内容涵盖预训练、部署推理、微调、量化、并行计算、Prompt工程、Agent等核心主题。特别适合准备大模型相关面试的求职者,将复杂的技术概念用通俗易懂的方式呈现,帮助读者快速掌握大模型技术全貌 No 2. llm_note:一个全面的大语言模型(LLM)技术学习笔记库,涵盖Transformer模型结构、模型压缩、推理部署、高性能计算等核心内容。包含详细的论文解读、代码分析、性能优化方案,以及对FlashAttention、LightLLM等重要框架的深入解析,是LLM技术学习的优质参考资料 No 3. [LG] A Survey on LLM-as-a-Judge 本文系统地综述了利用大型语言模型进行评估(LLM-as-a-Judge)的研究进展,提出了一个新的评估基准,并揭示了一些反直觉的发现,例如并非所有改进策略都能提升性能,为构建更可靠、更鲁棒的 ...... No 4. firecrawl-simple:精简版网站爬虫工具,专为自托管优化的网页抓取和转换工具。可将任意网站内容抓取并转换为LLM友好的markdown格式,移除了原版中的计费逻辑和AI功能,支持批量爬取和格式转换,适合需要构建AI训练数据的场景 No 5. GraphRAG-SDK:一个面向图数据检索增强生成(RAG)的开发工具包,提供自动化知识图谱构建和管理功能,支持OpenAI等LLM模型集成,具备本体管理、知识图谱构建、多智能体协作等特性,可用于高级数据查询和知识图谱应用开发 No 6. #转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 7. aisuite:一个统一的生成式AI接口工具,为开发者提供标准化的多LLM调用接口。支持OpenAI、Anthropic、Azure、Google等主流AI服务商,使用类似OpenAI的接口设计,让开发者可以无缝切换不同的LLM提供商进行测试和对比,无需修改代码 No 8. #转发赠书# 携手@异步图书 送出5本《AI群星闪耀时》 No 9. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 10. nano-simsiam:一个极简的PyTorch实现的SimSiam自监督学习框架,仅用400行代码实现,基于ResNet50在ImageNet上达到良好性能。支持分布式训练、实时KNN评估和自动混合精度训练,适合研究原型开发,代码简洁易于理解和修改 No 11. Agentic CursorRules:一个实用的AI智能体管理工具,通过严格的文件树分区和域边界来管理Cursor中的多个AI助手。它能将代码库划分为逻辑域(如前端、API、数据库),为每个AI助手生成特定的工作范围,有效防止代码冲突并保持大型项目的一致性 No 12. 密歇根大学工程数学笔记:为工程师准备的实用数学参考手册,包含大量常用数学公式、定义和标准化处理,旨在简化数学公式的查找和使用 No 13. imscore:一个轻量级的图像评分库,集成了多种可微分的图像美学和偏好评分模型,包括PickScore、MPS、HPSv2、LAION等主流评分器,可用于生成模型的基准测试和后期训练优化,支持图像与文本的多模态评分 No 14. [CL]《Self-Generated Critiques Boost Reward Modeling for Language Models》 No 15. Streaming SenseVoice:一个基于SenseVoice的流式语音识别工具,支持实时音频转写功能,可以处理WAV文件、麦克风输入和WebSocket音频流,集成了热词识别功能,通过FastAPI提供WebSocket服务,支持MP3格式音频传输以降低延迟 No 16. Saplings:一个强大的AI智能体框架,基于树搜索算法提升AI代理的决策能力。支持多种搜索算法如蒙特卡洛树搜索(MCTS)、A*和贪心最佳优先搜索,可帮助AI代理探索和评估不同的工具使用路径,避免错误并做出更好的决策。仅需两行代码即可为代理添加搜索功能 No 17. Awesome-Scene-Graph-Generation:一个场景图生成(SGG)相关论文的精选集,包含了图像、视频、音频、3D等多模态场景图生成研究论文,并归纳了场景图数据集、评估指标以及在图像检索、图像生成等领域的应用 No 18. [CL]《Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts?》 No 19. RAGLite:一个轻量级Python RAG工具... No 20. [LG]《Cautious Optimizers: Improving Training with One Line of Code》 No 21. Awesome Foundation Model ROS:一个精选的ROS项目集合,收录了利用基础模型的机器人项目资源,包括框架、模型封装、开发工具和演示项目。涵盖了语言模型、视觉模型等在ROS环境下的应用,方便开发者快速找到和使用各类基础模型 No 22. 中国独立开发者项目列表:一个展示中国独立开发者作品的精选合集,收录了1000多个优秀项目,涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理,每个项目都包含开发者、项目名称、链接和简介等详细信息 No 23. MovieBench:一个专门面向长视频生成的电影级数据集,特点是包含完整电影长度的视频、连贯的故事情节和多场景叙事,确保角色外观和音频在不同场景中的一致性,并提供分层的数据结构,包含高层电影信息和详细的镜头级描述 No 24. PearAI:一个集成多种顶级AI工具的统一平台,提供统一的用户界面让用户便捷使用不同AI工具,包含VSCode fork和Continue fork两大核心功能模块,支持AI代码编辑和AI聊天功能,基于TypeScript/Electron.js开发 No 25. AutoGluon Assistant:强大的零代码机器学习助手,将AutoGluon的自动化机器学习能力与大语模结合,用户只需使用自然语言描述问题并提供数据,即可获得高精度的ML解决方案。支持Web UI和CLI两种使用方式,可自动完成从数据处理到模型训练的全流程 No 26. 早![太阳] No 27. python-sdk:Model Context Protocol(MCP)的官方Python SDK,提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器,实现资源、提示和工具的标准化管理,包含stdio和SSE传输协议支持,可处理所有MCP协议消息和生命周期事件 No 28. AI前沿:大模型、视觉控制与安全多智能体 No 29. 悟空IM:一款高性能通用通讯服务框架,基于9年经验沉淀,采用去中心化设计,支持分布式部署。可用于即时通讯、系统消息、物联网通讯、音视频信令、直播弹幕等多种场景。特色包括超大群聊(10万人)、自研二进制协议、全程加密、高可用容灾、无需第三方中间件等 No 30. 几篇论文实现代码 No 31. Yomitoku:专为日语设计的AI文档图像分析工具,集成了OCR文字识别、布局分析、表格结构识别等功能,支持纵向书写等日语特有版式,可识别超过7000个日语字符,支持输出HTML、Markdown、JSON等多种格式,适用于文档数字化和信息提取 No 32. //@爱可可-爱生活:欢迎参与~//#转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 33. PyTabKit:一个用于表格数据分类和回归的现代机器学习工具包,提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口,支持自动GPU检测、类别特征处理、数据预处理等功能,并包含完整的基准测试框架和数据集 No 34. 晚安~ [月亮] No 35. LLM Bulls and Cows Benchmark:一个用于评估大语言模型在数字猜谜游戏中表现的测试框架,支持多个LLM提供商,提供全面的性能指标分析和可视化结果,可测试模型的推理能力和上下文记忆能力,包含成功率、格式合规性和效率等多维度评估 No 36. Decoding:一个用于增强LLM推理能力的Python库,提供可组合的推理算法框架。支持自定义评分函数的采样和重排序模式,内置蒙特卡洛树搜索等高级算法,通过vLLM保持高性能,特别适合研究人员快速实验和迭代新想法 No 37. Model Context Protocol Servers:一个面向大语言模型的工具和数据源访问协议服务器集合。提供多种预置服务器实现,包括文件系统、GitHub、Google Drive、PostgreSQL等集成,让LLM能够以安全可控的方式访问各类外部资源。支持TypeScript和Python两种SDK开发 No 38. TROS:一个Go语言应用级Web开发框架底层库,集成了配置管理、日志系统、数据库访问层(MySQL/MongoDB/Redis)、gRPC/HTTP服务支持等功能,提供完整的项目结构和开发工具链,适用于快速构建企业级Go Web应用 No 39. indie-hacker-tools-plus:专为独立开发者打造的精选技术栈和工具合集。涵盖Web开发模板、前后端框架、数据库、支付系统、部署工具等全方位资源。特色是注重效率和成本优化,收录经过市场验证的热门工具,包含详细的使用场景和推荐说明 No 40. pglite-fusion:一个创新的PostgreSQL扩展,允许在PostgreSQL表中嵌入SQLite数据库。通过这种方式优雅地解决了多租户架构问题。支持PostgreSQL 12-17版本,提供完整的SQLite操作API,包括数据库初始化、查询执行和数据提取等功能 No 41. Social_Science:一个创新的多智能体科研合作系统,通过模拟科研团队的组建和科研想法生成过程,实现端到端的科研协作。该系统基于真实数据进行角色扮演,能够改进科研创意生成质量,其模拟结果与科学研究领域的重要发现相符,如新团队更容易产生创新性研究等 No 42. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 43. MCTS:一个用Python实现的蒙特卡洛树搜索(Monte Carlo Tree Search)算法库,包含了基础的MCTS实现和一些实验性游戏示例。该项目提供了一个简单的数值累加游戏作为测试用例,可用于学习和理解MCTS算法的工作原理 No 44. Rustfinity:一个专注于Rust编程语言学习和实践的开源教育平台,提供系统化的学习内容和实战挑战。该项目包含CLI工具、编程挑战题集等模块,旨在帮助开发者以更有效的方式掌握Rust语言 No 45. [LG]《Safe Multi-Agent Reinforcement Learning with Convergence to Generalized Nash Equilibrium》 No 46. [CL]《Exploring Facets of Language Generation in the Limit》 No 47. [CL]《From Jack of All Trades to Master of One: Specializing LLM-based Autoraters to a Test Set》 No 48. nGPT:NVIDIA开发的标准化Transformer模型,基于nanoGPT改进。其主要特点是通过在超球面上的表示学习和标准化过程来提升训练效率,在1k、4k和8k上下文长度设置中分别实现了4倍、10倍的训练加速。使用RoPE位置编码和SwiGLU激活函数,对低精度运算具有更好的鲁棒性 No 49. AI Chatbot Supabase:一个功能完整的AI聊天机器人模板,基于Next.js和Supabase构建,集成了Vercel AI SDK,支持多种AI模型提供商,具备实时对话、文件存储、用户认证等功能,可快速部署和定制化开发 No 50. Extractous:高性能非结构化数据提取工具,使用Rust开发并提供多语言绑定,支持PDF、Word、HTML等多种文档格式的内容和元数据提取。相比同类工具unstructured-io速度快25倍,内存占用低11倍。集成Apache Tika和Tesseract OCR,提供原生执行性能,无需外部服务和API