爱可可微博热门分享(11.28)
No 1. llm_note:一个全面的大语言模型(LLM)技术学习笔记库,涵盖Transformer模型结构、模型压缩、推理部署、高性能计算等核心内容。包含详细的论文解读、代码分析、性能优化方案,以及对FlashAttention、LightLLM等重要框架的深入解析,是LLM技术学习的优质参考资料 No 2. LLMForEverybody:一个面向所有人的大模型知识分享项目,内容涵盖预训练、部署推理、微调、量化、并行计算、Prompt工程、Agent等核心主题。特别适合准备大模型相关面试的求职者,将复杂的技术概念用通俗易懂的方式呈现,帮助读者快速掌握大模型技术全貌 No 3. 悟空IM:一款高性能通用通讯服务框架,基于9年经验沉淀,采用去中心化设计,支持分布式部署。可用于即时通讯、系统消息、物联网通讯、音视频信令、直播弹幕等多种场景。特色包括超大群聊(10万人)、自研二进制协议、全程加密、高可用容灾、无需第三方中间件等 No 4. #转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 5. 大模型的第一性原理 No 6. Awesome Foundation Model ROS:一个精选的ROS项目集合,收录了利用基础模型的机器人项目资源,包括框架、模型封装、开发工具和演示项目。涵盖了语言模型、视觉模型等在ROS环境下的应用,方便开发者快速找到和使用各类基础模型 No 7. nano-simsiam:一个极简的PyTorch实现的SimSiam自监督学习框架,仅用400行代码实现,基于ResNet50在ImageNet上达到良好性能。支持分布式训练、实时KNN评估和自动混合精度训练,适合研究原型开发,代码简洁易于理解和修改 No 8. Agentic CursorRules:一个实用的AI智能体管理工具,通过严格的文件树分区和域边界来管理Cursor中的多个AI助手。它能将代码库划分为逻辑域(如前端、API、数据库),为每个AI助手生成特定的工作范围,有效防止代码冲突并保持大型项目的一致性 No 9. MovieBench:一个专门面向长视频生成的电影级数据集,特点是包含完整电影长度的视频、连贯的故事情节和多场景叙事,确保角色外观和音频在不同场景中的一致性,并提供分层的数据结构,包含高层电影信息和详细的镜头级描述 No 10. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 11. [LG] A Survey on LLM-as-a-Judge 本文系统地综述了利用大型语言模型进行评估(LLM-as-a-Judge)的研究进展,提出了一个新的评估基准,并揭示了一些反直觉的发现,例如并非所有改进策略都能提升性能,为构建更可靠、更鲁棒的 ...... No 12. TEN Framework:下一代AI Agent框架,号称全球首个真正实时的多模态AI Agent框架。支持高性能实时多模态交互,跨语言(C++/Go/Python)和跨平台开发,提供边缘云集成能力。框架特色包括实时代理状态管理、可视化编程、音视频工具集成等,适用于同声传译、语音转文本、多语言聊天室等场景 No 13. 密歇根大学工程数学笔记:为工程师准备的实用数学参考手册,包含大量常用数学公式、定义和标准化处理,旨在简化数学公式的查找和使用 No 14. [LG]《Anytime Acceleration of Gradient Descent》 No 15. [CL]《Star Attention: Efficient LLM Inference over Long Sequences》 No 16. Saplings:一个强大的AI智能体框架,基于树搜索算法提升AI代理的决策能力。支持多种搜索算法如蒙特卡洛树搜索(MCTS)、A*和贪心最佳优先搜索,可帮助AI代理探索和评估不同的工具使用路径,避免错误并做出更好的决策。仅需两行代码即可为代理添加搜索功能 No 17. #转发赠书# 携手@异步图书 送出5本《AI群星闪耀时》 No 18. 早![太阳] No 19. 中国独立开发者项目列表:一个展示中国独立开发者作品的精选合集,收录了1000多个优秀项目,涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理,每个项目都包含开发者、项目名称、链接和简介等详细信息 No 20. Streaming SenseVoice:一个基于SenseVoice的流式语音识别工具,支持实时音频转写功能,可以处理WAV文件、麦克风输入和WebSocket音频流,集成了热词识别功能,通过FastAPI提供WebSocket服务,支持MP3格式音频传输以降低延迟 No 21. Ant Design X:一个用于快速构建AI驱动界面的React组件库,基于RICH交互范式设计,提供原子化组件和完整的模型集成方案,支持对话流管理、主题定制,让开发者能轻松搭建企业级AI交互界面 No 22. AI Chatbot Supabase:一个功能完整的AI聊天机器人模板,基于Next.js和Supabase构建,集成了Vercel AI SDK,支持多种AI模型提供商,具备实时对话、文件存储、用户认证等功能,可快速部署和定制化开发 No 23. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 24. Rustfinity:一个专注于Rust编程语言学习和实践的开源教育平台,提供系统化的学习内容和实战挑战。该项目包含CLI工具、编程挑战题集等模块,旨在帮助开发者以更有效的方式掌握Rust语言 No 25. GraphRAG-SDK:一个面向图数据检索增强生成(RAG)的开发工具包,提供自动化知识图谱构建和管理功能,支持OpenAI等LLM模型集成,具备本体管理、知识图谱构建、多智能体协作等特性,可用于高级数据查询和知识图谱应用开发 No 26. spaCy Layout:一款能够处理PDF、Word文档等多种格式文件的自然语言处理工具,将结构化数据处理与spaCy的强大功能相结合,输出清晰、结构化的数据,并提供熟悉的Doc对象以访问标记文本区域 No 27. [LG]《Boundless Socratic Learning with Language Games》 No 28. Decoding:一个用于增强LLM推理能力的Python库,提供可组合的推理算法框架。支持自定义评分函数的采样和重排序模式,内置蒙特卡洛树搜索等高级算法,通过vLLM保持高性能,特别适合研究人员快速实验和迭代新想法 No 29. [CL]《Self-Generated Critiques Boost Reward Modeling for Language Models》 No 30. MDI SAM Server:一个基于SAM模型系列的图像分割服务器,专门用于医学图像处理,支持全幅面病理切片(WSI)和普通图像的实时分割,可集成到Label Studio作为机器学习后端,支持多点标注、矩形标注等功能,兼容SAM、SAM2、mobile_sam等多种模型 No 31. Yomitoku:专为日语设计的AI文档图像分析工具,集成了OCR文字识别、布局分析、表格结构识别等功能,支持纵向书写等日语特有版式,可识别超过7000个日语字符,支持输出HTML、Markdown、JSON等多种格式,适用于文档数字化和信息提取 No 32. 几篇论文实现代码 No 33. aisuite:一个统一的生成式AI接口工具,为开发者提供标准化的多LLM调用接口。支持OpenAI、Anthropic、Azure、Google等主流AI服务商,使用类似OpenAI的接口设计,让开发者可以无缝切换不同的LLM提供商进行测试和对比,无需修改代码 No 34. TROS:一个Go语言应用级Web开发框架底层库,集成了配置管理、日志系统、数据库访问层(MySQL/MongoDB/Redis)、gRPC/HTTP服务支持等功能,提供完整的项目结构和开发工具链,适用于快速构建企业级Go Web应用 No 35. 优秀Qwen提示语大全:集合了各种高质量Qwen模型提示语的资源库,帮助用户更好地与Qwen对话和生成文本内容 No 36. Extractous:高性能非结构化数据提取工具,使用Rust开发并提供多语言绑定,支持PDF、Word、HTML等多种文档格式的内容和元数据提取。相比同类工具unstructured-io速度快25倍,内存占用低11倍。集成Apache Tika和Tesseract OCR,提供原生执行性能,无需外部服务和API No 37. Model Context Protocol Servers:一个面向大语言模型的工具和数据源访问协议服务器集合。提供多种预置服务器实现,包括文件系统、GitHub、Google Drive、PostgreSQL等集成,让LLM能够以安全可控的方式访问各类外部资源。支持TypeScript和Python两种SDK开发 No 38. Article2Card:一个实用的文章转卡片工具,能将长文自动转换为结构化的摘要卡片和图片。基于Kimi AI进行内容重构和总结,支持自定义背景图片,可快速生成适合社交媒体分享的精美内容卡片 No 39. 本文提出了一种名为“苏格拉底式学习”的封闭系统内开放式自改进框架,利用“语言游戏”解决反馈对齐和数据覆盖难题,并探讨了更高层次递归和自指系统的潜力与风险,为构建持续进化的AI提供了新的方向。 No 40. WasmKit:用Swift语言编写的WebAssembly运行时,支持主流平台(macOS/iOS/Ubuntu/Windows),具备WASI支持、WAT解析器等完整功能,特点是依赖少、编译快速、易嵌入,可作为命令行工具或库使用 No 41. 免费书《证明之书(第三版)》:旨在揭示数学的理论基础,将学习重点从计算转向证明,引导读者探索数学原理背后的“为什么”,而非仅仅停留在“如何做”。通过学习数学家验证定理、探索数学真理和创造新理论的方法,读者将掌握批判性思维和探究能力,能够理解、编写严谨的数学证明 No 42. Social_Science:一个创新的多智能体科研合作系统,通过模拟科研团队的组建和科研想法生成过程,实现端到端的科研协作。该系统基于真实数据进行角色扮演,能够改进科研创意生成质量,其模拟结果与科学研究领域的重要发现相符,如新团队更容易产生创新性研究等 No 43. [CL]《MemoryFormer: Minimize Transformer Computation by Removing Fully-Connected Layers》 No 44. AutoGluon Assistant:强大的零代码机器学习助手,将AutoGluon的自动化机器学习能力与大语模结合,用户只需使用自然语言描述问题并提供数据,即可获得高精度的ML解决方案。支持Web UI和CLI两种使用方式,可自动完成从数据处理到模型训练的全流程 No 45. LLM Bulls and Cows Benchmark:一个用于评估大语言模型在数字猜谜游戏中表现的测试框架,支持多个LLM提供商,提供全面的性能指标分析和可视化结果,可测试模型的推理能力和上下文记忆能力,包含成功率、格式合规性和效率等多维度评估 No 46. Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决 No 47. [CL] Data, Data Everywhere: A Guide for Pretraining Dataset ...... No 48. EchoMimicV2:开源人体动画生成模型,支持通过音频驱动半身人物生成逼真的动画效果。具有引人注目的动作表现力、简化的生成流程和半身人物动画特点,可实现音频驱动的人物说话、表情和肢体动作的协调一致 No 49. 晚安~ [月亮] No 50. c-web-modules:旨在通过模块化和高效的方法,将 C 语言引入 Web 开发领域的项目,它允许开发者上传原始 C 代码至服务器进行即时编译和部署,支持即时更新和性能优化,适合需要快速迭代和高性能的场景