aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(11.28)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. llm_note：一个全面的大语言模型(LLM)技术学习笔记库，涵盖Transformer模型结构、模型压缩、推理部署、高性能计算等核心内容。包含详细的论文解读、代码分析、性能优化方案，以及对FlashAttention、LightLLM等重要框架的深入解析，是LLM技术学习的优质参考资料 No 2. LLMForEverybody：一个面向所有人的大模型知识分享项目，内容涵盖预训练、部署推理、微调、量化、并行计算、Prompt工程、Agent等核心主题。特别适合准备大模型相关面试的求职者，将复杂的技术概念用通俗易懂的方式呈现，帮助读者快速掌握大模型技术全貌 No 3. 悟空IM：一款高性能通用通讯服务框架，基于9年经验沉淀，采用去中心化设计，支持分布式部署。可用于即时通讯、系统消息、物联网通讯、音视频信令、直播弹幕等多种场景。特色包括超大群聊(10万人)、自研二进制协议、全程加密、高可用容灾、无需第三方中间件等 No 4. #转发赠书#携手@图灵新知 @图灵文化送出3本《万物皆计算》 No 5. 大模型的第一性原理 No 6. Awesome Foundation Model ROS：一个精选的ROS项目集合，收录了利用基础模型的机器人项目资源，包括框架、模型封装、开发工具和演示项目。涵盖了语言模型、视觉模型等在ROS环境下的应用，方便开发者快速找到和使用各类基础模型 No 7. nano-simsiam：一个极简的PyTorch实现的SimSiam自监督学习框架，仅用400行代码实现，基于ResNet50在ImageNet上达到良好性能。支持分布式训练、实时KNN评估和自动混合精度训练，适合研究原型开发，代码简洁易于理解和修改 No 8. Agentic CursorRules：一个实用的AI智能体管理工具，通过严格的文件树分区和域边界来管理Cursor中的多个AI助手。它能将代码库划分为逻辑域(如前端、API、数据库)，为每个AI助手生成特定的工作范围，有效防止代码冲突并保持大型项目的一致性 No 9. MovieBench：一个专门面向长视频生成的电影级数据集，特点是包含完整电影长度的视频、连贯的故事情节和多场景叙事，确保角色外观和音频在不同场景中的一致性，并提供分层的数据结构，包含高层电影信息和详细的镜头级描述 No 10. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 11. [LG] A Survey on LLM-as-a-Judge 本文系统地综述了利用大型语言模型进行评估（LLM-as-a-Judge）的研究进展，提出了一个新的评估基准，并揭示了一些反直觉的发现，例如并非所有改进策略都能提升性能，为构建更可靠、更鲁棒的 ...... No 12. TEN Framework：下一代AI Agent框架，号称全球首个真正实时的多模态AI Agent框架。支持高性能实时多模态交互，跨语言(C++/Go/Python)和跨平台开发，提供边缘云集成能力。框架特色包括实时代理状态管理、可视化编程、音视频工具集成等，适用于同声传译、语音转文本、多语言聊天室等场景 No 13. 密歇根大学工程数学笔记：为工程师准备的实用数学参考手册，包含大量常用数学公式、定义和标准化处理，旨在简化数学公式的查找和使用 No 14. [LG]《Anytime Acceleration of Gradient Descent》 No 15. [CL]《Star Attention: Efficient LLM Inference over Long Sequences》 No 16. Saplings：一个强大的AI智能体框架，基于树搜索算法提升AI代理的决策能力。支持多种搜索算法如蒙特卡洛树搜索(MCTS)、A*和贪心最佳优先搜索，可帮助AI代理探索和评估不同的工具使用路径，避免错误并做出更好的决策。仅需两行代码即可为代理添加搜索功能 No 17. #转发赠书# 携手@异步图书送出5本《AI群星闪耀时》 No 18. 早！[太阳] No 19. 中国独立开发者项目列表：一个展示中国独立开发者作品的精选合集，收录了1000多个优秀项目，涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理，每个项目都包含开发者、项目名称、链接和简介等详细信息 No 20. Streaming SenseVoice：一个基于SenseVoice的流式语音识别工具，支持实时音频转写功能，可以处理WAV文件、麦克风输入和WebSocket音频流，集成了热词识别功能，通过FastAPI提供WebSocket服务，支持MP3格式音频传输以降低延迟 No 21. Ant Design X：一个用于快速构建AI驱动界面的React组件库，基于RICH交互范式设计，提供原子化组件和完整的模型集成方案，支持对话流管理、主题定制，让开发者能轻松搭建企业级AI交互界面 No 22. AI Chatbot Supabase：一个功能完整的AI聊天机器人模板，基于Next.js和Supabase构建，集成了Vercel AI SDK，支持多种AI模型提供商，具备实时对话、文件存储、用户认证等功能，可快速部署和定制化开发 No 23. 电子印章工具：Draw Stamp Utils，一个用JavaScript编写的电子印章制作工具，能轻松创建和定制电子印章 No 24. Rustfinity：一个专注于Rust编程语言学习和实践的开源教育平台，提供系统化的学习内容和实战挑战。该项目包含CLI工具、编程挑战题集等模块，旨在帮助开发者以更有效的方式掌握Rust语言 No 25. GraphRAG-SDK：一个面向图数据检索增强生成(RAG)的开发工具包，提供自动化知识图谱构建和管理功能，支持OpenAI等LLM模型集成，具备本体管理、知识图谱构建、多智能体协作等特性，可用于高级数据查询和知识图谱应用开发 No 26. spaCy Layout：一款能够处理PDF、Word文档等多种格式文件的自然语言处理工具，将结构化数据处理与spaCy的强大功能相结合，输出清晰、结构化的数据，并提供熟悉的Doc对象以访问标记文本区域 No 27. [LG]《Boundless Socratic Learning with Language Games》 No 28. Decoding：一个用于增强LLM推理能力的Python库，提供可组合的推理算法框架。支持自定义评分函数的采样和重排序模式，内置蒙特卡洛树搜索等高级算法，通过vLLM保持高性能，特别适合研究人员快速实验和迭代新想法 No 29. [CL]《Self-Generated Critiques Boost Reward Modeling for Language Models》 No 30. MDI SAM Server：一个基于SAM模型系列的图像分割服务器，专门用于医学图像处理，支持全幅面病理切片(WSI)和普通图像的实时分割，可集成到Label Studio作为机器学习后端，支持多点标注、矩形标注等功能，兼容SAM、SAM2、mobile_sam等多种模型 No 31. Yomitoku：专为日语设计的AI文档图像分析工具，集成了OCR文字识别、布局分析、表格结构识别等功能，支持纵向书写等日语特有版式，可识别超过7000个日语字符，支持输出HTML、Markdown、JSON等多种格式，适用于文档数字化和信息提取 No 32. 几篇论文实现代码 No 33. aisuite：一个统一的生成式AI接口工具，为开发者提供标准化的多LLM调用接口。支持OpenAI、Anthropic、Azure、Google等主流AI服务商，使用类似OpenAI的接口设计，让开发者可以无缝切换不同的LLM提供商进行测试和对比，无需修改代码 No 34. TROS：一个Go语言应用级Web开发框架底层库，集成了配置管理、日志系统、数据库访问层(MySQL/MongoDB/Redis)、gRPC/HTTP服务支持等功能，提供完整的项目结构和开发工具链，适用于快速构建企业级Go Web应用 No 35. 优秀Qwen提示语大全：集合了各种高质量Qwen模型提示语的资源库，帮助用户更好地与Qwen对话和生成文本内容 No 36. Extractous：高性能非结构化数据提取工具，使用Rust开发并提供多语言绑定，支持PDF、Word、HTML等多种文档格式的内容和元数据提取。相比同类工具unstructured-io速度快25倍，内存占用低11倍。集成Apache Tika和Tesseract OCR，提供原生执行性能，无需外部服务和API No 37. Model Context Protocol Servers：一个面向大语言模型的工具和数据源访问协议服务器集合。提供多种预置服务器实现，包括文件系统、GitHub、Google Drive、PostgreSQL等集成，让LLM能够以安全可控的方式访问各类外部资源。支持TypeScript和Python两种SDK开发 No 38. Article2Card：一个实用的文章转卡片工具，能将长文自动转换为结构化的摘要卡片和图片。基于Kimi AI进行内容重构和总结，支持自定义背景图片，可快速生成适合社交媒体分享的精美内容卡片 No 39. 本文提出了一种名为“苏格拉底式学习”的封闭系统内开放式自改进框架，利用“语言游戏”解决反馈对齐和数据覆盖难题，并探讨了更高层次递归和自指系统的潜力与风险，为构建持续进化的AI提供了新的方向。 No 40. WasmKit：用Swift语言编写的WebAssembly运行时，支持主流平台(macOS/iOS/Ubuntu/Windows)，具备WASI支持、WAT解析器等完整功能，特点是依赖少、编译快速、易嵌入，可作为命令行工具或库使用 No 41. 免费书《证明之书（第三版）》：旨在揭示数学的理论基础，将学习重点从计算转向证明，引导读者探索数学原理背后的“为什么”，而非仅仅停留在“如何做”。通过学习数学家验证定理、探索数学真理和创造新理论的方法，读者将掌握批判性思维和探究能力，能够理解、编写严谨的数学证明 No 42. Social_Science：一个创新的多智能体科研合作系统，通过模拟科研团队的组建和科研想法生成过程，实现端到端的科研协作。该系统基于真实数据进行角色扮演，能够改进科研创意生成质量，其模拟结果与科学研究领域的重要发现相符，如新团队更容易产生创新性研究等 No 43. [CL]《MemoryFormer: Minimize Transformer Computation by Removing Fully-Connected Layers》 No 44. AutoGluon Assistant：强大的零代码机器学习助手，将AutoGluon的自动化机器学习能力与大语模结合，用户只需使用自然语言描述问题并提供数据，即可获得高精度的ML解决方案。支持Web UI和CLI两种使用方式，可自动完成从数据处理到模型训练的全流程 No 45. LLM Bulls and Cows Benchmark：一个用于评估大语言模型在数字猜谜游戏中表现的测试框架，支持多个LLM提供商，提供全面的性能指标分析和可视化结果，可测试模型的推理能力和上下文记忆能力，包含成功率、格式合规性和效率等多维度评估 No 46. Marco-o1：开源大型推理模型，专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型，集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异，英文准确率提升6.17%，中文提升5.60%。特别适用于数学、物理、编程等标准答案领域，以及开放性问题的解决 No 47. [CL] Data, Data Everywhere: A Guide for Pretraining Dataset ...... No 48. EchoMimicV2：开源人体动画生成模型，支持通过音频驱动半身人物生成逼真的动画效果。具有引人注目的动作表现力、简化的生成流程和半身人物动画特点，可实现音频驱动的人物说话、表情和肢体动作的协调一致 No 49. 晚安～ [月亮] No 50. c-web-modules：旨在通过模块化和高效的方法，将 C 语言引入 Web 开发领域的项目，它允许开发者上传原始 C 代码至服务器进行即时编译和部署，支持即时更新和性能优化，适合需要快速迭代和高性能的场景

Nov 28 '24 14:11 fly51fly