爱可可微博热门分享(12.2)
No 1. GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答案。涵盖了生成式AI的核心内容,从Transformers到扩散模型,从语言模型到图像生成,并包含实践应用案例。适合想要系统学习生成式AI的开发者使用 No 2. Ridgeplot:用Python实现优美山脊线图(Ridgeline Plots)的可视化库。基于Plotly生态系统,提供简单易用的接口,支持交互式绘图,具有灵活的配置选项,可自定义样式、颜色、间距等参数,适用于展示多组分布数据的时间序列或分类数据 No 3. YTSage:现代化的YouTube视频下载工具,基于PyQt6构建了清爽的图形界面。支持任意质量视频下载、音频提取、字幕获取(包括自动生成字幕)、视频元数据查看等功能。基于yt-dlp构建,确保可靠的下载性能,操作简单直观 No 4. Prompt越狱手册:系统介绍Prompt构建技巧和越狱方法的手册,包含Prompt设计指南、常见问题解决、优化技巧、越狱框架案例等内容,适合想深入了解AI交互提示工程的用户 No 5. MasteringRAG:一个全面的企业级RAG系统教程项目,涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现等多个模块,提供详细的实践示例和优化方案,帮助开发者构建高质量的RAG应用 No 6. Ollama交互式提示工程教程:一个基于Jupyter Notebook的交互式教程,专门针对Ollama平台的提示工程学习。课程分为9个章节,从基础到高级,涵盖提示结构、角色分配、数据与指令分离、输出格式化、避免幻觉等核心内容。使用Qwen2.5模型作为示例,提供大量实践练习机会 No 7. LLM-Self-Correction-Papers:大语言模型自我纠错相关论文的精选集合,涵盖内在自我纠错、外部工具辅助纠错、信息检索辅助纠错等多个研究方向,包含详细的论文分类和引用信息,是研究LLM自我纠错能力的重要参考资源 No 8. LLMs Interview Questions:收录了63个大语言模型(LLM)相关的面试问题及答案,针对2024年机器学习和数据科学面试提供系统化的准备资料。内容涵盖LLMs基本原理、Transformer架构、注意力机制、预训练与微调等核心知识点,附带详细解答和代码示例 No 9. #转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 10. StereoVision-SLAM:一款实时双目视觉SLAM系统,基于现代C++开发,主要包含前端特征跟踪、后端Bundle Adjustment优化、回环检测和可视化四大模块。支持MobileNet-V2深度特征的回环检测,可实现实时定位建图,并提供稠密三维重建功能。项目代码注释详尽,适合教学和研究使用 No 11. diagram-as-code:使用代码创建系统架构图的教程项目,基于Python的Diagrams库实现'文档即图表'的方法论。可以通过代码定义和生成云基础设施、网络组件、软件服务等架构图,支持AWS、Azure、GCP等云平台的组件,特别适合需要频繁更新的敏捷项目文档 No 12. Bananas:跨平台的屏幕共享工具,支持Mac、Windows和Linux系统。采用点对点(P2P)连接技术,无需账户注册和服务器基础设施(仅需基本的stun/turn/信令服务器用于初始连接)。特点是使用简单、即装即用,适合远程协作和结对编程等场景 No 13. minRLHF:基于minGPT构建的最小化RLHF实现,包含HappyGPT(0.8M参数的正向情感推文生成模型)和文本摘要项目。该项目简洁易懂,提供完整的训练和推理功能,适合学习和研究RLHF技术 No 14. Vicinity:轻量级的最近邻搜索工具库,提供灵活的后端支持。统一了不同向量检索方案的接口,支持HNSW、FAISS、Annoy等多种向量索引后端,可进行性能评估和对比。特点是依赖少、使用简单、支持序列化存储,适用于向量相似度搜索场景 No 15. Auralis:一款高速文本转语音引擎,支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理、流式处理长文本等特性。支持16种主流语言,可自动增强语音质量,即使使用低质量麦克风录制的参考音频也能获得良好效果 No 16. Report:一个用于替代Jupyter Notebook的数据报告生成工具,将数据分析过程转化为纯Python代码文件,输出静态HTML报告。通过简单的代码结构(load_data和prepare函数)来组织数据分析流程,支持添加标题、图表、表格等内容块,使数据分析工作更规范且易于版本控制和代码审查 No 17. uYouPlus:一款增强版YouTube客户端,基于uYou修改并添加众多实用功能。支持原生画中画、解锁2K/4K分辨率、跳过广告片段、自定义播放速度、记忆字幕设置等特性。适用于未越狱的iOS/iPadOS 14.0及以上设备,集成了20多个优化插件,提供更好的YouTube观看体验 No 18. crewAI-tools:一个针对crewAI代理的工具库,提供了丰富的预构建工具集合。包括文件操作、网页抓取、数据库交互、API集成和AI驱动工具等功能模块。开发者可以通过继承BaseTool或使用 @ tool装饰器轻松创建自定义工具,扩展AI代理的能力 No 19. FastMCP:快速构建Model Context Protocol(MCP)服务器的Python框架,提供了简洁的API接口来构建LLM上下文服务。支持工具函数、资源访问、提示词模板等功能,特别适合为Claude等LLM应用提供数据和功能支持。具有依赖少、使用简单、支持异步等特点 No 20. ShowUI:一个轻量级的视觉-语言-动作模型,专门用于GUI智能代理。它可以理解屏幕界面内容,执行点击、输入、滚动等交互操作,支持网页和手机应用场景,能够自动完成用户界面任务 No 21. Micro-Wheeled_leg-Robot:全球最小的桌面级双轮腿机器人开源项目。基于ESP32和SimpleFOC开发,集成MPU6050陀螺仪和AS5600编码器,支持WiFi远程控制。项目包含完整的3D模型、PCB设计文件和Arduino源代码,可实现稳定的轮腿复合运动 No 22. 早![太阳] No 23. Trolo:一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型,具备视频流推理、自动分布式训练等特性。适用于需要transformer增强的目标检测任务,提供Python API和Docker部署支持 No 24. Rig:一个用Rust开发的LLM应用开发框架,用于构建可扩展、模块化的全栈AI应用。其主要特点包括支持多种LLM提供商(如OpenAI、Cohere)和向量数据库(MongoDB、Neo4j等)的整合,提供简洁但强大的抽象层,极大简化了LLM应用的开发流程,支持完整的LLM补全和嵌入工作流 No 25. EmbodiedAI-Reading-List-For-Lists:一个关于具身人工智能领域的阅读资源导航库,收集整理了机器人学习、计算机视觉、视频生成等多个方向的论文列表、社区资源、课程资料和研究工具,为研究者提供系统化的学习参考 No 26. Screen Sharing:基于WebRTC和PeerJS的实时屏幕共享应用,特点是使用简单、无需下载和注册。通过输入房间代码即可快速开始分享,支持主机端使用PC浏览器分享,观看端支持所有设备(桌面、平板、手机)。采用Next.js框架开发,界面简洁直观 No 27. reflex-chat:使用Reflex框架开发的ChatGPT克隆应用,完全基于Python构建包括UI在内的全部功能。支持创建和删除聊天会话、响应式设计、自定义LLM模型,无需前端开发知识即可进行定制,适合想要快速搭建类ChatGPT应用的开发者 No 28. Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决 No 29. GLM-Edge:端侧大语言模型系列,包含1.5B/4B的对话模型和2B/5B的多模态模型,针对手机、车机等端侧场景优化,在骁龙8 Elite平台上可达到每秒60+ tokens的解码速度。模型结构经过特别调整,在性能和实用性间取得平衡 No 30. awesome-mcp-servers:一个MCP(Model Context Protocol)服务器资源集合,提供丰富的AI模型与外部资源交互实现。包括浏览器自动化、云平台服务、数据库访问、文件系统、搜索引擎等多个分类的MCP服务器实现,支持AI模型安全地访问和操作各类资源 No 31. OpenReasoningEngine:一个开源的AI推理引擎框架,支持多种强大功能:逐步推理、基于记忆的规划、多智能体混合决策、束搜索、自我反思等。兼容所有支持函数调用的OpenAI兼容接口,内置Python解释器、网页搜索、Wolfram Alpha等工具,可用于构建复杂的AI推理系统 No 32. GitDigest:一款将GitHub代码仓库转化为LLM友好文本的工具,支持一键分析代码库并生成优化后的提示文本。提供文件目录结构、代码统计、仓库摘要等信息,通过简洁的Web界面即可快速获取分析结果,适合开发者用于代码分析和AI提示工程 No 33. 几篇论文实现代码 No 34. [CL]《LLMs Do Not Think Step-by-step In Implicit Reasoning》 No 35. JupyterGIS:JupyterLab的协作式GIS编辑器扩展,支持在Jupyter环境中实时协作处理地理数据。可加载和操作QGIS项目文件(.qgs/.qgz),提供交互式地图渲染功能,集成了Python API实现地理空间数据可视化,并支持通过JupyterLite在浏览器中直接使用 No 36. Awesome MCP Servers:精选的模型上下文协议(MCP)服务器列表,包含官方参考实现和社区贡献的多种服务器实现。涵盖文件系统、代码托管、数据库、搜索引擎、社交媒体等多个领域的集成,让AI助手能够安全地访问和操作各类外部服务 No 37. Promptic:一个轻量级LLM应用开发框架,类似于Python requests库的简洁设计理念,提供了90%必需的LLM开发功能。支持结构化输出、函数调用、流式响应、对话记忆等特性,基于LiteLLM实现跨平台兼容,让开发者专注于业务功能实现 No 38. Awesome-LLM-as-a-judge:一个关于LLM作为评判器的综合资料库,收集整理了大语言模型在评判任务中的应用研究,涵盖了帮助性、无害性、可靠性、相关性、可行性等多个评估维度,以及相关方法论和评估基准 No 39. 深度思考系列第六篇:AI 时代的人类认知发展从执行任务转向定义问题 No 40. TeaTime:基于IPFS、SQLite和Git... No 41. PDL(Prompt Declaration Language):IBM开发的声明式提示编程语言,专为创建可靠、可组合的LLM提示而设计。支持模板系统、多轮对话、工具集成等特性,提供类型检查、Python SDK和可视化调试等开发工具,可与任何LLM模型集成,适合构建复杂的AI应用 No 42. YTLitePlus:iOS平台的增强版YouTube客户端,集成了YouTube Plus等多个优化插件。主要功能包括去广告、后台播放、解锁2K/4K分辨率、原生画中画、跳过视频内赞助片段、显示点踉数、OLED暗黑模式等60多项自定义选项,为用户提供更好的YouTube观看体验 No 43. [LG]《Safety Alignment Should be Made More Than Just a Few Tokens Deep》 No 44. Open Notebook:开源版Google Notebook LM的替代方案,注重隐私保护的智能笔记工具。支持多笔记本管理、多AI模型(OpenAI/Anthropic/Gemini等)、播客生成、多格式文件导入(PDF/EPUB/Office等)、AI辅助笔记生成、全文和向量搜索等功能,让用户完全掌控自己的研究工作流 No 45. Smart Composer:一款Obsidian的AI助手插件,具有上下文感知和智能写作辅助功能。支持通过 @ 引用笔记内容作为对话上下文,可导入网页链接和图片,支持语义搜索和一键编辑建议,兼容主流AI模型(OpenAI/Claude/Gemini)及本地模型(Ollama),让笔记写作更高效智能 No 46. ridgeplot:Python数据可视化库,用于创建优美的山脊线图(ridgeline plots),基于Plotly生态系统,提供简单易用的接口和丰富的配置选项。支持交互式显示、多轨迹绘制,适用于展示多组分布数据的时间序列或分类数据 No 47. Privastead:开源的隐私保护家庭安防摄像头解决方案,采用端到端加密技术。由摄像头集线器、移动应用和不可信服务器三部分组成,基于OpenMLS实现消息层安全协议,支持现有IP摄像头,使用Rust语言开发,确保只有集线器和移动端可以访问未加密视频 No 48. awesome-mobile-agents:一个全面的移动端和PC端智能代理相关资源集合,包含最新论文、数据集和基准测试。收录了各类移动端智能代理系统的训练方法、输入类型、模型架构等详细对比,以及主流数据集的详细信息统计 No 49. 本文揭示了大型语言模型安全对齐的“浅层性”问题是多种漏洞的根源,并提出数据增强和约束微调两种方法来加深安全对齐,显著提升模型对各种攻击的鲁棒性,但仍需持续改进以应对未来挑战。//[LG]《Safety Alignment Should be Made More Than Just a Few Tokens Deep》 No 50. Zotero-arXiv-Daily:一款基于Zotero文献库的个性化arXiv论文推荐工具。它能根据用户Zotero库中的文献内容,自动推荐相关的最新arXiv论文,并通过邮件发送推荐列表。特色功能包括AI生成的论文摘要、相关度排序、PDF和代码链接等,可通过GitHub Actions实现零成本自动化部署和每日推送