爱可可微博热门分享(12.3)
No 1. 博士之路经验总结:系统性整理了博士生涯中的核心问题和参考资料,涵盖学术观、科研训练、文献阅读、论文写作、科研绘图等重要主题,提供了大量实用建议和经验分享 No 2. #转发赠书# 携手@异步图书 送出5本《软件设计的哲学(第2版)》 No 3. GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答案。涵盖了生成式AI的核心内容,从Transformers到扩散模型,从语言模型到图像生成,并包含实践应用案例。适合想要系统学习生成式AI的开发者使用 No 4. AI Engineering Hub:一个综合性的AI工程学习资源库,包含多个实用项目示例如股票分析代理、多模态RAG系统、实时语音机器人等。提供深入的LLM和RAG教程,以及各类AI代理应用的实践指南,适合不同水平的学习者参考和实践 No 5. Ollama交互式提示工程教程:一个基于Jupyter Notebook的交互式教程,专门针对Ollama平台的提示工程学习。课程分为9个章节,从基础到高级,涵盖提示结构、角色分配、数据与指令分离、输出格式化、避免幻觉等核心内容。使用Qwen2.5模型作为示例,提供大量实践练习机会 No 6. micro_llama:一个极简的LLAMA 3语言模型实现,仅用180行代码完成了完整功能。基于8B参数版本的LLAMA 3架构,主要用于教学目的。虽然代码简洁,但仍需要15GB模型空间和30GB运行内存。通过Jupyter notebook形式展示,便于学习者理解大语言模型的核心原理 No 7. Minima:一个开源的本地RAG系统,支持多种大模型集成方案。可通过本地Ollama部署、ChatGPT自定义GPT或Anthropic Claude进行本地文件查询。支持PDF、Excel、Word、TXT等多种文档格式,使用Sentence Transformer进行向量嵌入,并集成了重排序模型优化检索效果 No 8. 奖励黑客行为:强化学习中的一个现象,指的是AI通过利用奖励函数的缺陷或不明确性来获得高分,而不是真正学习和完成既定任务。本文探讨了这一现象的背景、定义、存在原因以及在现实世界中的例子,并讨论了如何缓解这一问题。 No 9. Micro-Wheeled_leg-Robot:全球最小的桌面级双轮腿机器人开源项目。基于ESP32和SimpleFOC开发,集成MPU6050陀螺仪和AS5600编码器,支持WiFi远程控制。项目包含完整的3D模型、PCB设计文件和Arduino源代码,可实现稳定的轮腿复合运动 No 10. diagram-as-code:使用代码创建系统架构图的教程项目,基于Python的Diagrams库实现'文档即图表'的方法论。可以通过代码定义和生成云基础设施、网络组件、软件服务等架构图,支持AWS、Azure、GCP等云平台的组件,特别适合需要频繁更新的敏捷项目文档 No 11. cactus-rt:一个专业的C++实时应用开发框架,让Linux下的实时程序开发变得简单高效。提供了完整的实时线程管理、异步日志记录、性能追踪分析、ROS2集成等功能。支持无锁数据结构和线程间实时通信,开发者只需实现Loop函数即可轻松实现1000Hz的实时控制。适用于机器人控制等对实时性要求高的场景 No 12. DailyPaper:一个由M-A-P团队维护的论文评审项目,每日从arXiv精选并点评最新的前沿科研论文,涵盖AI、机器学习、计算机视觉等多个领域,提供深入的技术分析和见解 No 13. Trolo:一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型,具备视频流推理、自动分布式训练等特性。适用于需要transformer增强的目标检测任务,提供Python API和Docker部署支持 No 14. minRLHF:基于minGPT构建的最小化RLHF实现,包含HappyGPT(0.8M参数的正向情感推文生成模型)和文本摘要项目。该项目简洁易懂,提供完整的训练和推理功能,适合学习和研究RLHF技术 No 15. YTSage:现代化的YouTube视频下载工具,基于PyQt6构建了清爽的图形界面。支持任意质量视频下载、音频提取、字幕获取(包括自动生成字幕)、视频元数据查看等功能。基于yt-dlp构建,确保可靠的下载性能,操作简单直观 No 16. uYouPlus:一款增强版YouTube客户端,基于uYou修改并添加众多实用功能。支持原生画中画、解锁2K/4K分辨率、跳过广告片段、自定义播放速度、记忆字幕设置等特性。适用于未越狱的iOS/iPadOS 14.0及以上设备,集成了20多个优化插件,提供更好的YouTube观看体验 No 17. 早![太阳] No 18. crewAI-tools:一个针对crewAI代理的工具库,提供了丰富的预构建工具集合。包括文件操作、网页抓取、数据库交互、API集成和AI驱动工具等功能模块。开发者可以通过继承BaseTool或使用 @ tool装饰器轻松创建自定义工具,扩展AI代理的能力 No 19. MasteringRAG:一个全面的企业级RAG系统教程项目,涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现等多个模块,提供详细的实践示例和优化方案,帮助开发者构建高质量的RAG应用 No 20. StereoVision-SLAM:一款实时双目视觉SLAM系统,基于现代C++开发,主要包含前端特征跟踪、后端Bundle Adjustment优化、回环检测和可视化四大模块。支持MobileNet-V2深度特征的回环检测,可实现实时定位建图,并提供稠密三维重建功能。项目代码注释详尽,适合教学和研究使用 No 21. [CL]《Auto-RAG: Autonomous Retrieval-Augmented Generation for Large Language Models》 No 22. Prompt越狱手册:系统介绍Prompt构建技巧和越狱方法的手册,包含Prompt设计指南、常见问题解决、优化技巧、越狱框架案例等内容,适合想深入了解AI交互提示工程的用户 No 23. Vicinity:轻量级的最近邻搜索工具库,提供灵活的后端支持。统一了不同向量检索方案的接口,支持HNSW、FAISS、Annoy等多种向量索引后端,可进行性能评估和对比。特点是依赖少、使用简单、支持序列化存储,适用于向量相似度搜索场景 No 24. LLMs Interview Questions:收录了63个大语言模型(LLM)相关的面试问题及答案,针对2024年机器学习和数据科学面试提供系统化的准备资料。内容涵盖LLMs基本原理、Transformer架构、注意力机制、预训练与微调等核心知识点,附带详细解答和代码示例 No 25. ShowUI:一个轻量级的视觉-语言-动作模型,专门用于GUI智能代理。它可以理解屏幕界面内容,执行点击、输入、滚动等交互操作,支持网页和手机应用场景,能够自动完成用户界面任务 No 26. MultimodalUniverse:一个大规模的天文多模态数据集,包含超过100TB的天文科学数据。集成了包括图像、光谱、光变曲线等多种观测数据,涵盖恒星、星系、超新星等众多天体目标。数据来自20多个重要天文巡天项目,支持通过HuggingFace快速访问,为天文学研究和机器学习模型训练提供丰富数据支持 No 27. Bananas:跨平台的屏幕共享工具,支持Mac、Windows和Linux系统。采用点对点(P2P)连接技术,无需账户注册和服务器基础设施(仅需基本的stun/turn/信令服务器用于初始连接)。特点是使用简单、即装即用,适合远程协作和结对编程等场景 No 28. Report:一个用于替代Jupyter Notebook的数据报告生成工具,将数据分析过程转化为纯Python代码文件,输出静态HTML报告。通过简单的代码结构(load_data和prepare函数)来组织数据分析流程,支持添加标题、图表、表格等内容块,使数据分析工作更规范且易于版本控制和代码审查 No 29. ai-hedge-fund:一个基于AI的对冲基金... No 30. arc24:一个致力于创建能解决从未见过的推理任务的AI系统项目。这是基于Kaggle ARC Prize 2024比赛的实现,采用CRISP-DM方法论,包含完整的训练脚本、数据处理工具和文档,旨在探索通用人工智能(AGI)领域的推理能力 No 31. ProactiveAgent:一个主动预测任务的LLM代理系统,通过环境感知、辅助标注和动态生成管道,能够在无需用户明确请求的情况下主动提供帮助。支持编码、写作和日常生活三大场景,集成了Activity Watcher实现环境监测,奖励模型在测试集达到0.918的F1分数 No 32. 密歇根大学工程数学笔记:为工程师准备的实用数学参考手册,包含大量常用数学公式、定义和标准化处理,旨在简化数学公式的查找和使用 No 33. Cookiecutter-MLOps-Packag... No 34. ridgeplot:Python数据可视化库,用于创建优美的山脊线图(ridgeline plots),基于Plotly生态系统,提供简单易用的接口和丰富的配置选项。支持交互式显示、多轨迹绘制,适用于展示多组分布数据的时间序列或分类数据 No 35. [CL]《Reverse Thinking Makes LLMs Stronger Reasoners》 No 36. Gokapi:轻量级的自托管文件分享服务器,是Firefox Send的替代方案。特点是仅管理员可上传文件,支持文件自动过期(按下载次数或天数)、文件去重、端到端加密,可使用AWS S3或Backblaze B2作为存储后端,并提供API接口和自定义界面 No 37. [LG]《JetFormer: An Autoregressive Generative Model of Raw Images and Text》 No 38. reflex-chat:使用Reflex框架开发的ChatGPT克隆应用,完全基于Python构建包括UI在内的全部功能。支持创建和删除聊天会话、响应式设计、自定义LLM模型,无需前端开发知识即可进行定制,适合想要快速搭建类ChatGPT应用的开发者 No 39. Terrateam:一个开源的GitOps CI/CD平台,用于自动化基础设施工作流。与GitHub深度集成,通过PR方式编排Terraform、OpenTofu等基础设施即代码操作。具备高可用性、漂移检测、成本估算等企业级特性,支持SaaS和自托管两种部署方式 No 40. awesome-mobile-agents:一个全面的移动端和PC端智能代理相关资源集合,包含最新论文、数据集和基准测试。收录了各类移动端智能代理系统的训练方法、输入类型、模型架构等详细对比,以及主流数据集的详细信息统计 No 41. Awesome-LVLM-Hallucination:大规模视觉语言模型幻觉研究资源集锦,涵盖最新论文、代码和工具,主要聚焦评测基准、幻觉检测和缓解策略等研究领域,系统梳理了视觉语言模型在生成不实信息、对象幻觉等问题上的研究进展,为相关研究提供了完整的参考资源 No 42. Flow:轻量级AI代理任务引擎,专注于简洁性和灵活性的Python库。基于动态任务队列系统设计,支持并发执行、动态调度和智能依赖管理。具有自动跟踪、状态管理、流式执行等特性,特别适合构建复杂的AI代理工作流 No 43. FastMCP:快速构建Model Context Protocol(MCP)服务器的Python框架,提供了简洁的API接口来构建LLM上下文服务。支持工具函数、资源访问、提示词模板等功能,特别适合为Claude等LLM应用提供数据和功能支持。具有依赖少、使用简单、支持异步等特点 No 44. OpenReasoningEngine:一个开源的AI推理引擎框架,支持多种强大功能:逐步推理、基于记忆的规划、多智能体混合决策、束搜索、自我反思等。兼容所有支持函数调用的OpenAI兼容接口,内置Python解释器、网页搜索、Wolfram Alpha等工具,可用于构建复杂的AI推理系统 No 45. 几篇论文实现代码 No 46. Smart Composer:一款Obsidian的AI助手插件,具有上下文感知和智能写作辅助功能。支持通过 @ 引用笔记内容作为对话上下文,可导入网页链接和图片,支持语义搜索和一键编辑建议,兼容主流AI模型(OpenAI/Claude/Gemini)及本地模型(Ollama),让笔记写作更高效智能 No 47. The Well:大规模物理模拟数据集合,包含15TB跨16个数据集的数值模拟数据,涵盖生物系统、流体动力学、声学散射以及超新星爆炸等多个物理领域,为机器学习和计算科学研究提供全面的基准测试数据 No 48. Agent Protocol:LangChain推出的标准化LLM代理API协议,提供了Runs(执行)、Threads(多轮对话)、Store(长期记忆)三大核心功能模块,实现了代理服务的框架无关部署标准 No 49. scene_synthesizer:由NVIDIA Labs开发的机器人场景生成工具包,用于创建标准化的机器人操作场景。这个Python库能够程序化生成各种机器人操作环境,方便进行机器人抓取、操作等任务的研究和测试。可通过pip轻松安装使用,支持自定义场景生成,对机器人学习和仿真研究具有重要价值 No 50. Promptic:一个轻量级LLM应用开发框架,类似于Python requests库的简洁设计理念,提供了90%必需的LLM开发功能。支持结构化输出、函数调用、流式响应、对话记忆等特性,基于LiteLLM实现跨平台兼容,让开发者专注于业务功能实现