aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(12.5)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. RAG Cookbooks：高级检索增强生成(RAG)技术合集，包含10种先进RAG实现方案的详细教程。从基础的Naive RAG到高级的Adaptive RAG，提供完整的代码实现和评估方法。使用LangChain、Pinecone等主流工具，适合研究人员和开发者学习和实践RAG技术 No 2. knowledge-graph-studio：一个开源的知识图谱构建和管理平台，专为RAG应用设计。支持基于规则的实体解析、模块化图谱构建、灵活的数据接入等功能。基于NoSQL数据库构建，提供API优先的设计理念和SDK支持，可用于构建动态的图谱驱动AI工作流，适用于实验性和大规模应用场景 No 3. fast.cu：一个高性能CUDA内核库，包含从零开始编写的超高效GPU计算内核，其矩阵乘法性能超过cuBLAS(在4096×4096矩阵上达到763 TFLOPs)，求和规约性能达到3240GB/s，展示了极致的GPU计算优化 No 4. RAGHub：一个社区驱动的RAG(检索增强生成)资源集合平台，收录了大量RAG相关的框架、项目和工具。包括LangChain、Haystack等主流框架，以及评估优化工具、RAG引擎等多个分类。帮助开发者快速了解和选择合适的RAG技术方案 No 5. 1000个中国独立开发者项目列表：一个展示中国独立开发者作品的开源项目汇总。收录了各类独立开发者的优秀项目,包含AI工具、应用插件、游戏开发等多个领域,每个项目都提供开发者信息、项目简介和链接,是了解独立开发项目和寻找合作机会的优质资源 No 6. Awesome-Generation-Acceleration：超全面的生成模型加速技术资源集合，包含快速采样、模型剪枝、量化、知识蒸馏、缓存机制、部署优化等领域的前沿论文和代码实现，是生成模型优化与加速领域的重要参考资料库 No 7. Extractous：一个高性能的非结构化数据提取工具，使用Rust编写并支持多种编程语言。特色是速度快（比unstructured-io快25倍）、内存占用低、支持本地运行，无需依赖外部服务。支持PDF、Word、HTML等多种文档格式的文本和元数据提取，集成OCR功能，适用于数据处理管道和RAG应用场景 No 8. smol-course：Hugging Face推出的小型语言模型对齐课程，针对资源受限场景下的模型训练与部署。课程基于SmolLM2系列模型，包含指令微调、偏好对齐、参数高效微调、评估、视觉语言模型等8个模块。特点是硬件要求低、无需付费服务，适合本地运行，帮助开发者掌握LLM领域的实用技能 No 9. #转发赠书# 携手@异步图书送出5本《软件设计的哲学（第2版）》 No 10. awesome-machine-learning-startups：一个全球AI和机器学习创业公司的精选列表，按城市和领域分类整理。涵盖计算机视觉、自然语言处理、机器人、医疗、自动驾驶等多个AI应用领域，包含公司基本信息、LinkedIn链接、融资状态等详细数据 No 11. MUSK：斯坦福开发的癌症精准医疗视觉语言基础模型，通过5000万张病理图像和10亿病理相关文本的预训练，可用于癌症诊断、预后预测和免疫治疗反应预测等多个精准医疗任务，在23个补丁级和切片级基准测试中展现出优异性能 No 12. mcp-llm-bridge：一个连接Model Context Protocol(MCP)服务器和OpenAI兼容LLM的桥接工具。实现了MCP和OpenAI函数调用接口之间的双向协议转换，可将MCP工具规范转换为OpenAI函数模式，支持云端模型和本地部署如Ollama等OpenAI API兼容端点 No 13. [LG]《Revisiting the Initial Steps in Adaptive Gradient Descent Optimization》 No 14. ChibiHash：一款轻量级、快速、可移植的64位哈希函数。特点是代码量小(约65行C代码)、运行速度快(大文件处理速度24.20 GiB/s)、跨平台兼容性好(不依赖硬件指令)。通过了smhasher和smhasher3测试，适合作为非加密场景下的默认哈希函数选择 No 15. 混元视频HunyuanVideo：腾讯开发的开源视... No 16. 本文揭示了 Adam 优化器中二阶矩零初始化导致的早期训练不稳定性，并通过简单有效的非零初始化策略，显著提升了其在多种深度学习任务中的性能和稳定性，尤其在Transformer模型训练中效果显著。//[LG]《Revisiting the Initial Steps in Adaptive Gradient Descent Optimization》 No 17. 30cc：一个用C语言编写的自举C编译器，能够编译自身代码。输出x86-64汇编代码，虽然未经优化但适合教学用途。特色是实现了三重编译：先用gcc编译得到初始编译器，再用它编译自身得到第二个版本，最后用第二版本再次编译得到最终版本，实现完全的自举过程 No 18. Neptune：Google DeepMind发布的长视频理解数据集，包含超过2400个长视频和3200个问答对，专注于测试AI模型的长视频理解能力，涵盖视频总结、时序排序、状态变化等多个维度，提供多选和开放式两种评估模式，其中12%以上的视频长度超过5分钟 No 19. awesome-mir-labs：一个全面收录音乐信息检索(MIR)和AI音乐实验室的资源列表。收录了全球各地活跃的MIR研究机构，包括各实验室的所属机构、地区、负责人和研究方向等详细信息。对想要从事音乐AI研究的学者和学生提供了重要的参考价值 No 20. 小智 AI 聊天机器人：基于ESP32+SenseVoice+Qwen72B的开源AI硬件项目。支持Wi-Fi配网和4G通信，具备离线语音唤醒、5种语言识别、声纹识别、流式对话等功能。可自定义角色设定和提示词，支持对话记忆，适合AI硬件开发学习者使用。提供免开发环境固件和详细教程 No 21. 深度思考第八篇：AI+教育的转型之路 No 22. FlowModels：基于Flow-Matching的生成模型实现库，提供了多种流匹配生成模型的参考实现，包括RectFlow、LADD、Shortcut等模型，支持文本生成图像、图像反演等功能，并提供了多种求解器和优化方法 No 23. Ollama交互式提示工程教程：一个基于Jupyter Notebook的交互式教程，专门针对Ollama平台的提示工程学习。课程分为9个章节，从基础到高级，涵盖提示结构、角色分配、数据与指令分离、输出格式化、避免幻觉等核心内容。使用Qwen2.5模型作为示例，提供大量实践练习机会 No 24. moka-py：一个用Rust实现的高性能Python缓存库，提供线程安全的内存缓存功能。支持TTL(生存时间)和TTI(空闲时间)自动失效机制，基于TinyLFU策略的大小限制淘汰，以及高并发访问优化。可作为Python内置@lru_cache的替代品，且支持异步函数缓存 No 25. 早！[太阳] No 26. LLMs-in-Finance：一个关于金融领域大语言模型应用的知识库，涵盖生成式AI、智能代理、RAG检索增强等技术在金融领域的实践。包含了各类金融场景下的LLM应用案例、论文资料、数据集以及多模态金融分析等内容，适合研究金融科技与AI结合的开发者参考 No 27. Trolo：一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架，提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型，具备视频流推理、自动分布式训练等特性。适用于需要transformer增强的目标检测任务，提供Python API和Docker部署支持 No 28. 几篇论文实现代码 No 29. SwarmZero：一个强大的AI代理开发SDK，用于构建单个AI代理和代理群体系统。支持多种主流LLM模型(包括OpenAI、Anthropic、MistralAI、Gemini等)，具备向量检索、工具集成、多代理协作等功能，可快速搭建智能应用。特色是支持代理群组(Swarm)协作完成复杂任务 No 30. Smart Composer：一款Obsidian的AI助手插件，具有上下文感知和智能写作辅助功能。支持通过 @ 引用笔记内容作为对话上下文，可导入网页链接和图片，支持语义搜索和一键编辑建议，兼容主流AI模型(OpenAI/Claude/Gemini)及本地模型(Ollama)，让笔记写作更高效智能 No 31. DailyPaper：一个专业的AI论文日报项目，由M-A-P团队维护，每日精选并深度点评arXiv上的最新人工智能相关论文，内容涵盖大语言模型、计算机视觉、多模态等前沿领域，提供专业且富有洞察力的技术评述 No 32. ComfyUI-HunyuanVideoWrapper：一个为HunyuanVideo模型开发的ComfyUI封装节点，可在ComfyUI环境中进行视频生成。支持flash_attn和sageattn两种注意力机制，内存占用取决于分辨率和帧数。即使在低分辨率下也能生成质量不错的视频效果 No 33. s3-log：一个基于S3构建的分布式、持久化、高可用的日志系统。利用Amazon S3的存储能力来实现可靠的日志存储和管理，为分布式系统提供稳定的日志解决方案。目前项目仍在开发中(WIP)，不建议用于生产环境 No 34. Luna AI换脸：一款企业级AI换脸解决方案，集成AI写真、证件照、数字分身等多功能。支持脸型/表情/光影自动适配，内置10万+艺术写真模板，可进行多人合影换脸。采用分布式集群架构，支持商用级应用部署，包含完整的付费和营销体系 No 35. AFTER：一个实时音频特征迁移和探索系统，基于扩散模型实现音频生成。它可以将两个音频源进行混合：一个用于设定音色风格，另一个(音频或MIDI)用于控制时间结构。支持MIDI到音频合成和音频到音频转换两种模式，可以实时与MaxMSP和Ableton Live等音乐软件集成使用 No 36. GenAI Book：《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库，包含完整的代码示例和练习答案。涵盖了生成式AI的核心内容，从Transformers到扩散模型，从语言模型到图像生成，并包含实践应用案例。适合想要系统学习生成式AI的开发者使用 No 37. Outerbase Studio：一款轻量级的浏览器数据库图形界面工具，支持多种主流数据库(包括SQLite、PostgreSQL、MySQL等)。主要特点包括智能查询编辑器、数据编辑器、模式编辑器和连接管理器。具有自动完成、多查询并行执行、高效渲染等功能，提供Windows和Mac桌面版本 No 38. LLMs Interview Questions：收录了63个大语言模型(LLM)相关的面试问题及答案，针对2024年机器学习和数据科学面试提供系统化的准备资料。内容涵盖LLMs基本原理、Transformer架构、注意力机制、预训练与微调等核心知识点，附带详细解答和代码示例 No 39. [CV]《Enhancing Deep Learning Model Robustness through Metamorphic Re-Training》 No 40. Micro-Wheeled_leg-Robot：全球最小的桌面级双轮腿机器人开源项目。基于ESP32和SimpleFOC开发，集成MPU6050陀螺仪和AS5600编码器，支持WiFi远程控制。项目包含完整的3D模型、PCB设计文件和Arduino源代码，可实现稳定的轮腿复合运动 No 41. DuckDB GSheets：一个用于在DuckDB中直接通过SQL读写Google Sheets的扩展工具。支持通过URL或spreadsheet ID访问表格，可以读取指定sheet页面，支持无表头读取，还可以直接将数据写入到Google Sheets中。提供浏览器认证和访问令牌两种认证方式 No 42. Glojure：一个基于Go语言实现的Clojure解释器，实现了Go和Clojure的无缝互操作。作为一门'hosted language'，它允许Go值和Glojure值之间的自由转换，内置支持多个标准库包，并提供可扩展的互操作性支持。目前处于早期开发阶段，已可用于个人项目 No 43. Cali：专门用于构建React Native应用的AI助手工具，提供自动化构建、设备管理、依赖管理和库搜索等功能。支持三种使用方式：独立CLI工具、Vercel AI SDK集成以及MCP服务器模式。能够帮助开发者摆脱记忆命令和故障排除的烦恼，简化React Native开发流程 No 44. 晚安～ [月亮] No 45. mcp-cli：一个用于与Model Context Provider服务器交互的命令行工具，支持OpenAI和Ollama等多个提供商和模型。具备动态工具和资源探索功能，提供丰富的交互命令如ping、list-tools、chat等，可以方便地进行服务器通信和资源查询 No 46. conv_visualizer：一个神经网络卷积可视化工具，通过交互式界面让用户绘制数字或图形，实时展示神经网络中卷积层、池化层等处理过程。使用Processing和OpenGL技术实现高性能渲染，帮助理解AI内部运作机制。包含绘图和可视化两大模块，支持实时交互和完整的网络层级展示 No 47. crewAI-tools：一个针对crewAI代理的工具库，提供了丰富的预构建工具集合。包括文件操作、网页抓取、数据库交互、API集成和AI驱动工具等功能模块。开发者可以通过继承BaseTool或使用 @ tool装饰器轻松创建自定义工具，扩展AI代理的能力 No 48. awesome-event-driven-architecture：一个精选的事件驱动架构(EDA)资源集合，包含高质量的文章、视频和实践经验。涵盖EDA的基础知识、最佳实践、案例研究和常见陷阱。内容经过严格筛选，确保每个资源都能为读者提供清晰的原则和术语解释，特别适合想要深入了解事件驱动架构的开发者和架构师 No 49. DailyPaper：一个由M-A-P团队维护的论文评审项目，每日从arXiv精选并点评最新的前沿科研论文，涵盖AI、机器学习、计算机视觉等多个领域，提供深入的技术分析和见解 No 50. Minima：一个开源的本地RAG系统，支持多种大模型集成方案。可通过本地Ollama部署、ChatGPT自定义GPT或Anthropic Claude进行本地文件查询。支持PDF、Excel、Word、TXT等多种文档格式，使用Sentence Transformer进行向量嵌入，并集成了重排序模型优化检索效果

Dec 05 '24 14:12 fly51fly