aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(12.5)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. RAG Cookbooks:高级检索增强生成(RAG)技术合集,包含10种先进RAG实现方案的详细教程。从基础的Naive RAG到高级的Adaptive RAG,提供完整的代码实现和评估方法。使用LangChain、Pinecone等主流工具,适合研究人员和开发者学习和实践RAG技术 No 2. knowledge-graph-studio:一个开源的知识图谱构建和管理平台,专为RAG应用设计。支持基于规则的实体解析、模块化图谱构建、灵活的数据接入等功能。基于NoSQL数据库构建,提供API优先的设计理念和SDK支持,可用于构建动态的图谱驱动AI工作流,适用于实验性和大规模应用场景 No 3. fast.cu:一个高性能CUDA内核库,包含从零开始编写的超高效GPU计算内核,其矩阵乘法性能超过cuBLAS(在4096×4096矩阵上达到763 TFLOPs),求和规约性能达到3240GB/s,展示了极致的GPU计算优化 No 4. RAGHub:一个社区驱动的RAG(检索增强生成)资源集合平台,收录了大量RAG相关的框架、项目和工具。包括LangChain、Haystack等主流框架,以及评估优化工具、RAG引擎等多个分类。帮助开发者快速了解和选择合适的RAG技术方案 No 5. 1000个中国独立开发者项目列表:一个展示中国独立开发者作品的开源项目汇总。收录了各类独立开发者的优秀项目,包含AI工具、应用插件、游戏开发等多个领域,每个项目都提供开发者信息、项目简介和链接,是了解独立开发项目和寻找合作机会的优质资源 No 6. Awesome-Generation-Acceleration:超全面的生成模型加速技术资源集合,包含快速采样、模型剪枝、量化、知识蒸馏、缓存机制、部署优化等领域的前沿论文和代码实现,是生成模型优化与加速领域的重要参考资料库 No 7. Extractous:一个高性能的非结构化数据提取工具,使用Rust编写并支持多种编程语言。特色是速度快(比unstructured-io快25倍)、内存占用低、支持本地运行,无需依赖外部服务。支持PDF、Word、HTML等多种文档格式的文本和元数据提取,集成OCR功能,适用于数据处理管道和RAG应用场景 No 8. smol-course:Hugging Face推出的小型语言模型对齐课程,针对资源受限场景下的模型训练与部署。课程基于SmolLM2系列模型,包含指令微调、偏好对齐、参数高效微调、评估、视觉语言模型等8个模块。特点是硬件要求低、无需付费服务,适合本地运行,帮助开发者掌握LLM领域的实用技能 No 9. #转发赠书# 携手@异步图书 送出5本《软件设计的哲学(第2版)》 No 10. awesome-machine-learning-startups:一个全球AI和机器学习创业公司的精选列表,按城市和领域分类整理。涵盖计算机视觉、自然语言处理、机器人、医疗、自动驾驶等多个AI应用领域,包含公司基本信息、LinkedIn链接、融资状态等详细数据 No 11. MUSK:斯坦福开发的癌症精准医疗视觉语言基础模型,通过5000万张病理图像和10亿病理相关文本的预训练,可用于癌症诊断、预后预测和免疫治疗反应预测等多个精准医疗任务,在23个补丁级和切片级基准测试中展现出优异性能 No 12. mcp-llm-bridge:一个连接Model Context Protocol(MCP)服务器和OpenAI兼容LLM的桥接工具。实现了MCP和OpenAI函数调用接口之间的双向协议转换,可将MCP工具规范转换为OpenAI函数模式,支持云端模型和本地部署如Ollama等OpenAI API兼容端点 No 13. [LG]《Revisiting the Initial Steps in Adaptive Gradient Descent Optimization》 No 14. ChibiHash:一款轻量级、快速、可移植的64位哈希函数。特点是代码量小(约65行C代码)、运行速度快(大文件处理速度24.20 GiB/s)、跨平台兼容性好(不依赖硬件指令)。通过了smhasher和smhasher3测试,适合作为非加密场景下的默认哈希函数选择 No 15. 混元视频HunyuanVideo:腾讯开发的开源视... No 16. 本文揭示了 Adam 优化器中二阶矩零初始化导致的早期训练不稳定性,并通过简单有效的非零初始化策略,显著提升了其在多种深度学习任务中的性能和稳定性,尤其在Transformer模型训练中效果显著。//[LG]《Revisiting the Initial Steps in Adaptive Gradient Descent Optimization》 No 17. 30cc:一个用C语言编写的自举C编译器,能够编译自身代码。输出x86-64汇编代码,虽然未经优化但适合教学用途。特色是实现了三重编译:先用gcc编译得到初始编译器,再用它编译自身得到第二个版本,最后用第二版本再次编译得到最终版本,实现完全的自举过程 No 18. Neptune:Google DeepMind发布的长视频理解数据集,包含超过2400个长视频和3200个问答对,专注于测试AI模型的长视频理解能力,涵盖视频总结、时序排序、状态变化等多个维度,提供多选和开放式两种评估模式,其中12%以上的视频长度超过5分钟 No 19. awesome-mir-labs:一个全面收录音乐信息检索(MIR)和AI音乐实验室的资源列表。收录了全球各地活跃的MIR研究机构,包括各实验室的所属机构、地区、负责人和研究方向等详细信息。对想要从事音乐AI研究的学者和学生提供了重要的参考价值 No 20. 小智 AI 聊天机器人:基于ESP32+SenseVoice+Qwen72B的开源AI硬件项目。支持Wi-Fi配网和4G通信,具备离线语音唤醒、5种语言识别、声纹识别、流式对话等功能。可自定义角色设定和提示词,支持对话记忆,适合AI硬件开发学习者使用。提供免开发环境固件和详细教程 No 21. 深度思考第八篇:AI+教育的转型之路 No 22. FlowModels:基于Flow-Matching的生成模型实现库,提供了多种流匹配生成模型的参考实现,包括RectFlow、LADD、Shortcut等模型,支持文本生成图像、图像反演等功能,并提供了多种求解器和优化方法 No 23. Ollama交互式提示工程教程:一个基于Jupyter Notebook的交互式教程,专门针对Ollama平台的提示工程学习。课程分为9个章节,从基础到高级,涵盖提示结构、角色分配、数据与指令分离、输出格式化、避免幻觉等核心内容。使用Qwen2.5模型作为示例,提供大量实践练习机会 No 24. moka-py:一个用Rust实现的高性能Python缓存库,提供线程安全的内存缓存功能。支持TTL(生存时间)和TTI(空闲时间)自动失效机制,基于TinyLFU策略的大小限制淘汰,以及高并发访问优化。可作为Python内置@lru_cache的替代品,且支持异步函数缓存 No 25. 早![太阳] ​ No 26. LLMs-in-Finance:一个关于金融领域大语言模型应用的知识库,涵盖生成式AI、智能代理、RAG检索增强等技术在金融领域的实践。包含了各类金融场景下的LLM应用案例、论文资料、数据集以及多模态金融分析等内容,适合研究金融科技与AI结合的开发者参考 No 27. Trolo:一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型,具备视频流推理、自动分布式训练等特性。适用于需要transformer增强的目标检测任务,提供Python API和Docker部署支持 No 28. 几篇论文实现代码 No 29. SwarmZero:一个强大的AI代理开发SDK,用于构建单个AI代理和代理群体系统。支持多种主流LLM模型(包括OpenAI、Anthropic、MistralAI、Gemini等),具备向量检索、工具集成、多代理协作等功能,可快速搭建智能应用。特色是支持代理群组(Swarm)协作完成复杂任务 No 30. Smart Composer:一款Obsidian的AI助手插件,具有上下文感知和智能写作辅助功能。支持通过 @ 引用笔记内容作为对话上下文,可导入网页链接和图片,支持语义搜索和一键编辑建议,兼容主流AI模型(OpenAI/Claude/Gemini)及本地模型(Ollama),让笔记写作更高效智能 No 31. DailyPaper:一个专业的AI论文日报项目,由M-A-P团队维护,每日精选并深度点评arXiv上的最新人工智能相关论文,内容涵盖大语言模型、计算机视觉、多模态等前沿领域,提供专业且富有洞察力的技术评述 No 32. ComfyUI-HunyuanVideoWrapper:一个为HunyuanVideo模型开发的ComfyUI封装节点,可在ComfyUI环境中进行视频生成。支持flash_attn和sageattn两种注意力机制,内存占用取决于分辨率和帧数。即使在低分辨率下也能生成质量不错的视频效果 No 33. s3-log:一个基于S3构建的分布式、持久化、高可用的日志系统。利用Amazon S3的存储能力来实现可靠的日志存储和管理,为分布式系统提供稳定的日志解决方案。目前项目仍在开发中(WIP),不建议用于生产环境 No 34. Luna AI换脸:一款企业级AI换脸解决方案,集成AI写真、证件照、数字分身等多功能。支持脸型/表情/光影自动适配,内置10万+艺术写真模板,可进行多人合影换脸。采用分布式集群架构,支持商用级应用部署,包含完整的付费和营销体系 No 35. AFTER:一个实时音频特征迁移和探索系统,基于扩散模型实现音频生成。它可以将两个音频源进行混合:一个用于设定音色风格,另一个(音频或MIDI)用于控制时间结构。支持MIDI到音频合成和音频到音频转换两种模式,可以实时与MaxMSP和Ableton Live等音乐软件集成使用 No 36. GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答案。涵盖了生成式AI的核心内容,从Transformers到扩散模型,从语言模型到图像生成,并包含实践应用案例。适合想要系统学习生成式AI的开发者使用 No 37. Outerbase Studio:一款轻量级的浏览器数据库图形界面工具,支持多种主流数据库(包括SQLite、PostgreSQL、MySQL等)。主要特点包括智能查询编辑器、数据编辑器、模式编辑器和连接管理器。具有自动完成、多查询并行执行、高效渲染等功能,提供Windows和Mac桌面版本 No 38. LLMs Interview Questions:收录了63个大语言模型(LLM)相关的面试问题及答案,针对2024年机器学习和数据科学面试提供系统化的准备资料。内容涵盖LLMs基本原理、Transformer架构、注意力机制、预训练与微调等核心知识点,附带详细解答和代码示例 No 39. [CV]《Enhancing Deep Learning Model Robustness through Metamorphic Re-Training》 No 40. Micro-Wheeled_leg-Robot:全球最小的桌面级双轮腿机器人开源项目。基于ESP32和SimpleFOC开发,集成MPU6050陀螺仪和AS5600编码器,支持WiFi远程控制。项目包含完整的3D模型、PCB设计文件和Arduino源代码,可实现稳定的轮腿复合运动 No 41. DuckDB GSheets:一个用于在DuckDB中直接通过SQL读写Google Sheets的扩展工具。支持通过URL或spreadsheet ID访问表格,可以读取指定sheet页面,支持无表头读取,还可以直接将数据写入到Google Sheets中。提供浏览器认证和访问令牌两种认证方式 No 42. Glojure:一个基于Go语言实现的Clojure解释器,实现了Go和Clojure的无缝互操作。作为一门'hosted language',它允许Go值和Glojure值之间的自由转换,内置支持多个标准库包,并提供可扩展的互操作性支持。目前处于早期开发阶段,已可用于个人项目 No 43. Cali:专门用于构建React Native应用的AI助手工具,提供自动化构建、设备管理、依赖管理和库搜索等功能。支持三种使用方式:独立CLI工具、Vercel AI SDK集成以及MCP服务器模式。能够帮助开发者摆脱记忆命令和故障排除的烦恼,简化React Native开发流程 No 44. 晚安~ [月亮] ​ No 45. mcp-cli:一个用于与Model Context Provider服务器交互的命令行工具,支持OpenAI和Ollama等多个提供商和模型。具备动态工具和资源探索功能,提供丰富的交互命令如ping、list-tools、chat等,可以方便地进行服务器通信和资源查询 No 46. conv_visualizer:一个神经网络卷积可视化工具,通过交互式界面让用户绘制数字或图形,实时展示神经网络中卷积层、池化层等处理过程。使用Processing和OpenGL技术实现高性能渲染,帮助理解AI内部运作机制。包含绘图和可视化两大模块,支持实时交互和完整的网络层级展示 No 47. crewAI-tools:一个针对crewAI代理的工具库,提供了丰富的预构建工具集合。包括文件操作、网页抓取、数据库交互、API集成和AI驱动工具等功能模块。开发者可以通过继承BaseTool或使用 @ tool装饰器轻松创建自定义工具,扩展AI代理的能力 No 48. awesome-event-driven-architecture:一个精选的事件驱动架构(EDA)资源集合,包含高质量的文章、视频和实践经验。涵盖EDA的基础知识、最佳实践、案例研究和常见陷阱。内容经过严格筛选,确保每个资源都能为读者提供清晰的原则和术语解释,特别适合想要深入了解事件驱动架构的开发者和架构师 No 49. DailyPaper:一个由M-A-P团队维护的论文评审项目,每日从arXiv精选并点评最新的前沿科研论文,涵盖AI、机器学习、计算机视觉等多个领域,提供深入的技术分析和见解 No 50. Minima:一个开源的本地RAG系统,支持多种大模型集成方案。可通过本地Ollama部署、ChatGPT自定义GPT或Anthropic Claude进行本地文件查询。支持PDF、Excel、Word、TXT等多种文档格式,使用Sentence Transformer进行向量嵌入,并集成了重排序模型优化检索效果

fly51fly avatar Dec 05 '24 14:12 fly51fly