爱可可微博热门分享(5.25)
No 1. 大模型微调十诫:关于将微调模型部署到生产环境的十条建议 No 2. 构建本地RAG系统:5步实现本地化LLM应用,结合Ollama和Weaviate实现无需外部依赖的检索增强型对话系统开发,支持在企业内部部署 No 3. Agently日常新闻收集器:基于大型语言模型(LLM)的开源自动化新闻收集工作流展示,由Agently AI应用开发框架驱动 No 4. Awesome-LLM-for-NLP:自然语言处理领域大型语言模型(LLM)的精选资源列表,提供综述、论文和未来研究方向,促进NLP领域内LLM的应用和研究 No 5. FlashRAG:高效的检索增强生成研究的Python工具包,包含32个预处理基准RAG数据集和12种先进RAG算法 No 6. 开源中文预训练语言模型:Steel-LLM,个人从零开始训练的中文大型语言模型,目标是使用1T+数据预训练1B参数量的模型,对标TinyLlama,持续更新3个月+,开源全流程代码 No 7. #免费##抽奖# 携手@博文视点Broadview 送出3本《解构大语言模型:从线性回归到通用人工智能(全彩)》 No 8. KVCachePapers:深度学习领域中键值缓存技术的研究论文集合,专注于Transformer模型解码效率和内存优化,促进模型性能提升和资源优化 No 9. [LG] Attention Mechanisms Don't Learn Additive Models: Rethinking ...... No 10. Promptulate:AI Agent 应用开发框架,通过 Pythonic 的开发范式,旨在为开发者们提供一种极其简洁而高效的 Agent 应用构建体验 No 11. [LG]《Multi-turn Reinforcement Learning from Preference Human Feedback》 No 12. SODA:搜索、组织、发现任何信息的智能工具,利用大型语言模型的强大能力,为用户提供从互联网和个人数据库中获取信息的高效解决方案,同时确保信息的准确性和可靠性 No 13. LearnLM教育辅助AI:提升学习体验的生成式AI模型,基于教育研究,使教学和学习过程更主动、个性化和吸引人 No 14. 用大型语言模型分析财务报表 No 15. AutoAudit:网络安全领域的大语言模型,为安全审计和网络防御提供自然语言处理能力,支持恶意代码分析、网络攻击检测和安全漏洞预测 No 16. Earth2Studio:开源深度学习框架,用于探索、构建和部署AI气象/气候工作流,旨在快速启动AI气象和气候模型 No 17. Make-An-Audio 2音频生成助手:基于文本条件的扩散概率模型,能生成高保真音频,适用于文本到音频的生成任务,提供预训练模型和开源实现 No 18. Mistral模型微调工具:轻量代码库,用于高效且性能优越的Mistral模型微调,基于LoRA训练范式,仅训练少量权重作为低秩矩阵微扰 No 19. 智能写作辅助工具:帮助学生提升写作技能的AI工具,通过“限制性生成AI”技术,减少学生在写作中的格式和句子构造负担,专注于思考和内容创造,试点于卡内基梅隆大学10门课程中 No 20. LLMs推理延迟优化助手:开源大型语言模型(LLM)的推理延迟优化工具,通过多种优化技术和服务器配置,提供高效的模型服务能力,帮用户在保持模型性能的同时降低延迟,提升用户体验 No 21. Vach: 实时流式数字头像,实现音视频同步对话,基本达到商用效果,支持文本和语音交互,适用于直播间业务和展厅显示屏互动 No 22. [CL] IM-RAG: Multi-Round Retrieval-Augmented Generation ...... No 23. RAG-Survey:AI生成内容的检索增强生成技术综述,系统收集和分类RAG相关论文,涵盖基础理论、方法分类、应用领域,为AI内容生成领域提供全面的研究视角 No 24. KsanaLLM:面向LLM推理和服务的高性能和高易用的推理引擎,支持Hugging Face模型和多种硬件平台,具备优化CUDA内核和动态批处理功能 No 25. AIKit:开源大型语言模型的快速部署与微调工具,支持本地推理和声明式配置,兼容OpenAI API,提供多种预制模型和GPU加速推理 No 26. [CL] Large Language Models Meet NLP: A Survey 提出参数固定应用和参数调优应用两个视角,以此对LLM在NLP任务上的应用进行了系统的总结和展望,旨在提供统一的视角以理解LLM在NLP领域的进展和局限,并讨论了未来的研究方向和挑战。 ...... No 27. CraftsMan:两阶段的文本/图像到3D网格生成模型,结合3D原生扩散模型与交互式几何细化器,实现从文本/图像到3D网格的高效生成与细节优化 No 28. WTF Langchain:Langchain框架的开源教程,提供从入门到实践的详细指南,帮助用户快速掌握Langchain的使用和开发 No 29. LLM.int8()与涌现特性:大规模Transformer模型的量化与性能无损推理研究,由Tim Dettmers提出,旨在使大型模型更易于访问并探索大规模Transformer模型的新特性 No 30. 通过将注意力机制化为RNN形式并提出前缀和算法进行并行计算,设计了一种兼具Transformer和RNN优点的新型模块Aaren,在多个实验中证明其性能和效率。//[LG]《Attention as an RNN》 No 31. 流畅阅读:基于上下文语境的人工智能翻译引擎,为网站提供友好的翻译,提供母语般的阅读体验,支持多种翻译模式和快捷方式 No 32. [LG]《Attention as an RNN》 No 33. 抹茶CSS:一个纯CSS的语义化样式库,用于快速原型设计和简化网页开发流程,无需JavaScript和复杂配置 No 34. 聚焦“金门大桥”的Claude大模型实例 No 35. [CL] A Comprehensive Survey of Accelerated Generation Techniques ...... No 36. PyTorch实用教程(第二版):面向深度学习工程师的全面指南,覆盖从零基础到项目应用和工程化部署的各个阶段,旨在帮助读者轻松掌握PyTorch的使用 No 37. 关于语言模型评估基准的思考 No 38. Firebase Genkit:AI驱动应用开发框架,支持构建、测试、部署和监控AI功能,优化云环境和代码中心设计,免费开源,集成Firebase或Google Cloud服务,支持TypeScript和Go语言 No 39. RAG LLM Ops App:简化大型语言模型(RAG)部署和测试的应用,让开发者专注于模型训练而非服务器维护,提高部署效率和维护便捷性 No 40. MuJoCo系统辨识助手:机器人系统中系统辨识的实用工具,专注于已知模型结构的机械系统,通过Levenberg-Marquardt非线性最小二乘法等先进技术,帮助估计结构化模型中的参数,简化机器人系统辨识过程 No 41. Chat2API:一个将网页版ChatGPT转换为OpenAI API格式的服务,支持多账号轮询和多种GPT模型对话,无需账号即可使用免费、无限的GPT-3.5 No 42. CapyPDF:全色彩管理的PDF生成库,提供底层PDF原语的直接访问,支持多种字体嵌入和色彩空间转换,适用于脚本语言集成 No 43. 'AIGC 求职面试指南 - AIGC 求职面经、包括必备基础知识、提示词工程、ChatGPT、Stable Diffusion、Prompt、Embedding、Fintune ...... No 44. 晚安~ [月亮] No 45. Yoopta-Editor:类似Notion的开源富文本编辑器,适用于React应用,可高度定制以满足不同项目需求 No 46. Microsoft Phi-3 Cookbook:微软开发的Phi-3系列AI模型使用手册,提供如何在不同硬件设备上构建端到端解决方案的指南,包括在Azure AI Studio和Hugging Face上使用Phi-3模型的方法 No 47. 几篇论文实现代码 No 48. ragapp:企业级Agentic RAG的简易使用方式,支持本地云基础设施部署,基于LlamaIndex构建,提供易于配置的Admin UI和API接口 No 49. 最新的大模型定价表 [笑而不语] No 50. ollama-logseq插件:Logseq笔记软件的AI集成插件,通过与ollama AI模型的结合,提供页面和区块上下文的智能问答、内容总结、创建闪卡和任务细分等功能,增强笔记效率和互动性