爱可可微博热门分享(6.7)
No 1. 大型语言模型(LLM)实战经验总结(第三部分) No 2. 新书:面向生成式AI的提示工程 No 3. CVPR 2024趋势分析:图像与视频合成、3D视觉、人体行为识别、视觉与语言推理等研究方向论文最多 No 4. MiGPT:将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手 No 5. QMedia:开源多媒体AI内容搜索引擎,专为内容创作者设计,支持文本/图像和短视频内容的丰富信息提取方法,集成非结构化文本/图像和短视频信息,构建多模态RAG内容问答系统,旨在以开源方式分享和交流AI内容创作的想法 No 6. Qwen2系列模型发布:多语言支持与代码数学能力显著提升,包含5种不同尺寸的预训练和指令微调模型,支持从32K到128K tokens的上下文长度,已在Hugging Face和ModelScope开源 No 7. Omakub:一键式Ubuntu系统配置工具,专为Web开发者打造,提供美观现代的工作环境,集成多种常用工具和应用,简化Linux系统的设置和使用过程 No 8. 开放词汇检测与分割研究相关资源列表 No 9. ChatTTS_colab:基于ChatTTS的语音合成工具,支持音色抽卡、长音频生成和分角色朗读,简单易用,无需复杂安装 No 10. 晚安~ [月亮] No 11. #免费##抽奖# 携手@异步图书 送出3本《生成式AI入门与AWS实战》 No 12. #免费##抽奖# 携手@博文视点Broadview 送出3本《LangChain技术解密:构建大模型应用的全景指南》 No 13. NodeToPython:Blender节点组转换工具,将几何节点、材质和合成节点转换为可读的Python代码,简化Blender插件和脚本的创建过程 No 14. [CL]《Chain of Agents: Large Language Models Collaborating on Long-Context Tasks》 No 15. Haystack Cookbook:使用Haystack进行自然语言处理的示例集合,提供如何结合不同的模型提供者、向量数据库、检索技术等的指导,大多数示例展示特定小型演示 No 16. NotebookLM:基于谷歌Gemini 1.5 Pro模型的个性化AI研究助手,专为项目文档提供即时专业知识,生成带引用的个性化指南,确保用户数据隐私 No 17. VL-RLHF:视觉-语言模型的强化学习人类偏好反馈基础设施,支持多种流行VLMs和微调方法,简化模型训练和评估过程 No 18. Atomic Agents:构建AI Agents的模块化工具箱,旨在实现高度的可扩展性和易用性,通过最小化和单一目的的组件设计,类似于原子设计系统中的组件,提供工具和Agents的组合以创建强大的应用。基于Instructor构建,并利用Pydantic进行数据验证和序列化 No 19. NPC-Playground 是基于 Cubzh 和 Gigax 的 3D 演示平台,允许用户与 LLM驱动的 NPC进行交互,并通过 Lua 脚本教授 NPC 新技能 No 20. 几篇论文实现代码 No 21. Meta 公司推出了一个名为 No Language Left Behind (NLLB) 的人工智能翻译项目,旨在通过一个新型翻译模型支持 204 种语言,特别是低资源语言,以促进全球多语言之间的交流 No 22. Rin博客平台:基于Cloudflare Pages + Workers + D1 + R2的无服务器博客系统,支持快速部署且无需备案,仅需一个解析到Cloudflare的域名即可完成设置 No 23. Babylon:高性能C++基础库,支持C++高性能服务端开发,提供大量基础组件,广泛应用于对性能有严苛要求的场景,如搜索推荐引擎、自动驾驶车载计算等 No 24. [CL] Efficient Minimum Bayes Risk Decoding using Low-Rank Matrix ...... No 25. 通过实证手段表征了直接对齐算法中的奖励过度优化问题,建立了缩放律,并指出这可能源于算法中使用的奖励建模目标存在问题。//[LG]《Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms》 No 26. PDFme:基于TypeScript的PDF生成库,使用React构建,支持在浏览器和Node.js环境中工作 No 27. zfind:支持SQL-WHERE过滤的多格式文件搜索工具,能够快速检索包括tar、zip、7z和rar压缩包在内的文件系统,简化文件查找过程 No 28. [IR] A Bi-metric Framework for Fast Similarity Search 提出一种'双度量'最近邻搜索框架,利用精确度量和近似度量的互补,构建基于近似度量的数据结构,但查询时通过少量精确度量评估获得接近真实最近邻的结果,在文本检索任务上显示出优异的查询精度与效率权衡,充分展 ...... No 29. [LG]《Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms》 No 30. 早![太阳] No 31. Mesop:基于Python的快速Web应用开发框架,适用于构建演示和内部应用,提供直观的UI编写方式和丰富的组件库,支持热重载和IDE集成 No 32. 通过分层的全局到局部建模方法有效缓解了Transformer中自注意力在推理时的计算瓶颈,使得在维持可比困惑度的情况下推理吞吐量提升10-20倍。//[CL]《Block Transformer: Global-to-Local Language Modeling for Fast Inference》 No 33. [CL] Zyda: A 1.3T Dataset for Open Language Modeling 通过整合多开源数据集并进行深度处理,构建了迄今最大的开源NLP预训练语料Zyda,质量接近商业语料,为开源语言模型研究奠定数据基础。 ...... No 34. Micro Agent:代码自动编写助手,通过测试或设计截图迭代生成代码,提升开发效率 No 35. MixEval:大型语言模型评估套件,提供动态数据和实时更新的基准测试,旨在高效、准确地评估语言模型的性能,同时降低成本和时间消耗 No 36. 字节跳动语音合成seed-tts评估工具:用于评估零样本语音生成模型的跨域客观测试集,通过英语和普通话公共语料库的样本来衡量模型性能,包含英语和普通话的公共语料库样本,采用词错误率和说话人相似度作为客观评价指标 No 37. [IR] Item-Language Model for Conversational Recommendation ...... No 38. Kerykeion星象学库:基于Python的星象学计算工具,致力于以数据驱动的方式简化星象学分析过程 No 39. [LG] Learning to grok: Emergence of in-context learning and ...... No 40. Vision Agent:利用Agent框架自动生成代码以解决视觉任务的库,可快速生成代码帮助用户完成图像识别任务,简化视觉问题的解决过程 No 41. qStudio:免费SQL分析工具,支持多种数据库和高级数据分析功能,提供直观的图形用户界面 No 42. Craftgen:开源无代码AI平台,基于动态图解决方案和行动者模型,集成AI到每个工作流程中 No 43. [LG]《Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsity》 No 44. 今日推介(第1429期):用大语言模型协作完成长上下文任务、基于极端稀疏性的LLM零阶微调、公平LLM的不可能性、用全局到局部语言建模实现快速推理、直接对齐算法(DAA)中奖励模型过度优化的缩放率 ...... No 45. CUDA加速数学和机器学习:从入门到精通,利用NVIDIA GPU进行数学和机器学习的加速计算,适用于希望扩展算法至GPU的研究人员和应用专家 No 46. [CL]《Block Transformer: Global-to-Local Language Modeling for Fast Inference》 No 47. ComfyUI-StableAudioSampler:基于Stable Diffusion 1.0的音频采样器,集成于ComfyUI节点,用于创作节拍 No 48. Cohere 提供的方案指南,帮用户了解如何在 Cohere 的生成式 AI 平台上构建各种应用,包括智能Agent、开源软件集成、搜索与嵌入、云服务、检索增强生成(RAG)、摘要以及其他多种用例 No 49. 通过让多个语言模型Agent协作处理文本分段并交流信息的方式,实现了在长文本任务上进行有效的信息聚合和上下文推理。//[CL]《Chain of Agents: Large Language Models Collaborating on Long-Context Tasks》 No 50. Fyin:开源的本地运行的人工智能助手,快速提供答案,Perplexity AI的替代方案