爱可可微博热门分享(3.4)
No 1. 大模型面试题及答案 No 2. Groq语言处理单元(LPU)的底层架构 No 3. Generate:一个 Python 包,用于访问世界一流的生成模型,支持多平台,涵盖国内外 10+ 平台;提供统一 API,屏蔽不同平台的差异;支持同步、异步、流式调用;提供自带电池功能,包括输入检查、参数检查等;代码质量高,拥有严格的类型提示和良好的测试覆盖率 No 4. LLM微调概览 No 5. #抽奖##赠书# 携手@异步图书 送出3本《ChatGPT原理与应用开发》 No 6. RAG之索引(Indexing) No 7. 面试准备5最佳免费LeetCode资源集锦 No 8. 'Awesome Compression - 模型压缩的小白入门教程' 网页链接 GitHub: github.com/bupt-ai-club/awesome-compression ...... No 9. [CL]《How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning》 No 10. #抽奖##赠书# 携手@图灵文化 @图灵新知 送出3本《大模型应用开发极简入门:基于GPT-4和ChatGPT》 No 11. 为啥模型不好使? No 12. Diffusion Transformers相关资源列表 No 13. Open-Sora Plan:Sora开源复现项目 No 14. 晚安~ [月亮] No 15. Obsidian PDF++:Obsidian.md 的插件,用于提升 PDF 阅读&编辑体验 No 16. log10:一站式LLM数据管理客户端库 No 17. 扩散模型图像编辑相关文献列表 No 18. 早![太阳] No 19. [CL] Datasets for Large Language Models: A Comprehensive Survey ...... No 20. [CL] PlanGPT: Enhancing Urban Planning with Tailored Language ...... No 21. [CL]《RNNs are not Transformers (Yet): The Key Bottleneck on In-context Retrieval》 No 22. 《如何生成文本:通过 Transformers 用不同的解码方法生成文本》 No 23. Spectrogram Generator:将音频文件转换为频谱图 No 24. Hugging Face推出ZeroGPU,提供动态的免费GPU访问 No 25. Honcho:用户上下文管理解决方案,用于构建AI Agent和LLM驱动的应用 No 26. SportsLabKit:专为高级体育分析而设计的工具包,将原始体育比赛录像转化为可操作的CSV数据 No 27. 'Intel® NPU Acceleration Library' GitHub: github.com/intel/intel-npu-acceleration-library ...... No 28. #抽奖##赠书# 携手@博文视点Broadview 送出3本《图数据库:理论与实践》 No 29. 人类偏好预测:从模型排序到模型路由 No 30. mlx-swift-chat:专为苹果芯片设计的高效机器学习框架,本地运行LLM模型,实时在苹果芯片上运行LLM(如Llama、Mistral)模型的全新原生SwiftUI应用 No 31. 'Clean, Robust, and Unified PyTorch implementation of popular ...... No 32. 从理论上分析了RNN在上下文信息检索方面的局限性,并通过引入基于检索增强生成(RAG)和增加单层Transformer来增强RNN的能力,证明了这些方法足以使RNN解决所有多项式时间内可解的问题,从而缩小了与Transformer在算法问题表示能力上的差距。//[CL]《RNNs are not Transformers (Yet): The Key Bottleneck on In-context Retrieval》 No 33. Awesome Vision Pro:Vision Pro相关资源列表 No 34. TileDB Vector Search:基于TileDB存储引擎开发的用于向量搜索的C++库和Python API No 35. 首次从神经机制的角度分析了大型语言模型在执行链式思维推理过程中的内部机制,发现了模型内部存在功能鸿沟和多个并行信息处理路径,这些发现对如何提高语言模型的推理能力提供了深入见解。//[CL]《How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning》 No 36. 几篇论文实现代码 No 37. '1st Solution For Conversational Multi-Doc QA Workshop & International ...... No 38. 面向无人驾驶的世界模型相关资源列表 No 39. 今日推介(第1334期):不确定性分离的基准测试、通过逐步验证运行时执行的大型语言模型调试器、思维链推理的机制理解、RNN上下文检索的关键瓶颈、面向神经符号视频推理的多模态蕴涵树 ...... No 40. FakeSoraAPI:“伪造”的OpenAI Sora API,用于开发者提前进行相关的开发测试 No 41. [CL]《LDB: A Large Language Model Debugger via Verifying Runtime Execution Step-by-step》 No 42. 'Spellbook Docker Compose - AI stack for interacting with LLMs, ...... No 43. [LG] Watermark Stealing in Large Language Models 挑战了大型语言模型(LLM)水印技术当前的安全性认知,展示了一种新的攻击方式——水印窃取(WS),通过这种方法,攻击者可以通过简单地查询LLM的API,以不到50美元的成本建立水印规则的近似模型,并实现超过80%成功率的欺骗性 ...... No 44. 2024年LLM研究趋势:模型合并,专家混合,更小的LLM No 45. DBApi:零代码开发API,只需要写sql,自动生成http API No 46. Mountaineer:旨在轻松用Python和R... No 47. //@爱可可-爱生活:欢迎参与~//#抽奖##赠书# 携手@图灵文化 @图灵新知 送出3本《大模型应用开发极简入门:基于GPT-4和ChatGPT》 No 48. [LG]《Benchmarking Uncertainty Disentanglement: Specialized Uncertainties for Specialized Tasks》 No 49. [CL] Stable LM 2 1.6B Technical Report 网页链接 StableLM 2 1.6B是一款新一代语言模型,特点是开源、透明且成本效益高,使用公开数据集进行训练,耗费约92k ...... No 50. pfl: 旨在加速私有联邦学习研究的仿真框架