爱可可微博热门分享(5.9)
No 1. 免费课程:深入模型量化技术,旨在深入教授模型量化技术,帮助学员学习如何将模型权重压缩至原来的四分之一大小,同时保持压缩模型的性能 No 2. Skyrim:旨在通过消费级 GPU 快速运行大型天气模型,以提高天气预报的准确性和可访问性 No 3. 刚刚评选出的首个ICLR时间检验奖获奖论文,翻出9年前这条微博,不禁感慨岁月匆匆//[论文]《Auto-Encoding Variational Bayes》 No 4. 免费课程:用LlamaIndex构建Agentic RAG应用,旨在教授如何用Agentic RAG 框架构建能够使用工具、推理和决策的研究用Agent No 5. IC-Light:用于图像光照操纵的项目,能实现文本条件和背景条件下的图像重照明 No 6. TimesFM:Google Research开发的预训练时间序列基础模型,用于时间序列预测 No 7. 用 GGML 和 llama.cpp 对 Llama 模型进行量化的实战,以及不同量化技术(NF4、GPTQ 和 GGML)的比较 No 8. [CL]《A Transformer with Stack Attention》 No 9. Graph of Language Models:旨在构建世界上最大的语言模型图谱,通过整合多种专业模型并训练Octopus模型以高效连接这些模型,以期达到与闭源模型相竞争的性能 No 10. #免费##抽奖# 携手@图灵新知 @图灵文化 送出3本《LangChain编程》 No 11. #免费##抽奖# 携手@博文视点Broadview 送出3本《大语言模型应用指南》 No 12. NVIDIA 对 Meta Llama 3 大型语言模型进行加速优化 No 13. 几篇论文实现代码 No 14. Finetuning Whisper for dynamic audio context robustness:提高Whisper模型在动态音频上下文下鲁棒性 No 15. [CL] MAmmoTH2: Scaling Instructions from the Web 网页链接 通过文档召回、问答提取和问答优化三步骤,从网页中挖掘了1000万个高质量指导问答对,构建了WEBINSTRUCT数据集,并验证仅用该数据集训练的LLM可显著提升多领域推理能力。 No 16. AlphaFold 3发布,联手Isomorphic Labs加速药物设计 No 17. [论文]《Auto-Encoding Variational Bayes》 No 18. '《动手学大模型》 No 19. [CL] FlashBack:Efficient Retrieval-Augmented Language Modeling ...... No 20. 大模型白盒子构建指南:旨在从零开始手写代码,深入理解并实践大型语言模型(LLM)的构建,包括模型结构、RAG、Agent和Eval任务 No 21. NVIDIA TensorRT Model Optimizer:用于量化和压缩深度学习模型以优化GPU上推理性能的库 No 22. 'FCN-KAN - Kolmogorov–Arnold Networks with modified activation ...... No 23. Island AI:专为处理大型语言模型(LLM)结构化输出而设计的 TypeScript 工具包 No 24. 早![太阳] No 25. Hugging Face推出LeRobot开源机器人代码库 No 26. VILA: 预训练的视觉语言模型(VLM),具备视频理解和多图像理解能力,支持云端到边缘设备(如Jetson Orin和笔记本电脑)的部署 No 27. Zimtohrli: Google 开源的 Zimtohrli 是一个用于音频压缩的心理声学感知度量工具,旨在量化人类对两个音频信号间可察觉差异的评估 No 28. [LG] Granite Code Models: A Family of Open Foundation Models ...... No 29. 孤独的青少年与AI聊天机器人“交朋友” No 30. [LG] On the Foundations of Earth and Climate Foundation Models ...... No 31. 通过指数门控和修改记忆结构扩展LSTM,构建新的xLSTM模型,在语言建模任务上表现强劲,性能可与Transformer和状态空间模型相媲美。//[LG]《xLSTM: Extended Long Short-Term Memory》 No 32. markdown_crawler:多线程网络爬虫,能递归地爬取网站并为每个页面创建 Markdown 文件,专为大型语言模型文档解析设计 No 33. [LG]《Is Flash Attention Stable?》 No 34. OpenAI发布Model Spec文档 No 35. 今日推介(第1400期):基于栈注意力的Transformer、通过AI-Human协作发现新的可积分系统、经验证的神经压缩感知、从语言中学习抽象规划、用xLSTM扩展LSTM ...... No 36. Neuralink的脑机接口(BCI)技术助力四肢瘫痪患者重获自由 No 37. 'Chenyme-AAVT(AI Auto Video-Audio Translation) - 全自动(音频)视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译后的视频' ...... No 38. MistoLine:多功能且强大的 SDXL-ControlNet 模型,专为适应各种线稿输入而设计,能够生成高质量的图像 No 39. [CV]《ImageInWords: Unlocking Hyper-Detailed Image Descriptions》 No 40. 晚安~ [月亮] No 41. Pinecone的RAG教程 No 42. [LG]《Verified Neural Compressed Sensing》 No 43. 面向天气和气候数据理解的深度学习基础模型相关论文资源列表 No 44. nbfm:开源的文件管理器和CRDT(冲突无关数据类型)笔记编辑器,支持通过共享文件夹实现同步和协作 No 45. 游戏是学习编程的最佳方式——从CSS、Python、JavaScript到区块链。十个最佳在线通过游戏学编程网站推荐: ...... No 46. databonsai:用 LLM 进行数据清洗的 Python 库 No 47. RAG-Retrieval:开源的Python库,旨在统一高效微调RAG检索模型,包括嵌入、ColBERT和交叉编码器模型,支持多种排序模型并优化长文档处理 No 48. 关于进化算法和强化学习结合的研究论文和代码库 No 49. //@爱可可-爱生活:欢迎参与~ No 50. 通过从语言中提取概念和学习规划兼容的抽象模型,实现了一个从示范中自动发现状态与动作抽象表示的框架,并支持泛化到更复杂任务。//[RO]《Learning Planning Abstractions from Language》