爱可可微博热门分享(3.2)
No 1. #抽奖##赠书# 携手@异步图书 送出3本《ChatGPT原理与应用开发》 No 2. Open-Sora Plan:Sora开源复现项目 No 3. oms-Diffusion:虚拟试穿项目,致力于解决服装行业高昂成本问题,支持IPadapter-faceID结合controlnet_openpose,用户可上传服装图片与参考姿势图进行试穿 No 4. #抽奖##赠书# 携手@图灵文化 @图灵新知 送出3本《大模型应用开发极简入门:基于GPT-4和ChatGPT》 No 5. 图机器学习课程资料 No 6. [CL] Large Language Models and Games: A Survey and Roadmap 综述了大型语言模型(LLM)在游戏领域的应用现状,并展望了未来发展方向。文章指出,自2019年GPT-2发布以来,LLMs在文本生成的质量和控制性上取得了显著进步。本文强调了LLM在游戏内外可以扮演的多种角色,包括玩 ...... No 7. face-to-sticker:把人脸转成贴画 No 8. #抽奖##赠书# 携手@博文视点Broadview 送出3本《图数据库:理论与实践》 No 9. luminal:一个深度学习库,利用可组合的编译器实现高性能。它以极快的速度运行,支持Metal和CUDA,使用Rust编写,直接与底层API交互,无需中间层。其核心思想是提前编译所有内容,采用静态计算图实现惰性执行,使得编译器可以全局优化,实现了高效的核心运算与编译时间的分离 No 10. AI计算和环境之间的矛盾日益凸显 No 11. 大语言模型将改变编程…但非常有限 No 12. [CV] Trends, Applications, and Challenges in Human Attention ...... No 13. 晚安~ [月亮] No 14. '青梧字幕 - 青梧字幕是一款基于whisper的AI字幕提取工具,使用C++版本的whisper.cpp进行底层处理,前端界面采用Electron ...... No 15. 代表性LLM文本数据集大列表,包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集 No 16. [LG] StarCoder 2 and The Stack v2: The Next Generation 介绍了大型代码语言模型(Code ...... No 17. [LG]《Beyond Language Models: Byte Models are Digital World Simulators》 No 18. ActionWeaver:AI应用框架,使LLM函数调用更加简便 No 19. hotpdf:以快速、高效的方式解析PDF文件,可用于查找和提取PDF中的文本,克服使用pdfquery等库解析大型PDF文件时遇到的困难 No 20. 几篇论文实现代码 No 21. 马斯克起诉OpenAI:有悖初心 No 22. [CV] NARUTO: Neural Active Reconstruction from Uncertain Target ...... No 23. [LG]《Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality》 No 24. IntelliQ:基于大型语言模型(LLM)的多轮问答系统,结合了先进的意图识别和词槽填充(Slot Filling)技术,致力于提升对话系统的理解深度和响应精确度 No 25. ’New API - 基于One API的二次开发版本' GitHub: github.com/Calcium-Ion/new-api ...... No 26. [CL] Tokenization Is More Than Compression 网页链接 质疑了一个在自然语言处理(NLP)领域被广泛认同的假设:更少的分词(tokenization)结果会带来更好的下游任务表现。介绍了一种新的分词器PathPiece,旨在以最少的分词数量处理文本,并通过大量实验发现,减少分词数量并不一定能提升 ...... No 27. MarauderMap:大规模勒索软件样本集 No 28. 𝚃𝚎𝚡𝚃𝚎𝚕𝚕𝚎𝚛:基于ViT的端到端公式识别模型,可以把图片转换为对应的latex公式 No 29. '《构建你自己的 AI 辅助编码助手》 No 30. The Foundation Model Development Cheatsheet:基础模型开发速查,旨在提供开发和发布模型的最佳实践。重点关注工具,如数据目录、搜索/分析工具、评估存储库,以及总结、调查或指导重要开发决策的文献 No 31. 'search2ai - 让你的 LLM API 支持联网,搜索、新闻、网页总结,已支持OpenAI、Gemini,大模型会根据你的输入判断是否联网' ...... No 32. 2024年LLM研究趋势:模型合并,专家混合,更小的LLM No 33. [IR] Exploring the Impact of Large Language Models on Recommender ...... No 34. '收集C/C++新手学习的入门项目,整理收纳开发者开源的小项目、工具、框架、游戏等,视频,书籍,面试题/算法题,技术文章。' ...... No 35. [CL] Stable LM 2 1.6B Technical Report 网页链接 StableLM 2 1.6B是一款新一代语言模型,特点是开源、透明且成本效益高,使用公开数据集进行训练,耗费约92k ...... No 36. 早![太阳] No 37. [CL] Latent Attention for Linear Time Transformers 提出一种新的Transformer模型'Latte ...... No 38. Mountaineer:旨在轻松用Python和R... No 39. Google用Stack Overflow数据丰富其Gemini问答AI No 40. [LG]《Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models》 No 41. 今日推介(第1332期):用字节模型作为数字世界模拟器、基于混合门控线性递归与局部注意力的高效语言模型、神经网络可塑性丧失的原因分析、上下文学习中多头Softmax注意力的训练动态、基于梯度下降的关联记忆学习 ...... No 42. [LG]《Large Language Models As Evolution Strategies》 No 43. 通过统计物理方法分析了在高维空间和大数据集情况下,生成扩散模型的动态行为,揭示了从纯噪声到记忆化数据点的三个阶段,并通过对简化模型的分析和实际数据的验证,提供了一个理解维度诅咒和避免记忆化问题的理论框架。//[LG]《Dynamical Regimes of Diffusion Models》 No 44. 提出bGPT模型,通过预测下一个字节的方法超越了传统深度学习的界限,能直接解读和操作二进制数据,实现对数字世界的内在和全面理解,不仅在传统领域(如文本、音频、图像)展现出色性能,也在模拟算法和硬件行为等新领域表现出创新能力和应用潜力。//[LG]《Beyond Language Models: Byte Models are Digital World Simulators》 No 45. //@爱可可-爱生活:欢迎参与~ No 46. [LG]《Learning Associative Memories with Gradient Descent》 No 47. [LG] Does Negative Sampling Matter? A Review with Insights into ...... No 48. 提出了一个理论分析框架,用以研究多头Softmax注意力模型在多任务线性回归中上下文学习的梯度流训练动态,并首次证明了这一模型在适当初始化下的全局收敛性,揭示了训练过程中的“任务分配”现象,并证实了多头结构相较于单头结构具有明显的优势。//[LG]《Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality》 No 49. 手把手教程:用Gemma, MongoDB 和开源模型构建RAG系统 No 50. '本地LLM使用指南 0.2' GitHub: github.com/xue160709/Local-LLM-User-Guideline/blob/main/README-zh.md ......