aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(5.10)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. 如何逃脱递归训练的陷阱 No 2. NVIDIA TensorRT Model Optimizer:用于量化和压缩深度学习模型以优化GPU上推理性能的库 No 3. #免费##抽奖# 携手@图灵新知 @图灵文化 送出3本《LangChain编程》 No 4. #免费##抽奖# 携手@博文视点Broadview 送出3本《基础统计学(第14版)(双色)》 No 5. Gemma 2B - 10M Context:支持高达 10M 的上下文长度的大型语言模型,通过递归局部注意力机制优化了内存使用,使得在低于 32GB 内存的环境下也能运行,并且对 CUDA 进行了原生推理优化 No 6. 人工反馈强化学习(RLHF)相关资源列表 No 7. TimesFM:Google Research开发的预训练时间序列基础模型,用于时间序列预测 No 8. Elicit Machine Learning Reading List:为新员工设计的机器学习课程,专注于语言模型,旨在平衡生产部署机器学习的相关论文和技术,以及对长期可扩展性重要的技术 No 9. MistoLine:多功能且强大的 SDXL-ControlNet 模型,专为适应各种线稿输入而设计,能够生成高质量的图像 No 10. 从匿名竞技场表现分析Llama 3性能 No 11. 几篇论文实现代码 No 12. [CL]《You Only Cache Once: Decoder-Decoder Architectures for Language Models》 No 13. Zimtohrli: Google 开源的 Zimtohrli 是一个用于音频压缩的心理声学感知度量工具,旨在量化人类对两个音频信号间可察觉差异的评估 No 14. Buzz:高质量预训练语言模型数据集,旨在通过迭代微调方法优化现有预训练语言模型的性能 No 15. 'GraphKAN -- Implementation of Graph Neural Network version ...... No 16. 免费课程:用LlamaIndex构建Agentic RAG应用,旨在教授如何用Agentic RAG 框架构建能够使用工具、推理和决策的研究用Agent No 17. '《动手学大模型》 No 18. 为2024年PyCon会议准备的关于“现代深度学习基础与PyTorch”的教程材料 No 19. KAN(Kolmogorov-Arnold Network)相关资源大列表 No 20. 免费课程:深入模型量化技术,旨在深入教授模型量化技术,帮助学员学习如何将模型权重压缩至原来的四分之一大小,同时保持压缩模型的性能 No 21. 刚刚评选出的首个ICLR时间检验奖获奖论文,翻出9年前这条微博,不禁感慨岁月匆匆//[论文]《Auto-Encoding Variational Bayes》 No 22. srai:一个Python库,专注于为地理空间机器学习任务创建嵌入,以简化和高效地解决地理空间问题 No 23. 晚安~ [月亮] No 24. [CV] Imagine Flash: Accelerating Emu Diffusion Models with ...... No 25. [CV] Attention-Driven Training-Free Efficiency Enhancement ...... No 26. Hugging Face推出LeRobot开源机器人代码库 No 27. Markdowner:快速将任何网站转换为适用于大型语言模型(LLM)的 Markdown 数据的工具 No 28. Hackerverse:通过语义地图、搜索引擎、自动子社区划分和情感/人气分析,探索并分析了超过4000万条Hacker News的帖子和评论 No 29. AWS推出新的大语言模型 No 30. SocialGym 2:轻量多机器人社交导航的基准测试和模拟器,使用ROS和OpenAI gym开发 No 31. Crawl4AI:开源的、专为大型语言模型(LLM)友好设计的网页爬虫和抓取工具 No 32. [CL] ChuXin: 1.6B Technical Report 网页链接 提出ChuXin开源语言模型,开源训练所需信息以赋能开源社区,并通过渐进预训练扩展其对长文本的理解能力。 No 33. 用 GGML 和 llama.cpp 对 Llama 模型进行量化的实战,以及不同量化技术(NF4、GPTQ 和 GGML)的比较 No 34. 大模型的“能源之星”计划 No 35. 早![太阳] No 36. 今日推介(第1401期):变分Schrödinger扩散模型、语言模型的解码器-解码器架构、潜代码在分层机器人控制中的桥接作用、通过训练动态实现对“逆转诅咒”的理论理解、熵最小化的得与失 ...... No 37. [CL] MAmmoTH2: Scaling Instructions from the Web 网页链接 通过文档召回、问答提取和问答优化三步骤,从网页中挖掘了1000万个高质量指导问答对,构建了WEBINSTRUCT数据集,并验证仅用该数据集训练的LLM可显著提升多领域推理能力。 No 38. [LG]《Is Flash Attention Stable?》 No 39. [RO]《From LLMs to Actions: Latent Codes as Bridges in Hierarchical Robot Control》 No 40. 孤独的青少年与AI聊天机器人“交朋友” No 41. [CV]《The Entropy Enigma: Success and Failure of Entropy Minimization》 No 42. 大模型白盒子构建指南:旨在从零开始手写代码,深入理解并实践大型语言模型(LLM)的构建,包括模型结构、RAG、Agent和Eval任务 No 43. Tegon:开源的、以AI为先的Jira和Linear替代品,专为工程团队设计,通过智能自动化和上下文提供来优化任务管理 No 44. nbfm:开源的文件管理器和CRDT(冲突无关数据类型)笔记编辑器,支持通过共享文件夹实现同步和协作 No 45. [CV] VisionGraph: Leveraging Large Multimodal Models for Graph ...... No 46. Symbolica:现代计算机代数系统,旨在处理包含数十亿项的表达式 No 47. DRUM_2004_V1:基于ESP32的鼓合成器项目,具有波表合成引擎、16步序列器和丰富的硬件控制功能 No 48. 提出变分Schrödinger扩散模型,通过变分逼近前向分数实现高效训练,使扩散模型在生成质量与计算效率之间取得平衡。//[LG]《Variational Schrödinger Diffusion Models》 No 49. NVIDIA 对 Meta Llama 3 大型语言模型进行加速优化 No 50. Time Series Analysis with Python:开源的 Python 时间序列分析课程,提供丰富的 Jupyter Notebooks和资料

fly51fly avatar May 10 '24 14:05 fly51fly