aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(5.10)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. 如何逃脱递归训练的陷阱 No 2. NVIDIA TensorRT Model Optimizer：用于量化和压缩深度学习模型以优化GPU上推理性能的库 No 3. #免费##抽奖# 携手@图灵新知 @图灵文化送出3本《LangChain编程》 No 4. #免费##抽奖# 携手@博文视点Broadview 送出3本《基础统计学（第14版）（双色）》 No 5. Gemma 2B - 10M Context：支持高达 10M 的上下文长度的大型语言模型，通过递归局部注意力机制优化了内存使用，使得在低于 32GB 内存的环境下也能运行，并且对 CUDA 进行了原生推理优化 No 6. 人工反馈强化学习(RLHF)相关资源列表 No 7. TimesFM：Google Research开发的预训练时间序列基础模型，用于时间序列预测 No 8. Elicit Machine Learning Reading List：为新员工设计的机器学习课程，专注于语言模型，旨在平衡生产部署机器学习的相关论文和技术，以及对长期可扩展性重要的技术 No 9. MistoLine：多功能且强大的 SDXL-ControlNet 模型，专为适应各种线稿输入而设计，能够生成高质量的图像 No 10. 从匿名竞技场表现分析Llama 3性能 No 11. 几篇论文实现代码 No 12. [CL]《You Only Cache Once: Decoder-Decoder Architectures for Language Models》 No 13. Zimtohrli: Google 开源的 Zimtohrli 是一个用于音频压缩的心理声学感知度量工具，旨在量化人类对两个音频信号间可察觉差异的评估 No 14. Buzz：高质量预训练语言模型数据集，旨在通过迭代微调方法优化现有预训练语言模型的性能 No 15. 'GraphKAN -- Implementation of Graph Neural Network version ...... No 16. 免费课程：用LlamaIndex构建Agentic RAG应用，旨在教授如何用Agentic RAG 框架构建能够使用工具、推理和决策的研究用Agent No 17. '《动手学大模型》 No 18. 为2024年PyCon会议准备的关于“现代深度学习基础与PyTorch”的教程材料 No 19. KAN(Kolmogorov-Arnold Network)相关资源大列表 No 20. 免费课程：深入模型量化技术，旨在深入教授模型量化技术，帮助学员学习如何将模型权重压缩至原来的四分之一大小，同时保持压缩模型的性能 No 21. 刚刚评选出的首个ICLR时间检验奖获奖论文，翻出9年前这条微博，不禁感慨岁月匆匆//[论文]《Auto-Encoding Variational Bayes》 No 22. srai：一个Python库，专注于为地理空间机器学习任务创建嵌入，以简化和高效地解决地理空间问题 No 23. 晚安～ [月亮] No 24. [CV] Imagine Flash: Accelerating Emu Diffusion Models with ...... No 25. [CV] Attention-Driven Training-Free Efficiency Enhancement ...... No 26. Hugging Face推出LeRobot开源机器人代码库 No 27. Markdowner：快速将任何网站转换为适用于大型语言模型(LLM)的 Markdown 数据的工具 No 28. Hackerverse：通过语义地图、搜索引擎、自动子社区划分和情感/人气分析，探索并分析了超过4000万条Hacker News的帖子和评论 No 29. AWS推出新的大语言模型 No 30. SocialGym 2：轻量多机器人社交导航的基准测试和模拟器，使用ROS和OpenAI gym开发 No 31. Crawl4AI：开源的、专为大型语言模型(LLM)友好设计的网页爬虫和抓取工具 No 32. [CL] ChuXin: 1.6B Technical Report 网页链接提出ChuXin开源语言模型，开源训练所需信息以赋能开源社区，并通过渐进预训练扩展其对长文本的理解能力。 No 33. 用 GGML 和 llama.cpp 对 Llama 模型进行量化的实战，以及不同量化技术(NF4、GPTQ 和 GGML)的比较 No 34. 大模型的“能源之星”计划 No 35. 早！[太阳] No 36. 今日推介(第1401期)：变分Schrödinger扩散模型、语言模型的解码器-解码器架构、潜代码在分层机器人控制中的桥接作用、通过训练动态实现对“逆转诅咒”的理论理解、熵最小化的得与失 ...... No 37. [CL] MAmmoTH2: Scaling Instructions from the Web 网页链接通过文档召回、问答提取和问答优化三步骤，从网页中挖掘了1000万个高质量指导问答对，构建了WEBINSTRUCT数据集，并验证仅用该数据集训练的LLM可显著提升多领域推理能力。 No 38. [LG]《Is Flash Attention Stable?》 No 39. [RO]《From LLMs to Actions: Latent Codes as Bridges in Hierarchical Robot Control》 No 40. 孤独的青少年与AI聊天机器人“交朋友” No 41. [CV]《The Entropy Enigma: Success and Failure of Entropy Minimization》 No 42. 大模型白盒子构建指南：旨在从零开始手写代码，深入理解并实践大型语言模型（LLM）的构建，包括模型结构、RAG、Agent和Eval任务 No 43. Tegon：开源的、以AI为先的Jira和Linear替代品，专为工程团队设计，通过智能自动化和上下文提供来优化任务管理 No 44. nbfm：开源的文件管理器和CRDT（冲突无关数据类型）笔记编辑器，支持通过共享文件夹实现同步和协作 No 45. [CV] VisionGraph: Leveraging Large Multimodal Models for Graph ...... No 46. Symbolica：现代计算机代数系统，旨在处理包含数十亿项的表达式 No 47. DRUM_2004_V1：基于ESP32的鼓合成器项目，具有波表合成引擎、16步序列器和丰富的硬件控制功能 No 48. 提出变分Schrödinger扩散模型，通过变分逼近前向分数实现高效训练，使扩散模型在生成质量与计算效率之间取得平衡。//[LG]《Variational Schrödinger Diffusion Models》 No 49. NVIDIA 对 Meta Llama 3 大型语言模型进行加速优化 No 50. Time Series Analysis with Python：开源的 Python 时间序列分析课程，提供丰富的 Jupyter Notebooks和资料

May 10 '24 14:05 fly51fly