aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(1.29)

Open fly51fly opened this issue 11 months ago • 0 comments

No 1. DeepSeek R1 训练过程概览 No 2. 《矩阵微积分》讲义，旨在向熟悉基础微积分和线性代数的本科生介绍矩阵微积分的课程，该课程专注于向量空间上的函数微积分，特别是在机器学习和其他领域中的应用，包括矩阵逆和分解、常微分方程求解器的导数以及随机函数的导数等 No 3. 致力于为思维模型提供完全开源的数据整理项目，首要目标是整理一个推理数据集，用于训练超越 DeepSeek-R1-Distill-Qwen-32B 和 DeepSeek-R1-Distill-Qwen-7B 在数学和编程推理基准上的小型推理模型 No 4. DeepSeek-R1图解：深度解析DeepSee... No 5. [325星]RAGEN：首个开源复现DeepSeek-R1的强化学习训练框架，助力智能体模型训练。亮点：1. 首次开源复现，填补行业空白；2. 支持多轮统一处理，避免批量大小不稳定；3. 提供世界建模能力，助力智能体规划 No 6. 早！[太阳] No 7. [396星]DeepClaude：高性能LLM推理API和聊天界面，结合DeepSeek R1的深度推理与Anthropic Claude的创造力。亮点：1. 零延迟响应，R1推理与Claude回答无缝衔接；2. 14倍成本降低，高效利用资源；3. 完全私密，本地管理API密钥 No 8. [20.5k星]Label Studio：多功能数据标注工具，助力AI模型训练。亮点：1. 支持多种数据类型，如音频、文本、图像等；2. 提供标准化输出格式，方便数据整合；3. 拥有丰富的模板，简化标注流程 No 9. deepseek R1 使用的 GRPO 的可视化简要解释 No 10. 30天GPU编程自学计划 No 11. [645星]Compose Craft：一个让Docker Compose文件管理变得轻松的图形化工具。亮点：1. 通过图形界面快速创建和编辑Docker Compose文件；2. 一键分享Docker Compose图，生成公共链接；3. 支持导入自定义Docker文件并导出代码 No 12. [CL]《Self-reflecting Large Language Models: A Hegelian Dialectical Approach》 No 13. [62星]r1-overthinker：让DeepSeek R1模型深度思考的工具。亮点：1. 强制模型思考更长时间，提升推理深度；2. 支持1.5B到70B参数的多种模型，满足不同需求；3. 无限上下文长度，仅受限于显存 No 14. [4.7k星]Qwen2.5-VL：强大的多模态语言模型，助力视觉与语言的深度融合。亮点：1. 强大的文档解析能力，支持多场景、多语言文档处理；2. 精准的对象定位与计数，支持多种格式；3. 超长视频理解能力，可处理数小时视频并秒级提取事件片段 No 15. DeepSeek R1 的 1.58-bit 动态量化，将模型尺寸大幅压缩 80% 的同时，保持了良好的性能 No 16. [313星]HyperQueue：为高性能计算（H... No 17. [112星]mini_qwen：从零开始打造你的专属大语言模型！只需12G显存，就能在T4显卡上开启训练之旅。亮点：1. 1B参数，支持中英文，满足多样化需求；2. 预训练、微调、直接偏好优化三步走，训练流程清晰；3. 详细教程与代码，新手也能轻松上手 No 18. [267星]Awesome-GraphRAG：为定制化大语言模型提供基于图的检索增强生成（GraphRAG）资源宝库 No 19. 真是过年了！Deepseek最新开源Janus-Pro，统一的理解和生成多模态大模型，在图像生成、图像描述、地标识别、视觉常识、OCR等任务上表现出色 No 20. 晚安～ [月亮] No 21. [281星]Brainstormers：为头脑风暴提供专业Agent，激发创新思维。亮点：1. 提供多种头脑风暴技巧，如Big Mind Mapping、Reverse Brainstorming等；2. 结构化链式引导，全面探索想法；3. 成本低至$0.01/次，性价比超高 No 22. [1.1k星]Malimite：iOS和macOS的全能反编译工具，助力研究人员轻松分析和解码IPA文件及应用包。亮点：1. 直接支持Swift、Objective-C和苹果资源；2. 自动解码iOS资源，避免冗余代码反编译；3. 一键重构Swift类，效率提升80% No 23. [LG]《Training Dynamics of In-Context Learning in Linear Attention》 No 24. [1.4k星]Goose：开源、可扩展的AI Agent，不只是代码建议，支持安装、执行、编辑和用任何LLM测试 No 25. [66星]PengChengStarling：基于icefall项目的多语言语音识别（ASR）模型，一站式解决多语言语音识别难题。亮点：1. 支持8种语言，涵盖中、英、俄、越、日、泰、印尼、阿等；2. 模型体积仅为Whisper-Large v3的20%，推理速度提升7倍；3. 提供完整的ASR流程支持，从数据处理到模型部署一应俱全 No 26. [151星]LLM-Calc：一键计算量化语言模型的最大适配内存，帮你轻松优化模型推理效率。亮点：1. 实时计算，瞬间得出结果；2. 支持多种量化级别，适配不同硬件；3. 界面简洁，操作零门槛 No 27. [860星]py2many：将Python代码转换为多种语言的神奇工具。亮点：1. 支持10多种语言，包括Rust、C++、Julia等；2. 提升代码性能，解决Python运行速度慢的问题；3. 增强代码安全性，降低低级语言编程风险 No 28. [115星]YuE：开源的全曲生成基础模型，类似Suno.ai，但完全开放。亮点：1. 能将歌词转化为完整的歌曲，包括人声和伴奏；2. 支持多种音乐风格，如流行和金属；3. 提供多种模型版本，满足不同需求 No 29. MNN LLM App：为安卓设备带来强大的大语言模型应用体验。亮点：1. 多模态支持，涵盖文本、图像、音频等多种任务；2. CPU推理优化，预填充速度比llama.cpp快8.6倍，解码速度快2.3倍；3. 广泛的模型兼容性，支持Qwen、Gemma、Llama等主流模型 No 30. [103星]Virtual Lab：一个为科学研究打造的AI虚拟实验室，让人类与AI协同完成科研任务 No 31. [257星]Meelo：为音乐收藏家打造的自托管音乐服务器。亮点：1. 专为音乐收藏设计，支持音乐视频与稀有曲目展示；2. 灵活的元数据解析，支持所有音频和视频格式；3. 提供丰富的音乐信息，如歌词、专辑版本等 No 32. [LG]《StagFormer: Time Staggering Transformer Decoding for RunningLayers In Parallel》 No 33. [1.1k星]Ollama Deep Researcher：本地运行的AI研究助手，帮你高效完成网络调研和报告撰写。亮点：1. 完全本地运行，安全无忧；2. 自动迭代搜索，深度挖掘信息，最多可进行3次迭代；3. 自动生成Markdown格式的研究报告，方便整理和分享 No 34. [83星]PsycheFoundation/psyche：为人类打造超级智能的开源基础设施。亮点：1. 开放性，让每个人都能参与超级智能的开发；2. 去中心化，确保开发过程的公平性和透明度；3. 高效的模型训练代码，加速超级智能的发展 No 35. [25星]EvolvingLMMs-Lab/open-r1-multimodal：为 open-r1 添加多模态模型训练功能。亮点：1. 首批8k多模态RL训练样本，聚焦数学推理，数据丰富且质量高；2. 集成Qwen2-VL系列等VLMs，模型选择多样；3. 提供详细训练脚本和评估方法，易于上手和扩展 No 36. [129星]ErisForge：轻松修改大型语言模型（LLM）内部层，打造个性化AI响应。亮点：1. 简单易用，快速上手；2. 支持多种模型，广泛适用；3. 自定义行为方向，精准调控 No 37. [LG]《Scaling laws for decoding images from brain activity》 No 38. [LG] A Survey of Optimization Methods for Training DL Models: ...... No 39. 通俗版解读查看图片//[LG]《Training Dynamics of In-Context Learning in Linear Attention》 No 40. 晚安～ [月亮] No 41. 本文提出了一种基于黑格尔辩证法的LLM自反思框架，通过迭代地生成和综合对立观点，实现模型的自我批判和新颖想法的产生，并通过动态退火温度控制和多智能体投票评估，显著提升了LLM的创造性和自省能力，为构建更具智能的AI系统提供了新的视角。 No 42. [LG]《Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity》 No 43. [20星]F5_TTS_Faster：为F5-TTS推理加速，速度提升约4倍！亮点：1. 使用ONNX和Tensorrt-LLM加速，推理速度从3.2s降低到0.72s；2. 支持NVIDIA GeForce RTX 3090，硬件兼容性好；3. 提供详细的安装和使用指南，易于上手 No 44. [182星]ComfyUI-ReActor：为ComfyUI提供快速简单的换脸扩展节点，让换脸操作变得轻松又高效。亮点：1. 支持多种换脸模型，包括ReSwapper和Inswapper；2. 配备NSFW检测器，避免违规内容生成；3. 提供丰富的节点功能，如卸载模型、保存和加载脸模等 No 45. UC Berkeley为数学新手量身打造的数学思维入门课程。亮点：1. 专为无离散数学经验的学生设计；2. 课程内容覆盖从基础集合论到高级组合数学；3. 提供丰富的学习资源，包括视频、笔记和练习题 No 46. （可免费书）学术写作指南：由哈佛大学学者编写的 3... No 47. DeepSeek 以有限资源取得的成功有力地挑战了当前 AI 发展中过度依赖大规模资源扩展的范式，揭示了创新和效率才是 ...... No 48. StagFormer 通过引入时间错开机制，创新性地实现了 Transformer 模型解码过程在深度方向的并行化，从而显著加速了推理速度，同时通过不同的变体和优化技术，在内存效率、模型性能和计算效率之间取得了良好的平衡，展示了深度学习架构并行化设计的巨大潜力，并启发了对未来更高效和可解释的 Transformer...全文//[LG]《StagFormer: Time Staggering Transformer Decoding for RunningLayers In Parallel》 No 49. 今日推介(第1665期)：线性注意力上下文学习的训练动力学、并行运行层的时间错开Transformer解码、用模态感知稀疏性增强多模态状态空间模型、基于黑格尔辩证法的自反思大型语言模型、脑活动图像解码的缩放律 ...... No 50. KeymouseGo：像按键精灵一样的自动化操作软件，能记录你的鼠标和键盘动作，然后自动重复执行，是简化重复性工作的利器

Jan 29 '25 14:01 fly51fly