aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(1.29)

Open fly51fly opened this issue 11 months ago • 0 comments

No 1. DeepSeek R1 训练过程概览 No 2. 《矩阵微积分》讲义,旨在向熟悉基础微积分和线性代数的本科生介绍矩阵微积分的课程,该课程专注于向量空间上的函数微积分,特别是在机器学习和其他领域中的应用,包括矩阵逆和分解、常微分方程求解器的导数以及随机函数的导数等 No 3. 致力于为思维模型提供完全开源的数据整理项目,首要目标是整理一个推理数据集,用于训练超越 DeepSeek-R1-Distill-Qwen-32B 和 DeepSeek-R1-Distill-Qwen-7B 在数学和编程推理基准上的小型推理模型 No 4. DeepSeek-R1图解:深度解析DeepSee... No 5. [325星]RAGEN:首个开源复现DeepSeek-R1的强化学习训练框架,助力智能体模型训练。亮点:1. 首次开源复现,填补行业空白;2. 支持多轮统一处理,避免批量大小不稳定;3. 提供世界建模能力,助力智能体规划 No 6. 早![太阳] ​ No 7. [396星]DeepClaude:高性能LLM推理API和聊天界面,结合DeepSeek R1的深度推理与Anthropic Claude的创造力。亮点:1. 零延迟响应,R1推理与Claude回答无缝衔接;2. 14倍成本降低,高效利用资源;3. 完全私密,本地管理API密钥 No 8. [20.5k星]Label Studio:多功能数据标注工具,助力AI模型训练。亮点:1. 支持多种数据类型,如音频、文本、图像等;2. 提供标准化输出格式,方便数据整合;3. 拥有丰富的模板,简化标注流程 No 9. deepseek R1 使用的 GRPO 的可视化简要解释 ​ No 10. 30天GPU编程自学计划 No 11. [645星]Compose Craft:一个让Docker Compose文件管理变得轻松的图形化工具。亮点:1. 通过图形界面快速创建和编辑Docker Compose文件;2. 一键分享Docker Compose图,生成公共链接;3. 支持导入自定义Docker文件并导出代码 No 12. [CL]《Self-reflecting Large Language Models: A Hegelian Dialectical Approach》 No 13. [62星]r1-overthinker:让DeepSeek R1模型深度思考的工具。亮点:1. 强制模型思考更长时间,提升推理深度;2. 支持1.5B到70B参数的多种模型,满足不同需求;3. 无限上下文长度,仅受限于显存 No 14. [4.7k星]Qwen2.5-VL:强大的多模态语言模型,助力视觉与语言的深度融合。亮点:1. 强大的文档解析能力,支持多场景、多语言文档处理;2. 精准的对象定位与计数,支持多种格式;3. 超长视频理解能力,可处理数小时视频并秒级提取事件片段 No 15. DeepSeek R1 的 1.58-bit 动态量化,将模型尺寸大幅压缩 80% 的同时,保持了良好的性能 No 16. [313星]HyperQueue:为高性能计算(H... No 17. [112星]mini_qwen:从零开始打造你的专属大语言模型!只需12G显存,就能在T4显卡上开启训练之旅。亮点:1. 1B参数,支持中英文,满足多样化需求;2. 预训练、微调、直接偏好优化三步走,训练流程清晰;3. 详细教程与代码,新手也能轻松上手 No 18. [267星]Awesome-GraphRAG:为定制化大语言模型提供基于图的检索增强生成(GraphRAG)资源宝库 No 19. 真是过年了!Deepseek最新开源Janus-Pro,统一的理解和生成多模态大模型,在图像生成、图像描述、地标识别、视觉常识、OCR等任务上表现出色 No 20. 晚安~ [月亮] ​ No 21. [281星]Brainstormers:为头脑风暴提供专业Agent,激发创新思维。亮点:1. 提供多种头脑风暴技巧,如Big Mind Mapping、Reverse Brainstorming等;2. 结构化链式引导,全面探索想法;3. 成本低至$0.01/次,性价比超高 No 22. [1.1k星]Malimite:iOS和macOS的全能反编译工具,助力研究人员轻松分析和解码IPA文件及应用包。亮点:1. 直接支持Swift、Objective-C和苹果资源;2. 自动解码iOS资源,避免冗余代码反编译;3. 一键重构Swift类,效率提升80% No 23. [LG]《Training Dynamics of In-Context Learning in Linear Attention》 No 24. [1.4k星]Goose:开源、可扩展的AI Agent,不只是代码建议,支持安装、执行、编辑和用任何LLM测试 No 25. [66星]PengChengStarling:基于icefall项目的多语言语音识别(ASR)模型,一站式解决多语言语音识别难题。亮点:1. 支持8种语言,涵盖中、英、俄、越、日、泰、印尼、阿等;2. 模型体积仅为Whisper-Large v3的20%,推理速度提升7倍;3. 提供完整的ASR流程支持,从数据处理到模型部署一应俱全 No 26. [151星]LLM-Calc:一键计算量化语言模型的最大适配内存,帮你轻松优化模型推理效率。亮点:1. 实时计算,瞬间得出结果;2. 支持多种量化级别,适配不同硬件;3. 界面简洁,操作零门槛 No 27. [860星]py2many:将Python代码转换为多种语言的神奇工具。亮点:1. 支持10多种语言,包括Rust、C++、Julia等;2. 提升代码性能,解决Python运行速度慢的问题;3. 增强代码安全性,降低低级语言编程风险 No 28. [115星]YuE:开源的全曲生成基础模型,类似Suno.ai,但完全开放。亮点:1. 能将歌词转化为完整的歌曲,包括人声和伴奏;2. 支持多种音乐风格,如流行和金属;3. 提供多种模型版本,满足不同需求 No 29. MNN LLM App:为安卓设备带来强大的大语言模型应用体验。亮点:1. 多模态支持,涵盖文本、图像、音频等多种任务;2. CPU推理优化,预填充速度比llama.cpp快8.6倍,解码速度快2.3倍;3. 广泛的模型兼容性,支持Qwen、Gemma、Llama等主流模型 No 30. [103星]Virtual Lab:一个为科学研究打造的AI虚拟实验室,让人类与AI协同完成科研任务 No 31. [257星]Meelo:为音乐收藏家打造的自托管音乐服务器。亮点:1. 专为音乐收藏设计,支持音乐视频与稀有曲目展示;2. 灵活的元数据解析,支持所有音频和视频格式;3. 提供丰富的音乐信息,如歌词、专辑版本等 No 32. [LG]《StagFormer: Time Staggering Transformer Decoding for RunningLayers In Parallel》 No 33. [1.1k星]Ollama Deep Researcher:本地运行的AI研究助手,帮你高效完成网络调研和报告撰写。亮点:1. 完全本地运行,安全无忧;2. 自动迭代搜索,深度挖掘信息,最多可进行3次迭代;3. 自动生成Markdown格式的研究报告,方便整理和分享 No 34. [83星]PsycheFoundation/psyche:为人类打造超级智能的开源基础设施。亮点:1. 开放性,让每个人都能参与超级智能的开发;2. 去中心化,确保开发过程的公平性和透明度;3. 高效的模型训练代码,加速超级智能的发展 No 35. [25星]EvolvingLMMs-Lab/open-r1-multimodal:为 open-r1 添加多模态模型训练功能。亮点:1. 首批8k多模态RL训练样本,聚焦数学推理,数据丰富且质量高;2. 集成Qwen2-VL系列等VLMs,模型选择多样;3. 提供详细训练脚本和评估方法,易于上手和扩展 No 36. [129星]ErisForge:轻松修改大型语言模型(LLM)内部层,打造个性化AI响应。亮点:1. 简单易用,快速上手;2. 支持多种模型,广泛适用;3. 自定义行为方向,精准调控 No 37. [LG]《Scaling laws for decoding images from brain activity》 No 38. [LG] A Survey of Optimization Methods for Training DL Models: ...... No 39. 通俗版解读 查看图片//[LG]《Training Dynamics of In-Context Learning in Linear Attention》 No 40. 晚安~ [月亮] No 41. 本文提出了一种基于黑格尔辩证法的LLM自反思框架,通过迭代地生成和综合对立观点,实现模型的自我批判和新颖想法的产生,并通过动态退火温度控制和多智能体投票评估,显著提升了LLM的创造性和自省能力,为构建更具智能的AI系统提供了新的视角。 No 42. [LG]《Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity》 No 43. [20星]F5_TTS_Faster:为F5-TTS推理加速,速度提升约4倍!亮点:1. 使用ONNX和Tensorrt-LLM加速,推理速度从3.2s降低到0.72s;2. 支持NVIDIA GeForce RTX 3090,硬件兼容性好;3. 提供详细的安装和使用指南,易于上手 No 44. [182星]ComfyUI-ReActor:为ComfyUI提供快速简单的换脸扩展节点,让换脸操作变得轻松又高效。亮点:1. 支持多种换脸模型,包括ReSwapper和Inswapper;2. 配备NSFW检测器,避免违规内容生成;3. 提供丰富的节点功能,如卸载模型、保存和加载脸模等 No 45. UC Berkeley为数学新手量身打造的数学思维入门课程。亮点:1. 专为无离散数学经验的学生设计;2. 课程内容覆盖从基础集合论到高级组合数学;3. 提供丰富的学习资源,包括视频、笔记和练习题 No 46. (可免费书)学术写作指南:由哈佛大学学者编写的 3... No 47. DeepSeek 以有限资源取得的成功有力地挑战了当前 AI 发展中过度依赖大规模资源扩展的范式,揭示了创新和效率才是 ...... No 48. StagFormer 通过引入时间错开机制,创新性地实现了 Transformer 模型解码过程在深度方向的并行化,从而显著加速了推理速度,同时通过不同的变体和优化技术,在内存效率、模型性能和计算效率之间取得了良好的平衡,展示了深度学习架构并行化设计的巨大潜力,并启发了对未来更高效和可解释的 Transformer...全文//[LG]《StagFormer: Time Staggering Transformer Decoding for RunningLayers In Parallel》 No 49. 今日推介(第1665期):线性注意力上下文学习的训练动力学、并行运行层的时间错开Transformer解码、用模态感知稀疏性增强多模态状态空间模型、基于黑格尔辩证法的自反思大型语言模型、脑活动图像解码的缩放律 ...... No 50. KeymouseGo:像按键精灵一样的自动化操作软件,能记录你的鼠标和键盘动作,然后自动重复执行,是简化重复性工作的利器

fly51fly avatar Jan 29 '25 14:01 fly51fly