爱可可微博热门分享(5.28)
No 1. 动手实现LLM中文版:从零开始构建自己的大型语言模型,提供详细教程和代码实现,覆盖编码、预训练和微调过程,适用于对自然语言处理和人工智能领域感兴趣的开发者和研究者 No 2. 星辰语音大模型-超多方言ASR:支持30多种方言的语音识别模型,打破单一模型方言限制,提供多方言语音数据训练的开源版本,适用于多方言语音识别任务 No 3. Python机器视觉工具箱:用于机器视觉和基于视觉的控制的Python实现,提供封装自OpenCV、NumPy和SciPy的近200种方法和属性,支持图像处理和特征提取 No 4. StreamV2V:实时视频到视频翻译工具,支持换脸和视频风格化,可在单个RTX 4090 GPU上运行 No 5. 零知识证明入门教程:面向高中数学基础人群的零知识证明学习资源,通过Python代码示例和教程,系统介绍零知识证明的基本概念和算法实现 No 6. X-KANeRF:基于KAN的NeRF模型,集成了多种基函数如B-样条、傅里叶、高斯、小波、多项式等 No 7. MusicGPT:基于自然语言提示生成音乐的本地LLM应用,无需安装重型依赖即可高效运行最新的音乐生成AI模型 No 8. 数学表达式解析库:一款高效的数学公式分析工具,支持嵌套函数、函数以及数列步长的累积计算,适用于Java、Python和C++平台。该库能够返回数值结果对象,同时支持比较操作,比较时返回布尔值结果对象 No 9. RLAIF-V: 在完全开源的范式中对齐多模态大模型,实现了超越 GPT-4V 的可信度 No 10. Personal-Graph:AI应用的个人简易图谱记忆库,帮助解决AI系统工作记忆和长期记忆的挑战,特别是大型语言模型(LLMs) No 11. AgentForge:可扩展AI框架,为AI驱动的自主Agent和认知架构的快速开发、测试和迭代提供低代码框架,支持多种大型语言模型(LLM) No 12. FinRobot:开源AI Agent平台,用于金融应用的大型语言模型,提供综合解决方案,集成多种AI技术,超越传统金融GPT应用 No 13. 猫咪专用BT流媒体软件:实时动漫种子流媒体播放,无需等待下载即可观看 No 14. [LG]《Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach》 No 15. AI设备模板:集成Whisper语音识别、TTS文本转语音、Groq、Llama3、OpenAI等技术,打造智能语音助手,支持语音输入、文本转语音输出、图像处理、功能调用和条件渲染UI组件 No 16. 几篇论文实现代码 No 17. ChatTTS:基于文本到语音转换技术的学术研究项目,提供语音合成的代码示例,旨在促进语音技术的研究和教育,适用于学术和研究目的 No 18. FlashRAG:高效的检索增强生成研究的Python工具包,包含32个预处理基准RAG数据集和12种先进RAG算法 No 19. [LG] Output-Constrained Decision Trees 提出了优化方法和启发式方法,将目标变量间的约束纳入决策树,以产生准确可行的预测。 ...... No 20. 使用DSPy以更低成本实现GPT-4级别的性能 No 21. [CV] iVideoGPT: Interactive VideoGPTs are Scalable World Models ...... No 22. RealTime QA:实时问答平台,定期评估实时基线系统如GPT-3和T5的性能,每周提出约30个问题 No 23. EoH: 进化计算+大模型 自动算法设计平台,结合进化计算和大型语言模型,实现高效的自动算法设计,优化复杂搜索和优化问题 No 24. AI-RPi猫检测助手:基于树莓派的AI猫行为监控和通知系统,可发送文本/邮件通知,以及AI语音解说所见内容,适用于多种视觉相关用例,如宠物监控、鸟类观察、浣熊驱赶、植物监控和包裹提醒等。 No 25. SODA:搜索、组织、发现任何信息的智能工具,利用大型语言模型的强大能力,为用户提供从互联网和个人数据库中获取信息的高效解决方案,同时确保信息的准确性和可靠性 No 26. Transcription Stream:一站式自托管离线转录和说话人识别服务,集成了大型语言模型(LLM)的摘要功能,适用于需要高度自定义和安全性的转录工作 No 27. Grouped GEMM for MoE:用于MoE模型训练中分组GEMM的PyTorch工具箱,支持高效的矩阵运算和优化 No 28. Faster Whisper Server:兼容OpenAI API的转录服务器,使用faster-whisper作为后端,支持GPU和CPU,易于通过Docker部署,可配置环境变量,支持流式转录和翻译 No 29. SuperVoice语音分离网络:基于Speech Flow架构的扩散式说话人分离网络,提供评估笔记本 No 30. PixMob红外协议逆向:在家控制PixMob手环的破解工具,支持红外和射频手环,可同步控制多个手环以创建大型光效展示 No 31. 今日推介(第1419期):用去噪语言模型探索语音识别错误校正模型的极限、迁移学习中几何复杂度对神经坍缩的影响、'无时间表'学习方法、面向自监督学习的基于聚类的自动数据整理、通过“Grokking”训练的Transformer是隐式推理器 ...... No 32. Chat凉宫春日 Chat-Haruhi-Suzumiya:基于大型语言模型的动漫角色复活项目,提供接近原作语气、个性和剧情的聊天体验,支持零样本角色扮演和RAG角色构造 No 33. Transcribee:开源音视频转录软件,旨在简化媒体转录工作流程,提高效率和可访问性,支持自动化草稿生成和协作编辑 No 34. 晚安~ [月亮] No 35. AndroidWorld:为自主Agent设计的仿真环境和基准测试,可在真实Android模拟器上运行,包含116个手工设计的任务,跨越20个应用,支持动态任务实例化,生成数百万独特的任务变体 No 36. AnyNode:ComfyUI中的多功能自动化节点,利用LLMs根据用户输入生成特定输出,简化编程和自动化流程 No 37. Weasel:小巧易用的端到端工作流系统,支持不同用例和领域的工作流管理、共享、训练、打包和部署自定义管道。用户可以通过克隆预定义的项目模板开始,调整以适应需求,加载数据,训练管道,导出为Python包,上传输出到远程存储并与团队共享结果 No 38. [LG]《The Impact of Geometric Complexity on Neural Collapse in Transfer Learning》 No 39. 图基础模型相关论文和数据集链接列表 No 40. AutoLoRADiscovery:利用LoRA训练减少模型训练冗余,专注于特定领域模型训练的参数优化工具,通过少量参数实现高保真度 No 41. PyTorch实用教程(第二版):面向深度学习工程师的全面指南,覆盖从零基础到项目应用和工程化部署的各个阶段,旨在帮助读者轻松掌握PyTorch的使用 No 42. [LG]《Denoising LM: Pushing the Limits of Error Correction Models for Speech Recognition》 No 43. 早![太阳] No 44. [CL] RE-Adapt: Reverse Engineered Adaptation of Large Language ...... No 45. 揭示了神经坍缩、几何复杂度和损失平坦度之间的内在联系,证实控制预训练阶段的几何复杂度可促进新类别的神经坍缩,从而提升在新任务(尤其是少样本设置)上的迁移性能,为解释迁移学习的成功机制提供了新视角。//[LG]《The Impact of Geometric Complexity on Neural Collapse in Transfer Learning》 No 46. Falco:现代Django开发者体验增强工具,提供命令行界面和开发指南,助力快速原型开发和项目启动 No 47. 大语言模型高效转发服务:专为大型语言模型设计的高效转发服务,支持OpenAI API反向代理 No 48. 开源中文预训练语言模型:Steel-LLM,个人从零开始训练的中文大型语言模型,目标是使用1T+数据预训练1B参数量的模型,对标TinyLlama,持续更新3个月+,开源全流程代码 No 49. Promptulate:AI Agent 应用开发框架,通过 Pythonic 的开发范式,旨在为开发者们提供一种极其简洁而高效的 Agent 应用构建体验 No 50. ComfyUI-Allor:高性能的ComfyUI图像处理插件,支持透明通道和多图像处理,包含超过90个节点,提供全面配置选项和文档支持