aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(5.28)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. 动手实现LLM中文版：从零开始构建自己的大型语言模型，提供详细教程和代码实现，覆盖编码、预训练和微调过程，适用于对自然语言处理和人工智能领域感兴趣的开发者和研究者 No 2. 星辰语音大模型-超多方言ASR：支持30多种方言的语音识别模型，打破单一模型方言限制，提供多方言语音数据训练的开源版本，适用于多方言语音识别任务 No 3. Python机器视觉工具箱：用于机器视觉和基于视觉的控制的Python实现，提供封装自OpenCV、NumPy和SciPy的近200种方法和属性，支持图像处理和特征提取 No 4. StreamV2V：实时视频到视频翻译工具，支持换脸和视频风格化，可在单个RTX 4090 GPU上运行 No 5. 零知识证明入门教程：面向高中数学基础人群的零知识证明学习资源，通过Python代码示例和教程，系统介绍零知识证明的基本概念和算法实现 No 6. X-KANeRF：基于KAN的NeRF模型，集成了多种基函数如B-样条、傅里叶、高斯、小波、多项式等 No 7. MusicGPT：基于自然语言提示生成音乐的本地LLM应用，无需安装重型依赖即可高效运行最新的音乐生成AI模型 No 8. 数学表达式解析库：一款高效的数学公式分析工具，支持嵌套函数、函数以及数列步长的累积计算，适用于Java、Python和C++平台。该库能够返回数值结果对象，同时支持比较操作，比较时返回布尔值结果对象 No 9. RLAIF-V: 在完全开源的范式中对齐多模态大模型，实现了超越 GPT-4V 的可信度 No 10. Personal-Graph：AI应用的个人简易图谱记忆库，帮助解决AI系统工作记忆和长期记忆的挑战，特别是大型语言模型（LLMs） No 11. AgentForge：可扩展AI框架，为AI驱动的自主Agent和认知架构的快速开发、测试和迭代提供低代码框架，支持多种大型语言模型(LLM) No 12. FinRobot：开源AI Agent平台，用于金融应用的大型语言模型，提供综合解决方案，集成多种AI技术，超越传统金融GPT应用 No 13. 猫咪专用BT流媒体软件：实时动漫种子流媒体播放，无需等待下载即可观看 No 14. [LG]《Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach》 No 15. AI设备模板：集成Whisper语音识别、TTS文本转语音、Groq、Llama3、OpenAI等技术，打造智能语音助手，支持语音输入、文本转语音输出、图像处理、功能调用和条件渲染UI组件 No 16. 几篇论文实现代码 No 17. ChatTTS：基于文本到语音转换技术的学术研究项目，提供语音合成的代码示例，旨在促进语音技术的研究和教育，适用于学术和研究目的 No 18. FlashRAG：高效的检索增强生成研究的Python工具包，包含32个预处理基准RAG数据集和12种先进RAG算法 No 19. [LG] Output-Constrained Decision Trees 提出了优化方法和启发式方法，将目标变量间的约束纳入决策树，以产生准确可行的预测。 ...... No 20. 使用DSPy以更低成本实现GPT-4级别的性能 No 21. [CV] iVideoGPT: Interactive VideoGPTs are Scalable World Models ...... No 22. RealTime QA：实时问答平台，定期评估实时基线系统如GPT-3和T5的性能，每周提出约30个问题 No 23. EoH: 进化计算+大模型自动算法设计平台，结合进化计算和大型语言模型，实现高效的自动算法设计，优化复杂搜索和优化问题 No 24. AI-RPi猫检测助手：基于树莓派的AI猫行为监控和通知系统，可发送文本/邮件通知，以及AI语音解说所见内容，适用于多种视觉相关用例，如宠物监控、鸟类观察、浣熊驱赶、植物监控和包裹提醒等。 No 25. SODA：搜索、组织、发现任何信息的智能工具，利用大型语言模型的强大能力，为用户提供从互联网和个人数据库中获取信息的高效解决方案，同时确保信息的准确性和可靠性 No 26. Transcription Stream：一站式自托管离线转录和说话人识别服务，集成了大型语言模型（LLM）的摘要功能，适用于需要高度自定义和安全性的转录工作 No 27. Grouped GEMM for MoE：用于MoE模型训练中分组GEMM的PyTorch工具箱，支持高效的矩阵运算和优化 No 28. Faster Whisper Server：兼容OpenAI API的转录服务器，使用faster-whisper作为后端，支持GPU和CPU，易于通过Docker部署，可配置环境变量，支持流式转录和翻译 No 29. SuperVoice语音分离网络：基于Speech Flow架构的扩散式说话人分离网络，提供评估笔记本 No 30. PixMob红外协议逆向：在家控制PixMob手环的破解工具，支持红外和射频手环，可同步控制多个手环以创建大型光效展示 No 31. 今日推介(第1419期)：用去噪语言模型探索语音识别错误校正模型的极限、迁移学习中几何复杂度对神经坍缩的影响、'无时间表'学习方法、面向自监督学习的基于聚类的自动数据整理、通过“Grokking”训练的Transformer是隐式推理器 ...... No 32. Chat凉宫春日 Chat-Haruhi-Suzumiya：基于大型语言模型的动漫角色复活项目，提供接近原作语气、个性和剧情的聊天体验，支持零样本角色扮演和RAG角色构造 No 33. Transcribee：开源音视频转录软件，旨在简化媒体转录工作流程，提高效率和可访问性，支持自动化草稿生成和协作编辑 No 34. 晚安～ [月亮] No 35. AndroidWorld：为自主Agent设计的仿真环境和基准测试，可在真实Android模拟器上运行，包含116个手工设计的任务，跨越20个应用，支持动态任务实例化，生成数百万独特的任务变体 No 36. AnyNode：ComfyUI中的多功能自动化节点，利用LLMs根据用户输入生成特定输出，简化编程和自动化流程 No 37. Weasel：小巧易用的端到端工作流系统，支持不同用例和领域的工作流管理、共享、训练、打包和部署自定义管道。用户可以通过克隆预定义的项目模板开始，调整以适应需求，加载数据，训练管道，导出为Python包，上传输出到远程存储并与团队共享结果 No 38. [LG]《The Impact of Geometric Complexity on Neural Collapse in Transfer Learning》 No 39. 图基础模型相关论文和数据集链接列表 No 40. AutoLoRADiscovery：利用LoRA训练减少模型训练冗余，专注于特定领域模型训练的参数优化工具，通过少量参数实现高保真度 No 41. PyTorch实用教程（第二版）：面向深度学习工程师的全面指南，覆盖从零基础到项目应用和工程化部署的各个阶段，旨在帮助读者轻松掌握PyTorch的使用 No 42. [LG]《Denoising LM: Pushing the Limits of Error Correction Models for Speech Recognition》 No 43. 早！[太阳] No 44. [CL] RE-Adapt: Reverse Engineered Adaptation of Large Language ...... No 45. 揭示了神经坍缩、几何复杂度和损失平坦度之间的内在联系，证实控制预训练阶段的几何复杂度可促进新类别的神经坍缩，从而提升在新任务(尤其是少样本设置)上的迁移性能，为解释迁移学习的成功机制提供了新视角。//[LG]《The Impact of Geometric Complexity on Neural Collapse in Transfer Learning》 No 46. Falco：现代Django开发者体验增强工具，提供命令行界面和开发指南，助力快速原型开发和项目启动 No 47. 大语言模型高效转发服务：专为大型语言模型设计的高效转发服务，支持OpenAI API反向代理 No 48. 开源中文预训练语言模型：Steel-LLM，个人从零开始训练的中文大型语言模型，目标是使用1T+数据预训练1B参数量的模型，对标TinyLlama，持续更新3个月+，开源全流程代码 No 49. Promptulate：AI Agent 应用开发框架，通过 Pythonic 的开发范式，旨在为开发者们提供一种极其简洁而高效的 Agent 应用构建体验 No 50. ComfyUI-Allor：高性能的ComfyUI图像处理插件，支持透明通道和多图像处理，包含超过90个节点，提供全面配置选项和文档支持

May 28 '24 13:05 fly51fly