爱可可微博热门分享(11.22)
No 1. 中国独立开发者项目列表:一个展示中国独立开发者作品的精选合集,收录了1000多个优秀项目,涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理,每个项目都包含开发者、项目名称、链接和简介等详细信息 No 2. MCTS:一个用Python实现的蒙特卡洛树搜索(Monte Carlo Tree Search)算法库,包含了基础的MCTS实现和一些实验性游戏示例。该项目提供了一个简单的数值累加游戏作为测试用例,可用于学习和理解MCTS算法的工作原理 No 3. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 4. 写了篇深度长文《AI Coding的范式革命:从工具演进到认知重构》 No 5. #转发赠书# 携手@异步图书 送出5本《AI群星闪耀时》 No 6. indie-hacker-tools-plus:专为独立开发者打造的精选技术栈和工具合集。涵盖Web开发模板、前后端框架、数据库、支付系统、部署工具等全方位资源。特色是注重效率和成本优化,收录经过市场验证的热门工具,包含详细的使用场景和推荐说明 No 7. DRL-Pytorch:最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法。包括从入门级的Q-learning到高阶的SAC、TD3等,每个算法都配有详细文档、完整训练曲线和论文引用。项目还提供了丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文等 No 8. TEN Framework:下一代AI Agent框架,号称全球首个真正实时的多模态AI Agent框架。支持高性能实时多模态交互,跨语言(C++/Go/Python)和跨平台开发,提供边缘云集成能力。框架特色包括实时代理状态管理、可视化编程、音视频工具集成等,适用于同声传译、语音转文本、多语言聊天室等场景 No 9. ollama-ebook-summary:一个专门用于长文本总结的LLM工具,可以将电子书或PDF自动分段处理并生成详细的要点总结。支持epub和pdf格式,能自动提取章节,将文本分成~2000 token的小块进行处理,最终生成结构化的笔记和总结,特别适合学习研究和知识整理 No 10. bRAG-langchain:构建自己的RAG应用,探索从基础到高级的检索增强生成技术,包括多查询和定制RAG构建 No 11. Automated-AI-Web-Researcher-Ollama:基于Ollama的自动化研究助手,能够自主执行网络研究任务。输入一个查询后,它会自动确定研究重点、执行网页搜索和内容抓取、保存发现的内容。特色功能包括优先级研究规划、系统化网络搜索、结果自动保存、研究总结生成以及基于研究结果的问答功能 No 12. DarkFlare:一个隐蔽的TCP-over-CDN隧道工具,通过Cloudflare的CDN网络将TCP流量伪装成普通HTTPS请求。可以绕过企业防火墙和网络限制,支持SSH、RDP等TCP协议,具有低延迟、安全性好的特点。包含客户端和服务器端两个组件,可实现TCP流量的加密传输和访问控制 No 13. AnyModal:基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态,提供模块化的架构设计,包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强,便于添加新的输入模态处理器和分词器,并提供了丰富的预训练模型库 No 14. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 15. Foundations of LLMs:浙江大学开源的大语言模型教材,系统介绍大模型相关基础知识和前沿技术。涵盖传统语言模型、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六大主题,每章配有相关论文列表,定期更新以跟踪最新技术进展 No 16. AI编程正在推动软件开发从“编码-实现”模式转向“意图-涌现”新范式,相信会对你有所启发//写了篇深度长文《AI Coding的范式革命:从工具演进到认知重构》 No 17. nano-sparse-attention:一个教育性的稀疏注意力机制实现库,专注于LLM推理的优化。提供纯PyTorch实现的多种稀疏注意力模式,包括Local Window、Attention Sinks、SnapKV等,支持预填充和生成两个阶段。通过详细的Jupyter notebook教程和可视化工具,帮助用户理解和实验不同的注意力模式 No 18. graphrag-dify:一个将GraphRAG技术与Dify平台结合使用的实践项目,通过HTTP服务方式将GraphRAG的知识图谱检索能力暴露给Dify使用。项目提供了完整的配置流程和DSL示例,特别针对游戏《王者荣耀》的知识库进行了实践演示,实现了基于知识图谱的智能问答系统 No 19. gradio-webrtc:基于WebRTC的Gradio流媒体组件,支持实时音视频传输。提供了四种主要功能:网页摄像头视频流传输、服务器到客户端的视频流传输、服务器到客户端的音频流传输以及双向音频对话。特别适合构建需要实时音视频处理的AI应用,如实时物体检测、对话AI等 No 20. Extractous:高性能非结构化数据提取工具,使用Rust开发并提供多语言绑定,支持PDF、Word、HTML等多种文档格式的内容和元数据提取。相比同类工具unstructured-io速度快25倍,内存占用低11倍。集成Apache Tika和Tesseract OCR,提供原生执行性能,无需外部服务和API No 21. [CL]《When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training》 No 22. 今日推介(第1597期):通过移除全连接层来最小化Transformer计算、BFloat16在长上下文训练中有损RoPE相对位置编码、大型语言模型是否记住了Bug基准、大语言模型个性化研究、极端自适应稀疏训练 ...... No 23. Abbey:高度可定制的私有化AI接口工具,集成了笔记本、基础聊天、文档管理和Youtube视频处理等功能,可灵活配置不同的LLM模型、TTS模型、OCR模型和搜索引擎,支持多用户认证和私有化部署 No 24. 本文发现BFloat16精度下RoPE的相对位置编码失效问题,并提出AnchorAttention机制,通过将第一个token作为共享锚点来解决该问题,显著提升了长文本模型的性能和训练效率,同时保持了模型在短文本任务上的性能。//[CL]《When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training》 No 25. Monty:一个创新的感知运动学习框架,基于大脑新皮层的千脑理论设计。由Numenta公司开源并获盖茨基金会部分资助,实现了感知运动系统的首个开源实现。该框架目前处于早期beta阶段,提供完整的基准测试集和文档支持,致力于研究类人脑学习机制 No 26. amILearningEnough:一个面向底层编程的学习路线图和资源集合。主要聚焦C语言和汇编语言的系统级编程学习,内容涵盖计算机架构、系统资源优化、操作系统开发、驱动程序编写等核心主题,帮助开发者深入理解计算机底层工作原理 No 27. Grunty:基于Claude的电脑控制AI助手,可通过自然语言指令让AI直接操控电脑执行各种任务,支持浏览网页、编写代码等鼠标键盘操作。使用Python和PyQt开发,跨平台支持,但需谨慎使用因为给予AI完全的电脑控制权限 No 28. [CL]《MemoryFormer: Minimize Transformer Computation by Removing Fully-Connected Layers》 No 29. activeft:基于PyTorch的主动学习微调库,专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制,可以帮助优化模型微调过程中的数据使用,特别适用于大语言模型的测试时学习和转导式主动学习场景 No 30. TSB-AD:一个全面的时间序列异常检测基准平台,包含1070个高质量时间序列数据集和40种检测算法。特色是首次系统性解决了数据集完整性、评估指标可靠性和基准测试规范化等关键问题。该项目提供了从统计方法到最新基础模型的全面评估,并揭示了简单架构和统计方法往往优于复杂神经网络的发现 No 31. RepoGPT:一个AI驱动的GitHub助手,允许用户通过自然语言与代码仓库进行交互。支持仓库导入、管理和聊天功能,集成了PostgreSQL和pgvector实现AI处理,可以智能解答代码相关问题、生成文档和提供代码建议,大大简化了代码库的探索和管理过程 No 32. gradio-webrtc:基于Gradio的WebRTC实时流媒体组件,支持网络摄像头视频流处理、服务器到客户端的视频/音频流传输、双向音频对话等功能,可用于构建实时对象检测、语音对话等AI应用,支持视频实时处理和音频流交互 No 33. Stripe Agent Toolkit:一个面向AI Agent的Stripe API集成工具库,支持Python和TypeScript,可与LangChain、CrewAI和Vercel AI SDK等主流AI Agent框架无缝对接。通过函数调用方式实现Stripe支付API的智能化集成,并支持计量计费功能 No 34. Sudoku-RWKV:一款专门用于解决数独问题的神经网络模型,基于RWKV-v6架构,通过约2百万个数独样本训练而成。模型参数量约1270万,具有8层结构和320维度,能够有效解决任意有解的数独题目 No 35. 几篇论文实现代码 No 36. 晚安~ [月亮] No 37. AivisSpeech:基于VOICEVOX开发的AI语音合成软件,支持Windows和macOS系统,可轻松生成富有情感的日语语音。支持AIVMX格式的语音模型,采用ONNX Runtime实现高速CPU推理,通过简单的UI界面即可添加和管理语音模型 No 38. 早![太阳] No 39. [CL]《On the Way to LLM Personalization: Learning to Remember User Conversations》 No 40. 机器学习创业公司大全:一个精选的AI和机器学习创业公司列表,按照地理位置(柏林、伦敦、马德里、米兰、巴黎等)和技术领域(NLP、计算机视觉、机器人等)分类整理,包含公司基本信息、员工规模、融资轮次等详细数据 No 41. AutoGluon Assistant:强大的零代码机器学习助手,将AutoGluon的自动化机器学习能力与大语模结合,用户只需使用自然语言描述问题并提供数据,即可获得高精度的ML解决方案。支持Web UI和CLI两种使用方式,可自动完成从数据处理到模型训练的全流程 No 42. Evalchemy:一个强大的语言模型评测框架,统一整合了MTBench、WildBench、RepoBench等多个基准测试,支持多GPU并行评估和大模型分布式评测。特色包括统一安装部署、并行评估、标准化输出格式和可选的数据库集成,可用于全面评估指令微调模型的性能 No 43. PySpur:一款专注于推理计算流水线的集成开发环境,让开发者能够更便捷地构建、调试和部署LLM计算图。支持多种高级规划器(如MCTS、Self-Refinement等),提供并行/顺序采样的底层原语,内置验证器和评估功能,支持批量推理任务的异步执行和管理 No 44. 机器学习系统教程:个人学习笔记和代码分享平台,专注于机器学习与系统结合的实践和理论,适合对AI技术有兴趣的初学者和研究者 No 45. Memoripy:一款AI记忆层工具,具备短期和长期存储、语义聚类和记忆衰减功能,专为需要记忆管理的AI应用设计 No 46. EgoMimic:基于第一人称视角的模仿学习框架,用于机器人技能学习。支持处理人类Aria眼镜采集的数据和机器人远程操作数据,提供了完整的数据处理、训练和部署流程。包含多个示例任务如日用品拿取、衣物折叠等,并提供了预训练数据集和详细的实验配置 No 47. MemoryFormer 提出了一种创新的 Transformer 架构,通过利用局部敏感哈希算法替换全连接层,显著降低了模型计算复杂度,同时保持了与基线模型相当甚至更好的性能,并为硬件设计提供了新的思路。//[CL]《MemoryFormer: Minimize Transformer Computation by Removing Fully-Connected Layers》 No 48. OASIS:面向百万规模的开放式多智能体社交互动仿真平台,可模拟Twitter和Reddit等社交媒体平台上用户的行为,支持信息传播、群体极化等复杂社交现象的研究,具有高度可扩展性、动态环境和多样化的交互行为 No 49. launchweek.dev:一个追踪科技产品发布周的开源平台,专门收集和展示各个开发工具公司的产品发布活动。特色是引入了'Mega Launch Week'概念,类似开发者界的黑色星期五,多家公司在同一周集中发布新功能。平台基于Mintlify构建,支持MDX文档编写,方便开发者了解和跟踪最新的工具发布 No 50. tauri2-svelte5-shadcn:一个现代化的桌面应用开发模板,完美集成了Tauri 2、Svelte 5和Shadcn-svelte三大框架。特色是提供了完整的CI/CD流水线,支持Windows、Linux和Mac三平台的自动化构建,使用Bun作为运行时,并集成了TypeScript和TailwindCSS,非常适合快速开发跨平台桌面应用