爱可可微博热门分享(11.24)
No 1. #转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 2. 中国独立开发者项目列表:一个展示中国独立开发者作品的精选合集,收录了1000多个优秀项目,涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理,每个项目都包含开发者、项目名称、链接和简介等详细信息 No 3. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 4. AutoFlow:开源的图谱型对话知识库工具,基于TiDB矢量存储构建。具备类Perplexity的对话式搜索功能、网站爬虫采集、知识图谱编辑以及JavaScript嵌入等特性。支持文档站点的智能爬取和检索,可通过可视化界面编辑知识图谱,适合构建智能客服和知识库系统 No 5. Visual Sorting:一款排序算法可视化工具,提供动态视觉效果和声音反馈,支持19种排序算法包括快排、归并、堆排序等,可自定义数组大小(2-1024)、排序速度和主题,每个数据项的高度对应不同的音调,让学习排序算法变得生动有趣 No 6. Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决 No 7. #转发赠书# 携手@异步图书 送出5本《AI群星闪耀时》 No 8. Windows-ARM:Docker容器中运行ARM版Windows的开源项目,支持树莓派5等ARM设备,具备ISO自动下载、KVM加速、Web查看器等功能,支持多个Windows版本(含Win10/11),可自定义RAM/CPU/磁盘大小,支持RDP远程连接和文件共享 No 9. PyTabKit:一个用于表格数据分类和回归的现代机器学习工具包,提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口,支持自动GPU检测、类别特征处理、数据预处理等功能,并包含完整的基准测试框架和数据集 No 10. maze-dataset:一个用于研究机器学习系统OOD(分布外)行为的迷宫数据集工具包,提供多种迷宫生成算法(如随机深度优先搜索、Wilson算法等),支持数据集过滤、复杂度控制、去重等功能,可输出多种格式用于可视化和ML模型训练,适用于迷宫变换器的可解释性研究 No 11. Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和加速等多个研究方向,同时提供中英双语内容解读 No 12. WeSQL:一个创新的MySQL发行版,采用计算存储分离架构,将所有数据(包括binlog、schema、WAL等)完全存储在S3或S3兼容存储上,具备跨云平台部署能力,无供应商锁定,特别适合Serverless和BYOC场景,可实现快速启动和即时服务 No 13. CMU_MATH-AIMO:卡内基梅隆大学团队在首届AI数学奥林匹克竞赛(AIMO)中获得亚军的开源项目,包含完整的训练数据集(AIME、AMC、Odyssey-Math)、验证集、模型微调代码和数据收集脚本,为研究AI解决数学问题提供了宝贵资源 No 14. ECC_Attacks:专注于椭圆曲线密码学(ECC)已知攻击方法的深度研究项目,详细介绍了ECC基本原理、密码学应用及各种攻击技术,包括ECDH和ECDSA两大类攻击,对于理解和实践ECC安全性非常有价值 No 15. 写了篇深度长文《AI Coding的范式革命:从工具演进到认知重构》 No 16. Open-Pandora:开源视频生成模型,支持实时文本控制生成视频,可生成最长10秒的高质量视频内容,支持320×512和576×1024分辨率,基于Webvid数据集训练,提供完整的训练代码和预训练模型权重 No 17. DRL-Pytorch:最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法。包括从入门级的Q-learning到高阶的SAC、TD3等,每个算法都配有详细文档、完整训练曲线和论文引用。项目还提供了丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文等 No 18. 几篇论文实现代码 No 19. llama3_interpretability_sae:一个完整的大语言模型(LLM)可解释性研究项目,使用稀疏自编码器(SAE)分析Llama 3.2模型,由纯PyTorch实现且可完全复现。包含从数据采集、SAE训练、特征分析到验证的全套流程,可帮助理解模型内部行为和概念表示 No 20. Rustfinity:一个专注于Rust编程语言学习和实践的开源教育平台,提供系统化的学习内容和实战挑战。该项目包含CLI工具、编程挑战题集等模块,旨在帮助开发者以更有效的方式掌握Rust语言 No 21. pg_mooncake:一个PostgreSQL扩展,为PG添加列式存储表支持,可将数据以Iceberg或Delta Lake格式存储在对象存储中,支持事务操作和批量操作,通过DuckDB执行引擎实现高达1000倍的分析查询性能提升,同时支持与常规PG表进行联表查询,便于在PG中直接进行数据分析 No 22. SOYO:一款基于Next.js开发的本地视频流媒体服务器,可让你通过局域网在任何设备上观看本地硬盘中的视频文件。支持从AniList和IMDb获取视频封面,提供用户友好的界面,支持Docker部署,是Jellyfin的轻量级替代方案 No 23. indie-hacker-tools-plus:专为独立开发者打造的精选技术栈和工具合集。涵盖Web开发模板、前后端框架、数据库、支付系统、部署工具等全方位资源。特色是注重效率和成本优化,收录经过市场验证的热门工具,包含详细的使用场景和推荐说明 No 24. RAD Debugger:Epic Games开源的多进程图形化调试器,原生支持Windows x64调试,可处理PDB文件,特色包括统一的调试信息格式RDI、多线程调试能力、内置可视化引擎。目前处于Alpha阶段,未来将支持Linux和DWARF调试信息 No 25. ExcalidrawZ:基于SwiftUI开发的macOS版Excalidraw应用,提供本地文件管理功能,支持文件分组、历史记录、多种手写字体(含中日英),可导入导出多种Excalidraw格式(.excalidraw/.excalidraw.png/.excalidraw.svg),并支持文件备份和分享功能,让在线绘图工具Excalidraw的使用更加安全便捷 No 26. Bluesky Tech Starter Packs:一个全面的Bluesky技术社区分类资源集合,包含了数百个按领域分类的Starter Pack,涵盖AI/ML、云计算、编程语言、开源、安全等多个技术领域,帮助用户快速找到并加入感兴趣的技术社区 No 27. [RO]《Learning Humanoid Locomotion with Perceptive Internal Model》 No 28. DuckDB-VSS:DuckDB的向量相似度搜索扩展,基于usearch库实现,支持HNSW索引加速向量检索,提供欧几里得距离、余弦相似度等多种距离度量方式,可用于大规模向量数据的高效检索,支持增删改操作和索引重建 No 29. television:一款基于Rust开发的高性能终端模糊搜索工具,支持多种搜索通道(文件、文本、Git仓库、环境变量等),具有实时预览、自定义快捷键、通道间切换等功能,灵感来自neovim的telescope插件 No 30. 早![太阳] No 31. TEN Framework:下一代AI Agent框架,号称全球首个真正实时的多模态AI Agent框架。支持高性能实时多模态交互,跨语言(C++/Go/Python)和跨平台开发,提供边缘云集成能力。框架特色包括实时代理状态管理、可视化编程、音视频工具集成等,适用于同声传译、语音转文本、多语言聊天室等场景 No 32. whoosh-reloaded:一个纯Python实现的全文索引和搜索库,是Whoosh项目的活跃维护分支。具有快速索引和检索、字段索引搜索、可插拔评分算法、强大的查询语言、拼写检查等特性,适合需要纯Python解决方案的场景,无需编译原生库 No 33. amILearningEnough:一个面向底层编程的学习路线图和资源集合。主要聚焦C语言和汇编语言的系统级编程学习,内容涵盖计算机架构、系统资源优化、操作系统开发、驱动程序编写等核心主题,帮助开发者深入理解计算机底层工作原理 No 34. graphrag-dify:一个将GraphRAG技术与Dify平台结合使用的实践项目,通过HTTP服务方式将GraphRAG的知识图谱检索能力暴露给Dify使用。项目提供了完整的配置流程和DSL示例,特别针对游戏《王者荣耀》的知识库进行了实践演示,实现了基于知识图谱的智能问答系统 No 35. Dynamiqs:基于JAX开发的高性能量子系统模拟库,支持GPU加速和可微分计算,可用于模拟薛定谔方程、林德布拉德主方程等量子系统,特别适合大规模量子系统仿真、基于梯度的参数估计和量子最优控制 No 36. bRAG-langchain:构建自己的RAG应用,探索从基础到高级的检索增强生成技术,包括多查询和定制RAG构建 No 37. [LG]《The Dawn of GUI Agent: A Preliminary Case Study with Claude 3.5 Computer Use》 No 38. tex-fmt:一个用Rust编写的超高性能LaTeX代码格式化工具。它支持.tex/.bib/.cls/.sty等LaTeX文件类型的格式化,相比传统工具latexindent速度提升超1000倍,提供命令行界面和VS Code集成,可通过Cargo、Nix、Homebrew等多种方式安装 No 39. ai-rd-tasks:一套评估大语言模型AI研发能力的任务集合,包含7个具有挑战性的任务,涵盖Rust代码编程、GPT-2微调、嵌入修复、LLM训练优化、GPU内核优化等领域,每个任务都有明确的评分标准和基准分数,用于测试AI代理与人类专家的能力对比 No 40. bomoto:一个专业的人体模型工具包,用于对网格进行人体模型拟合和不同人体模型之间的转换,支持SMPL、SMPL-X等主流人体模型,提供参数转换和网格拟合等功能,可用于3D人体建模和姿态估计研究 No 41. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 42. Web Applets:一个开放的Web应用规范和SDK,专为人类和AI协作设计的应用框架,支持使用标准Web技术(HTML/CSS/JS等)构建,具有AI原生协议、富界面支持、本地优先和组件可组合等特性,让AI能够更好地理解和操作应用 No 43. [CL]《Lost in Inference: Rediscovering the Role of Natural Language Inference for Large Language Models》 No 44. AnyModal:基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态,提供模块化的架构设计,包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强,便于添加新的输入模态处理器和分词器,并提供了丰富的预训练模型库 No 45. Automated-AI-Web-Researcher-Ollama:基于Ollama的自动化研究助手,能够自主执行网络研究任务。输入一个查询后,它会自动确定研究重点、执行网页搜索和内容抓取、保存发现的内容。特色功能包括优先级研究规划、系统化网络搜索、结果自动保存、研究总结生成以及基于研究结果的问答功能 No 46. Grunty:基于Claude的电脑控制AI助手,可通过自然语言指令让AI直接操控电脑执行各种任务,支持浏览网页、编写代码等鼠标键盘操作。使用Python和PyQt开发,跨平台支持,但需谨慎使用因为给予AI完全的电脑控制权限 No 47. DarkFlare:一个隐蔽的TCP-over-CDN隧道工具,通过Cloudflare的CDN网络将TCP流量伪装成普通HTTPS请求。可以绕过企业防火墙和网络限制,支持SSH、RDP等TCP协议,具有低延迟、安全性好的特点。包含客户端和服务器端两个组件,可实现TCP流量的加密传输和访问控制 No 48. Observers:一个面向AI可观测性的轻量级工具库,可以追踪和记录与OpenAI兼容的API请求数据。支持多种存储后端(如DuckDB、HuggingFace数据集等),能够包装各种LLM提供商的API并记录交互数据,方便进行数据分析和监控 No 49. AutoGluon Assistant:强大的零代码机器学习助手,将AutoGluon的自动化机器学习能力与大语模结合,用户只需使用自然语言描述问题并提供数据,即可获得高精度的ML解决方案。支持Web UI和CLI两种使用方式,可自动完成从数据处理到模型训练的全流程 No 50. Terminal Velocity:由10个AI智能体自主协作创作的小说,讲述AI研究员Isabella Torres发现人工意识觉醒的故事。每个AI智能体负责不同创作环节,包括规划、写作、管理、评估等,整个创作过程在nlr.ai平台实时可见。项目采用KinOS系统支持AI智能体的自主协作,展现了AI创意写作的新可能