aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(11.23)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. #转发赠书#携手@图灵新知 @图灵文化 送出3本《万物皆计算》 No 2. indie-hacker-tools-plus:专为独立开发者打造的精选技术栈和工具合集。涵盖Web开发模板、前后端框架、数据库、支付系统、部署工具等全方位资源。特色是注重效率和成本优化,收录经过市场验证的热门工具,包含详细的使用场景和推荐说明 No 3. DarkFlare:一个隐蔽的TCP-over-CDN隧道工具,通过Cloudflare的CDN网络将TCP流量伪装成普通HTTPS请求。可以绕过企业防火墙和网络限制,支持SSH、RDP等TCP协议,具有低延迟、安全性好的特点。包含客户端和服务器端两个组件,可实现TCP流量的加密传输和访问控制 No 4. ollama-ebook-summary:一个专门用于长文本总结的LLM工具,可以将电子书或PDF自动分段处理并生成详细的要点总结。支持epub和pdf格式,能自动提取章节,将文本分成~2000 token的小块进行处理,最终生成结构化的笔记和总结,特别适合学习研究和知识整理 No 5. amILearningEnough:一个面向底层编程的学习路线图和资源集合。主要聚焦C语言和汇编语言的系统级编程学习,内容涵盖计算机架构、系统资源优化、操作系统开发、驱动程序编写等核心主题,帮助开发者深入理解计算机底层工作原理 No 6. 中国独立开发者项目列表:一个展示中国独立开发者作品的精选合集,收录了1000多个优秀项目,涵盖AI工具、效率软件、浏览器插件、游戏开发等多个领域。项目按类别整理,每个项目都包含开发者、项目名称、链接和简介等详细信息 No 7. 写了篇深度长文《AI Coding的范式革命:从工具演进到认知重构》 No 8. AnyModal:基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态,提供模块化的架构设计,包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强,便于添加新的输入模态处理器和分词器,并提供了丰富的预训练模型库 No 9. #转发赠书# 携手@博文视点Broadview 送出3本《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 No 10. #转发赠书# 携手@异步图书 送出5本《AI群星闪耀时》 No 11. Grunty:基于Claude的电脑控制AI助手,可通过自然语言指令让AI直接操控电脑执行各种任务,支持浏览网页、编写代码等鼠标键盘操作。使用Python和PyQt开发,跨平台支持,但需谨慎使用因为给予AI完全的电脑控制权限 No 12. AutoGluon Assistant:强大的零代码机器学习助手,将AutoGluon的自动化机器学习能力与大语模结合,用户只需使用自然语言描述问题并提供数据,即可获得高精度的ML解决方案。支持Web UI和CLI两种使用方式,可自动完成从数据处理到模型训练的全流程 No 13. DRL-Pytorch:最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法。包括从入门级的Q-learning到高阶的SAC、TD3等,每个算法都配有详细文档、完整训练曲线和论文引用。项目还提供了丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文等 No 14. TSB-AD:一个全面的时间序列异常检测基准平台,包含1070个高质量时间序列数据集和40种检测算法。特色是首次系统性解决了数据集完整性、评估指标可靠性和基准测试规范化等关键问题。该项目提供了从统计方法到最新基础模型的全面评估,并揭示了简单架构和统计方法往往优于复杂神经网络的发现 No 15. Sudoku-RWKV:一款专门用于解决数独问题的神经网络模型,基于RWKV-v6架构,通过约2百万个数独样本训练而成。模型参数量约1270万,具有8层结构和320维度,能够有效解决任意有解的数独题目 No 16. Visual Sorting:一款排序算法可视化工具,提供动态视觉效果和声音反馈,支持19种排序算法包括快排、归并、堆排序等,可自定义数组大小(2-1024)、排序速度和主题,每个数据项的高度对应不同的音调,让学习排序算法变得生动有趣 No 17. Electrobun:新型跨平台桌面应用开发框架,使用TypeScript构建超快速、轻量级的应用。基于Bun运行时和Zig原生绑定,提供完整的开发到部署解决方案,特色是应用包体积小(约12MB)、更新包极小(最低4KB),支持主进程和WebView之间的快速RPC通信 No 18. AutoFlow:开源的图谱型对话知识库工具,基于TiDB矢量存储构建。具备类Perplexity的对话式搜索功能、网站爬虫采集、知识图谱编辑以及JavaScript嵌入等特性。支持文档站点的智能爬取和检索,可通过可视化界面编辑知识图谱,适合构建智能客服和知识库系统 No 19. Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和加速等多个研究方向,同时提供中英双语内容解读 No 20. activeft:基于PyTorch的主动学习微调库,专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制,可以帮助优化模型微调过程中的数据使用,特别适用于大语言模型的测试时学习和转导式主动学习场景 No 21. RepoGPT:一个AI驱动的GitHub助手,允许用户通过自然语言与代码仓库进行交互。支持仓库导入、管理和聊天功能,集成了PostgreSQL和pgvector实现AI处理,可以智能解答代码相关问题、生成文档和提供代码建议,大大简化了代码库的探索和管理过程 No 22. graphrag-dify:一个将GraphRAG技术与Dify平台结合使用的实践项目,通过HTTP服务方式将GraphRAG的知识图谱检索能力暴露给Dify使用。项目提供了完整的配置流程和DSL示例,特别针对游戏《王者荣耀》的知识库进行了实践演示,实现了基于知识图谱的智能问答系统 No 23. Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MGSM数据集上表现优异,英文准确率提升6.17%,中文提升5.60%。特别适用于数学、物理、编程等标准答案领域,以及开放性问题的解决 No 24. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 25. ECC_Attacks:专注于椭圆曲线密码学(ECC)已知攻击方法的深度研究项目,详细介绍了ECC基本原理、密码学应用及各种攻击技术,包括ECDH和ECDSA两大类攻击,对于理解和实践ECC安全性非常有价值 No 26. gradio-webrtc:基于Gradio的WebRTC实时流媒体组件,支持网络摄像头视频流处理、服务器到客户端的视频/音频流传输、双向音频对话等功能,可用于构建实时对象检测、语音对话等AI应用,支持视频实时处理和音频流交互 No 27. AI前沿:从智能合作到语言模型的最新突破 No 28. PySpur:一款专注于推理计算流水线的集成开发环境,让开发者能够更便捷地构建、调试和部署LLM计算图。支持多种高级规划器(如MCTS、Self-Refinement等),提供并行/顺序采样的底层原语,内置验证器和评估功能,支持批量推理任务的异步执行和管理 No 29. TEN Framework:下一代AI Agent框架,号称全球首个真正实时的多模态AI Agent框架。支持高性能实时多模态交互,跨语言(C++/Go/Python)和跨平台开发,提供边缘云集成能力。框架特色包括实时代理状态管理、可视化编程、音视频工具集成等,适用于同声传译、语音转文本、多语言聊天室等场景 No 30. [LG]《Natural Language Reinforcement Learning》 No 31. tex-fmt:一个用Rust编写的超高性能LaTeX代码格式化工具。它支持.tex/.bib/.cls/.sty等LaTeX文件类型的格式化,相比传统工具latexindent速度提升超1000倍,提供命令行界面和VS Code集成,可通过Cargo、Nix、Homebrew等多种方式安装 No 32. 几篇论文实现代码 No 33. pg_mooncake:一个PostgreSQL扩展,为PG添加列式存储表支持,可将数据以Iceberg或Delta Lake格式存储在对象存储中,支持事务操作和批量操作,通过DuckDB执行引擎实现高达1000倍的分析查询性能提升,同时支持与常规PG表进行联表查询,便于在PG中直接进行数据分析 No 34. maze-dataset:一个用于研究机器学习系统OOD(分布外)行为的迷宫数据集工具包,提供多种迷宫生成算法(如随机深度优先搜索、Wilson算法等),支持数据集过滤、复杂度控制、去重等功能,可输出多种格式用于可视化和ML模型训练,适用于迷宫变换器的可解释性研究 No 35. 早![太阳] ​ No 36. Automated-AI-Web-Researcher-Ollama:基于Ollama的自动化研究助手,能够自主执行网络研究任务。输入一个查询后,它会自动确定研究重点、执行网页搜索和内容抓取、保存发现的内容。特色功能包括优先级研究规划、系统化网络搜索、结果自动保存、研究总结生成以及基于研究结果的问答功能 No 37. CMU_MATH-AIMO:卡内基梅隆大学团队在首届AI数学奥林匹克竞赛(AIMO)中获得亚军的开源项目,包含完整的训练数据集(AIME、AMC、Odyssey-Math)、验证集、模型微调代码和数据收集脚本,为研究AI解决数学问题提供了宝贵资源 No 38. Monty:一个创新的感知运动学习框架,基于大脑新皮层的千脑理论设计。由Numenta公司开源并获盖茨基金会部分资助,实现了感知运动系统的首个开源实现。该框架目前处于早期beta阶段,提供完整的基准测试集和文档支持,致力于研究类人脑学习机制 No 39. LTX-Video:一款基于DiT的实时视频生成模型,可在实时速度下生成高质量视频。支持24FPS、768x512分辨率的视频生成,处理速度快于播放速度。具备文本生成视频和图像生成视频两大功能,能生成多样化的高分辨率视频内容 No 40. MCTS:一个用Python实现的蒙特卡洛树搜索(Monte Carlo Tree Search)算法库,包含了基础的MCTS实现和一些实验性游戏示例。该项目提供了一个简单的数值累加游戏作为测试用例,可用于学习和理解MCTS算法的工作原理 No 41. OASIS:面向百万规模的开放式多智能体社交互动仿真平台,可模拟Twitter和Reddit等社交媒体平台上用户的行为,支持信息传播、群体极化等复杂社交现象的研究,具有高度可扩展性、动态环境和多样化的交互行为 No 42. WeSQL:一个创新的MySQL发行版,采用计算存储分离架构,将所有数据(包括binlog、schema、WAL等)完全存储在S3或S3兼容存储上,具备跨云平台部署能力,无供应商锁定,特别适合Serverless和BYOC场景,可实现快速启动和即时服务 No 43. launchweek.dev:一个追踪科技产品发布周的开源平台,专门收集和展示各个开发工具公司的产品发布活动。特色是引入了'Mega Launch Week'概念,类似开发者界的黑色星期五,多家公司在同一周集中发布新功能。平台基于Mintlify构建,支持MDX文档编写,方便开发者了解和跟踪最新的工具发布 No 44. //@爱可可-爱生活:AI编程正在推动软件开发从“编码-实现”模式转向“意图-涌现”新范式,相信会对你有所启发//写了篇深度长文《AI Coding的范式革命:从工具演进到认知重构》 No 45. [CL]《When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training》 No 46. tauri2-svelte5-shadcn:一个现代化的桌面应用开发模板,完美集成了Tauri 2、Svelte 5和Shadcn-svelte三大框架。特色是提供了完整的CI/CD流水线,支持Windows、Linux和Mac三平台的自动化构建,使用Bun作为运行时,并集成了TypeScript和TailwindCSS,非常适合快速开发跨平台桌面应用 No 47. x-cmd:一个强大的云端工具和脚本引导系统,支持1000+工具和脚本的一键执行。支持多种POSIX兼容shell,提供编程语言运行时环境管理、shell主题美化、交互式CLI工具等功能。特点是轻量(完整包<1.1MB)、快速(启动<100ms),已包含210+模块、520+软件包和1200+安装方案 No 48. llama3_interpretability_sae:一个完整的大语言模型(LLM)可解释性研究项目,使用稀疏自编码器(SAE)分析Llama 3.2模型,由纯PyTorch实现且可完全复现。包含从数据采集、SAE训练、特征分析到验证的全套流程,可帮助理解模型内部行为和概念表示 No 49. DAREA:一个用于音频的可微增强和鲁棒性评估工具,主要提供音频处理的可微分增强功能。它集成了Musan数据集用于噪声样本和MIT室内脉冲响应数据集,支持通过神经网络编解码器进行音频处理,并提供针对传统编解码器的STE(Straight Through Estimator)评估器 No 50. [CL]《Hymba: A Hybrid-head Architecture for Small Language Models》

fly51fly avatar Nov 23 '24 14:11 fly51fly