aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(11.20)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. Foundations of LLMs:浙江大学开源的大语言模型教材,系统介绍大模型相关基础知识和前沿技术。涵盖传统语言模型、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六大主题,每章配有相关论文列表,定期更新以跟踪最新技术进展 No 2. 电子印章工具:Draw Stamp Utils,一个用JavaScript编写的电子印章制作工具,能轻松创建和定制电子印章 No 3. 优秀Qwen提示语大全:集合了各种高质量Qwen模型提示语的资源库,帮助用户更好地与Qwen对话和生成文本内容 No 4. Documind:一个开源平台,利用人工智能从文档中提取结构化数据,擅长将PDF转换为图像进行详细处理,并根据用户定义的模式提取信息 No 5. bRAG-langchain:构建自己的RAG应用,探索从基础到高级的检索增强生成技术,包括多查询和定制RAG构建 No 6. TEN Framework:下一代AI Agent框架,号称全球首个真正实时的多模态AI Agent框架。支持高性能实时多模态交互,跨语言(C++/Go/Python)和跨平台开发,提供边缘云集成能力。框架特色包括实时代理状态管理、可视化编程、音视频工具集成等,适用于同声传译、语音转文本、多语言聊天室等场景 No 7. DRL-Pytorch:最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法。包括从入门级的Q-learning到高阶的SAC、TD3等,每个算法都配有详细文档、完整训练曲线和论文引用。项目还提供了丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文等 No 8. graphrag-dify:一个将GraphRAG技术与Dify平台结合使用的实践项目,通过HTTP服务方式将GraphRAG的知识图谱检索能力暴露给Dify使用。项目提供了完整的配置流程和DSL示例,特别针对游戏《王者荣耀》的知识库进行了实践演示,实现了基于知识图谱的智能问答系统 No 9. PromptFix:你提示,我修图,一款能够根据人工指令处理损坏图片并去除不需要元素的AI工具,支持上色、去水印等多种图像修复任务 No 10. AI旅行助手:智能旅行助理,能帮你查找航班、预订酒店,还能发送个性化的旅行计划邮件 No 11. 白霜词库:一款精心打造的Rime输入法词库,基于7.45亿字高质量语料重新统计词频,特色是去除不健康和冷僻词汇,优化字词频率准确度,支持全拼/双拼等多种输入方案。无需使用智能模型即可达到出色的输入效果,支持Windows/Mac/Linux/iOS/Android全平台,可通过Git、东风破等多种方式安装使用 No 12. spaCy Layout:一款能够处理PDF、Word文档等多种格式文件的自然语言处理工具,将结构化数据处理与spaCy的强大功能相结合,输出清晰、结构化的数据,并提供熟悉的Doc对象以访问标记文本区域 No 13. AutoSeg-SAM2:基于SAM1和SAM2的自动视频分割工具,结合SAM1的静态分割和SAM2的追踪能力,可对视频进行全自动分割,实现对象追踪和新目标检测。支持Python 3.10+和PyTorch 2.3.1+环境,提供完整的演示数据集和部署文档 No 14. AGI记忆系统:一个高级的数据库设计,用于人工通用智能(AGI)的记忆管理系统,该系统模仿了人类认知架构,实现了多种类型的记忆存储和检索机制 No 15. Memoripy:一款AI记忆层工具,具备短期和长期存储、语义聚类和记忆衰减功能,专为需要记忆管理的AI应用设计 No 16. 汇总人工反馈强化学习(RLHF)算法的资料库,旨在整理RLHF相关论文和博客,帮助理解如何通过人工反馈优化大型语言模型 No 17. LogitsProcessors Zoo:NVIDIA开发的LLM输出控制工具集,提供一系列处理器来自定义和增强大语言模型的行为。包含多个实用工具如生成长度控制器、引用提示处理器、强制结束语处理器和多项选择处理器等,支持transformers、vLLM和TensorRT-LLM等主流框架,可以更精确地控制LLM的输出行为 No 18. ColiVara:一款基于视觉嵌入的文档存储、搜索和检索服务,提供视觉增强的检索体验,支持多种文件格式和网页内容 No 19. Pensieve:你的数字记忆助手,自动记录屏幕内容,构建智能索引,提供便捷网页界面检索历史记录,主打隐私保护和数据自主控制 No 20. 机器学习创业公司大全:一个精选的AI和机器学习创业公司列表,按照地理位置(柏林、伦敦、马德里、米兰、巴黎等)和技术领域(NLP、计算机视觉、机器人等)分类整理,包含公司基本信息、员工规模、融资轮次等详细数据 No 21. Kyanos:一款基于eBPF的网络采集和问题分析工具,能捕获HTTP、Redis、MySQL等网络请求,帮助分析异常网络问题,快速定位问题源头,无需复杂的数据包捕获和分析步骤 No 22. AI多智能体协调器:灵活强大的框架,用于管理多个AI智能体和处理复杂对话,支持智能意图分类、双语言、灵活的智能体响应和上下文管理 No 23. AFusion:AlphaFold 3的图形用户界面工具包,提供直观的GUI界面简化AlphaFold 3的安装和预测过程。主要功能包括引导式安装、实体管理、JSON配置生成、Docker集成执行、控制台输出以及批量预测API。支持蛋白质、RNA、DNA和配体的多实体预测,适合不熟悉命令行操作的用户 No 24. 开源项目启动模板集:汇集了各种开源的模板和样板,帮助你快速启动下一个项目,特色在于覆盖了浏览器扩展、Web开发、移动开发等多个领域 No 25. EgoMimic:基于第一人称视角的模仿学习框架,用于机器人技能学习。支持处理人类Aria眼镜采集的数据和机器人远程操作数据,提供了完整的数据处理、训练和部署流程。包含多个示例任务如日用品拿取、衣物折叠等,并提供了预训练数据集和详细的实验配置 No 26. 信息熵新解:探索信息论中的熵概念,探讨了一种替代的 Shannon 熵的构造方法,通过将熵视为基于样本序列的对数计数,而非传统的基于概率分布编码长度的方法 No 27. AI前沿:高效训练与智能分析 No 28. 早![太阳] ​ No 29. cuEquivariance:NVIDIA开发的高性能神经网络库,帮助构建尊重对称性的神经网络模型,提升模型的数据效率 No 30. Focalboard:开源的项目管理工具,作为Trello、Notion和Asana的自托管替代方案。提供个人桌面版和多用户服务器版两个版本,支持多语言,可用于定义、组织、追踪和管理个人及团队工作。具备看板、任务管理等核心功能,支持Windows、Mac和Linux平台,可通过Docker快速部署 No 31. texture-diffusion:一个强大的Blender插件,利用扩散模型实现自动化纹理生成。它允许用户在Blender内直接为3D模型生成纹理,支持局部重绘(inpainting)、LoRA模型和IP-Adapter,可通过深度ControlNet确保生成的纹理符合3D几何特征,支持多纹理着色和UV投影等高级功能 No 32. TTPlanetPig Comfyui_Object_Migration:一个研究项目,旨在利用 DIT 模型的自注意力机制,实现单个概念的迁移,特别关注Stable Diffusion, SD模型在生成图像时对同一对象或角色的高度一致性 No 33. 机器学习系统教程:个人学习笔记和代码分享平台,专注于机器学习与系统结合的实践和理论,适合对AI技术有兴趣的初学者和研究者 No 34. Hero C Compiler:一款C语言编译器,能将C代码转换为Vulkan图形API的SPIR-V代码,实现CPU和GPU代码间的资源共享,简化GPU编程 No 35. emiT-C:一个时间旅行编程语言的开源项目,允许程序员通过操作变量在时间线上前进和后退,创建并行宇宙,引入变量的生与死,以及处理时间悖论 No 36. pgpdf:PostgreSQL的PDF数据类型扩展,让你能将PDF文件直接存储和处理为数据类型,实现对PDF的高效管理和全文检索 No 37. 几篇论文实现代码 No 38. [LG]《MARS: Unleashing the Power of Variance Reduction for Training Large Models》 No 39. Sheas Cealer:一款基于WPF的SNI伪造工具,用于抵御网络非法监听,可在Windows系统上运行。该工具通过伪造Chromium内核的SNI扩展标记实现功能,支持Setup安装器和免安装zip包两种使用方式,内置伪造规则持续更新,并提供全局净化等相关子项目 No 40. c-web-modules:旨在通过模块化和高效的方法,将 C 语言引入 Web 开发领域的项目,它允许开发者上传原始 C 代码至服务器进行即时编译和部署,支持即时更新和性能优化,适合需要快速迭代和高性能的场景 No 41. [CL]《Does Prompt Formatting Have Any Impact on LLM Performance?》 No 42. MoE-Lightning通过创新的CPU-GPU-I/O流水线调度策略CGOPipe和基于分层Roofline模型的性能模型HRM,显著提升了内存受限GPU上大型MoE语言模型的推理吞吐量,并展现了其在多GPU上的超线性扩展能力,其中在CPU上执行注意力计算的反直觉策略尤为突出。 No 43. iocraft:用Rust语言打造的美观、手工艺级别的命令行界面、文本用户界面和基于文本的输入输出工具,让你轻松构建复杂布局和交互元素 No 44. Photoshop与AI绘画工具桥梁:sd-ppp,让你在Photoshop中直接与AI绘画工具如SD、SDForge、ComfyUI沟通,实现多层、多文档、多Photoshop工作间的无缝协作 No 45. Nano-UMAP:简化版的UMAP降维算法,让复杂数据变得简单易懂,特别适合需要直观展示高维数据场景 No 46. [LG]《MoE-Lightning: High-Throughput MoE Inference on Memory-constrained GPUs》 No 47. PDFMathTranslate:一款PDF科学论文翻译和双语对比工具,能保留原文排版,支持全文双语翻译,并且兼容多种翻译服务 No 48. 本文系统研究了不同提示格式对GPT模型性能的显著影响,发现更大的模型更鲁棒,但没有通用的最佳格式,提示格式的选择需要根据具体模型和任务进行优化,这为改进LLM评估方法和提升性能提供了重要启示。//[CL]《Does Prompt Formatting Have Any Impact on LLM Performance?》 No 49. Perplexideez:本地AI助手,让你在网络和自托管应用中快速搜索信息,支持多用户和SSO,还有美观的搜索结果嵌入展示 No 50. SonicSim:针对移动声音源场景的自定义模拟平台,用于语音处理研究,提供了一个高度可定制的数据集 SonicSet,用于评估语音分离和增强模型的性能

fly51fly avatar Nov 20 '24 14:11 fly51fly