aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(12.10)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. #转发赠书# 携手@博文视点Broadview 送出3本《可解释机器学习:黑盒模型可解释性理解指南(第2版)》 No 2. supertree:一个强大的Python决策树可视化工具,支持在Jupyter等环境中交互式展示决策树,包含缩放、展开折叠节点、全屏显示等功能,兼容scikit-learn、LightGBM、XGBoost等主流机器学习库的决策树模型 No 3. 强化学习领域最新概述,内容涵盖价值型强化学习、策略梯度方法、基于模型的方法以及其他相关话题 No 4. E2M:一键将各种文件格式转换为Markdown的开源工具,支持doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3、m4a等多种文件类型,易于安装,支持自定义配置 No 5. Ivy:强大的机器学习框架代码转换工具,支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转,可以轻松实现模型、工具和库的跨框架移植,支持即时转换和延迟转换两种模式,还提供图追踪优化功能 No 6. nv-ingest:英伟达发布的文档解析与内容提取微服务,能够处理大量复杂非结构化的PDF、Word等企业文档,提取文本、表格、图表和图像内容及元数据,支持并行化处理,提供OCR识别和向量化存储,适用于下游生成式AI应用 No 7. 新闻知识图谱聊天机器人:一个利用Diffbot和Neo4j构建的知识图谱项目,能够从新闻文章中提取信息,并通过聊天界面回答相关问题 No 8. 大型语言模型(LLM)入门指南,涵盖了LLM的优势、局限性、应用场景和研究方向 No 9. ScholarCopilot学术写作助手:智能辅助工具,通过AI生成文本和引用建议,提升学术写作效率和质量,保持学术高标准 No 10. LangGraph RAG研究Agent模板:一个帮助你快速开始使用LangGraph在LangGraph Studio中开发RAG(Retrieval-Augmented Generation)研究Agent的项目,主要功能包括文档索引、聊天历史管理以及基于检索文档的响应生成 No 11. #转发赠书# 携手@异步图书 送出5本《软件设计的哲学(第2版)》 No 12. Invoify:强大的在线发票(invoice)生成器,基于Next.js 13构建,支持多种发票模板,可实时预览、保存、导出多种格式(PDF/JSON/XLSX/CSV/XML),支持多语言,支持自定义主题色和输入项,具备邮件发送功能,操作简单直观 No 13. Director:强大的视频AI智能体框架,类似于视频版的ChatGPT,可以通过自然语言完成视频搜索、编辑、剪辑、生成等复杂任务。内置20多个预制智能体,支持视频总结、脚本生成电影、媒体库搜索索引、内容剪辑、配音编辑、多语言字幕等功能,基于VideoDB的视频即数据基础设施构建 No 14. O1-CODER:一个专注于编程任务的O1模型复现项目,结合强化学习(RL)和蒙特卡洛树搜索(MCTS)来增强模型的系统思维能力,包含测试用例生成器(TCG)和自弈强化学习两大核心组件,旨在生成更高效和逻辑性强的代码 No 15. 深度思考第十二篇:在AI时代,最重要的不是掌握特定知识,而是培养认知的新陈代谢能力 No 16. 快语助手:极速AI语音助手,响应时间小于500毫秒,让语音交互更流畅 No 17. gradio_image_annotator:一个基于Gradio的图像标注组件,可用于在图像上添加和编辑边框。支持多种功能如自定义标签列表、颜色设置、框的大小限制、透明度调节等,适用于图像目标检测和标注场景 No 18. AutoDev AI助手:一款集成到VSCode的AI编程助手,支持多语言代码自动生成和智能错误修复,让编程更快捷高效 No 19. FineWeb 2:高质量多语言预训练数据集,支持超过1000种语言,是FineWeb数据集的第二代版本。采用针对不同语言特点定制的过滤规则,包含语言识别、去重、数据过滤和隐私信息匿名化等处理步骤,可根据数据重复度进行'再水合'以提升性能 No 20. RAG Cookbooks:高级检索增强生成(RAG)技术合集,包含10种先进RAG实现方案的详细教程。从基础的Naive RAG到高级的Adaptive RAG,提供完整的代码实现和评估方法。使用LangChain、Pinecone等主流工具,适合研究人员和开发者学习和实践RAG技术 No 21. ScholasticAI 学术助手:一款多功能的检索增强型生成工具,能上传和分析本地PDF文件,提取精确信息,并利用生成式AI基于文档中的高保真引用生成答案,同时还能查询外部知识数据库 No 22. Harper:为开发者设计的英语语法检查工具,快速、轻量且注重隐私保护,避免将数据发送至服务器 No 23. [LG] BigDocs: An Open and Permissively-Licensed Dataset for ...... No 24. CrewAI精选:由CrewAI社区精心策划的开源项目清单,发现、贡献并扩展AI Agent的可能性 No 25. FTL:一款轻量级的快速部署工具,主打简单高效的项目部署流程。支持多云服务商(Hetzner/DigitalOcean/Linode等),具备零停机部署、自动SSL证书管理、Docker容器部署、Nginx反向代理等功能,适合不需要复杂编排的中小型项目使用 No 26. 晚安~ [月亮] ​ No 27. AI深度思考文章汇总:《停止无效积累:认知代谢才是未来核心竞争力》 No 28. 「AI深度思考」专题汇总//AI深度思考文章汇总:《停止无效积累:认知代谢才是未来核心竞争力》 No 29. [LG]《Frontier Models are Capable of In-context Scheming》 No 30. ZhiLight大模型推理引擎:由知乎和ModelBest公司开发的高性能LLM推理引擎,针对PCIe GPU优化,支持Llama等大模型变体。主要特点包括异步OpenAI兼容接口、自定义张量和统一内存管理、双流并行处理、融合批处理注意力机制,支持多种量化方案(INT8/SmoothQuant/FP8/AWQ/GPTQ)和MoE模型 No 31. OLMo-core:AI2开源的OLMo语言模型核心构建模块,基于PyTorch实现,提供了完整的模型训练和优化组件,支持多种规模模型(1B-13B)训练,包含flash attention、float8训练等高级特性 No 32. Vision-is-all-you-need:创新的文档检索系统(V-RAG),无需传统的文本分块,直接利用视觉语言模型处理PDF文档。使用ColPali进行图像嵌入,Qdrant作为向量数据库,配合GPT4-Vision生成响应。基于Modal实现serverless部署,包含FastAPI后端和React前端 No 33. 早![太阳] ​ No 34. Ollama交互式提示工程教程:一个基于Jupyter Notebook的交互式教程,专门针对Ollama平台的提示工程学习。课程分为9个章节,从基础到高级,涵盖提示结构、角色分配、数据与指令分离、输出格式化、避免幻觉等核心内容。使用Qwen2.5模型作为示例,提供大量实践练习机会 No 35. 几篇论文实现代码 No 36. [CL]《Transformers Struggle to Learn to Search》 No 37. PyGyat:一个有趣的Python预处理器,将Python代码转换为流行网络用语风格。它能让开发者用潮流词汇替代Python关键字,比如用'rizz'代替'+','yap'代替'print'等,同时提供VSCode语法高亮支持,让编程更有趣味性 No 38. Awesome MCP Servers:一个模型上下文协议(MCP)服务器的精选列表,包含大量分类实现,涵盖文件系统、版本控制、云存储、数据库、通信、监控、搜索等多个领域,帮助AI模型安全地与本地和远程资源进行标准化交互 No 39. Pythonize:一个实验性的Rust序列化工具,能将Rust对象转换为Python值并反向操作,特点是与serde_json相似的Python结构输出 No 40. [LG]《APOLLO: SGD-like Memory, AdamW-level Performance》 No 41. Video-LLaVA-7B-hf-CinePile:基于Video-LLaVA的视频理解模型,针对CinePile基准测试优化,显著提升了对主题探索、叙事分析、角色关系等高层次理解能力,性能接近Claude 3,在视频内容理解方面取得了显著进展 No 42. MasteringRAG:一个全面的企业级RAG系统教程项目,涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现等多个模块,提供详细的实践示例和优化方案,帮助开发者构建高质量的RAG应用 No 43. 今日推介(第1615期):用多步预测Transformer实现迷宫导航、面向Conformer修剪的自适应Dropout、Transformer模型搜索能力缺陷研究、类似SGD的内存消耗AdamW级别性能的APOLLO优化器、前沿大模型具有上下文化策略欺骗的能力 ...... No 44. GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答案。涵盖了生成式AI的核心内容,从Transformers到扩散模型,从语言模型到图像生成,并包含实践应用案例。适合想要系统学习生成式AI的开发者使用 No 45. Flash Attention:基于Triton语言实现的注意力机制算法,提供高效的计算和优化,适用于大规模数据处理 No 46. [LG] Surveying the Effects of Quality, Diversity, and Complexity ...... No 47. Wyoming Satellite:远程语音卫星,使用Wyoming协议,能够进行本地唤醒词检测和音频增强,与智能家居系统无缝对接 No 48. 视频实例分割论文资源列表,助力视频编辑与智能分析,让视频内容更精准、更生动 No 49. AppIcon Forge:一个直观的应用图标生成器,让你轻松自定义颜色、边框、阴影等,创造独特的应用图标 No 50. llama-chunk:一个基于Llama-70B的创新文本分块策略,针对RAG应用优化。其特色是使用中文字符'段'作为特殊标记,让大模型自动进行语义分块,无需使用正则表达式或人工规则。经测试在法律文本基准上表现优于传统naive方法和语义分块方法,具有更高的检索率和信噪比

fly51fly avatar Dec 10 '24 14:12 fly51fly