爱可可微博热门分享(8.5)
No 1. 人人可用的实时直播数字人:基于少样本学习实现的数字人实时直播系统,适用于NVIDIA 30和40系列显卡,确保流畅的交互体验 No 2. 本地多智能体RAG超级助手:集成了GraphRAG知识搜索方法与AutoGen智能体,由Ollama提供的本地大型语言模型(LLM)支持,实现免费且离线嵌入和推理 No 3. FinHack®:全流程量化金融框架,集成数据采集、因子计算、因子挖掘、因子分析、机器学习、策略编写、量化回测、实盘接入等 No 4. RAM-a-thon:深入解析计算机内部运作,专注于RAM和CPU的详细解释 No 5. tea-tasting:A/B测试的统计分析Python包,提供多种内置统计测试和可扩展API,支持直接在数据后端进行统计计算 No 6. ONNX神经压缩器:支持ONNX模型量化的开源Python库,提供流行的模型压缩技术,如SmoothQuant和权重量化,适用于Intel硬件和流行的大型语言模型(LLM) No 7. convertfast-ui:基于shadcn-ui和tailwind的快速构建美观着陆页工具,提供预构建代码块,支持响应式设计、暗/亮模式切换、自定义组件、区块和页面,以及SEO结构化数据 No 8. [CL]《Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks》 No 9. 微信OCR服务调用助手:通过Python实现的微信本地OCR模型调用工具,支持快速识别图片中的文字内容,简化文字识别过程 No 10. AutoGluon-RAG:简化构建检索增强型生成(RAG)管道的框架,仅需几行代码即可定制大型语言模型以适应特定领域查询,无需深入技术细节 No 11. RagBuilder数据优化工具:自动化创建适用于数据的最优生产级检索增强生成(RAG)配置,通过超参数调优,快速识别最佳配置 No 12. Vimtutor Sequel:Vim高级教程,帮助用户深入理解Vim,提供高级命令和技巧的逐步教程和交互练习 No 13. 由北邮老师团队为青少年精心打造的免费AI通识课《AI在大前》 No 14. LLaVA-MORE:基于LLaMA 3.1的增强视觉指令微调工具,为多模态大型语言模型提供性能提升,公开发布8B参数模型的检查点 No 15. 多机械手抓取数据集:用于机器人抓取研究的模拟数据集,提供抓取过滤器的使用和可视化工具,支持从平行夹爪到灵巧手的各种抓取方式 No 16. greenery:正则表达式操作库,实现正则表达式间的交集计算,支持多种正则表达式操作,提高开发效率 No 17. 早![太阳] No 18. PDF处理与OCR工具:Doc2X API的Python封装,支持本地PDF处理,提升知识库应用中的PDF召回率,适用于构建知识库和文档增强 No 19. Agent系统性能评估工具:多框架下Agent模型的基准测试工具,可测试不同Agent系统在自定义推理基准上的表现,支持并行处理以加速结果获取 No 20. #免费##抽奖# 携手@博文视点Broadview 送出3本《AI for Science:人工智能驱动科学创新》 No 21. Local SRT/LLM/TTS Voicechat:一款快速、完全本地化的AI语音聊天工具,使用WebSockets实现低延迟语音交互,支持多种语音识别和合成技术 No 22. OculiChatDA眼科问诊大模型:通过对话方式辅助患者进行初步诊断,提供专业医学建议,具备眼底图识别能力,可判断青光眼或糖尿病视网膜病变 No 23. ComfyUI Colab模板:GitHub上的开源项目,提供一系列针对Stable Diffusion等AI模型的Colab笔记本模板,支持自定义和扩展,以简化AI艺术创作和图像生成过程 No 24. [CV]《DMESA: Densely Matching Everything by Segmenting Anything》 No 25. 基于优化和点不确定性感知的4D雷达系统雷达-惯性里程计,以实现高精度的定位和导航 No 26. RedCache-AI:为大型语言模型和智能Agent提供动态记忆框架,支持从AI驱动的约会应用到医疗诊断平台的广泛应用,可灵活存储和检索记忆信息 No 27. OpenPerPlex开源AI搜索引擎:利用前沿技术提供网页搜索功能,支持语义分块和结果重排,集成Google搜索和Groq推理引擎 No 28. MemFree混合AI搜索引擎:个人知识库与互联网的同步搜索工具,一键同步Chrome书签,支持多种传统搜索引擎,自托管超快速向量数据库与本地嵌入重排服务,全代码开源,一键部署 No 29. [CL] A Comprehensive Survey of LLM Alignment Techniques: RLHF, ...... No 30. 提出模块化RAG架构,将RAG系统解构为可重组的模块、子模块和操作器,提炼流模式,实现自适应流程控制,为RAG系统设计提供灵活、可扩展的理论框架和实践路线图。//[CL]《Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks》 No 31. 生成式AI遗忘技术论文列表,涵盖不同模态和应用场景的分类整理,包含数据集和基准测试 No 32. [IR] A Comprehensive Survey on Retrieval Methods in Recommender ...... No 33. 几篇论文实现代码 No 34. Comfyui-CatVTON:基于扩散模型的虚拟试穿技术,提供轻量级网络、高效的训练和简化的推理过程,适用于虚拟试穿应用 No 35. nanoPerplexityAI:开源的简单版PerplexityAI实现,使用大型语言模型(LLM)从Google检索信息,无需复杂界面或代理,仅用100多行Python代码 No 36. 晚安~ [月亮] No 37. LLMDocParser:一款利用大型语言模型(LLM)解析PDF并分析内容的工具,通过布局分析模型识别PDF页面的各个区域类型,实现更精准的文本提取和处理 No 38. Deoxys Vision Utils:用于机器人操作和学习研究的视觉包,支持ROS独立方式使用相机,适用于UT RPL小组内部使用 No 39. Fine-grained Late-interaction Multi-modal Retriever(FLMR):基于Hugging Face的多模态检索模型,实现细粒度的后交互检索功能,优化文档和图像内容的搜索效率 No 40. Stitch:一款用Rust编写的实验性WebAssembly解释器,旨在实现快速和轻量级性能 No 41. GraphMuse:音符图处理的图深度学习库,提供一系列工具,用于创建、操作和从音符图中学习,基于PyTorch Geometric,易于使用且灵活 No 42. OpenPlaceRecognition:基于Python和PyTorch框架的地点识别库,提供多模态数据的全局向量表示生成,支持语义对象上下文和深度估计功能 No 43. Banks:基于Jinja的LLM提示语言工具,帮助生成有意义的大型语言模型(LLM)提示,通过模板语言简化提示的创建过程,支持异步操作和模板重用 No 44. vArmor:基于AppArmor/BPF/Seccomp的云原生容器沙箱系统,包含多种内置保护规则,开箱即用 No 45. ComfyUI-AdvancedLivePortrait:高级实时人像编辑工具,允许用户编辑照片中的面部表情,将面部表情插入视频,并使用多个面部表情创建动画。支持自动化安装和管理,提供工作流和样本数据,方便用户快速上手 No 46. GrokAdamW:一种用于加速深度学习模型“顿悟”的PyTorch优化器,特别适合处理模型在过拟合训练数据后显著提升验证数据性能的情况 No 47. Notochord:实时神经网络模型,为MIDI表演提供智能伴奏,支持交互式MIDI处理应用,可与控制器、DAW等设备直接连接 No 48. [RO]《Neural Control Barrier Functions for Safe Navigation》 No 49. SiriLLama:通过Siri直接访问本地运行的大型语言模型,适用于连接到主机机器同一网络的任何苹果设备,支持开源模型Ollama或Fireworks AI No 50. rquickshare:Linux和macOS的NearbyShare/QuickShare功能实现,使用Rust语言开发,支持跨设备文件共享