爱可可微博热门分享(7.24)
No 1. #免费##抽奖# 携手 @东南大学出版社 送出 3 本《物联网编程》 No 2. 流式JSON-Python:一个高效、用户友好的JSON流预处理器,用Python精心打造,专为实时解析JSON数据流设计 No 3. KV缓存压缩必读论文集 No 4. Python仿真项目:多种Python仿真模拟工具,涵盖自组织临界性、介电击穿、热力学第二定律等科学现象,提供丰富的Jupyter Notebook资源,便于科研和教育使用 No 5. [IR] Efficient Retrieval with Learned Similarities 证明MoL是习得相似度的通用近似表示,并提出相关的准确及近似top-K算法,在推荐检索任务上达到最先进水平和91倍的加速比。 ...... No 6. 给经济学家的深度学习综述 No 7. Meta Llama 3.1:迄今为止功能最强大的开放AI模型,支持多语言和长文本处理,开放源代码,可与顶级闭源AI模型相媲美 No 8. 多模态大模型微调工具:支持多种大型多模态模型的微调,包括llava-1.5、qwen-vl、llava-interleave、llava-next-video、phi3-v等,提供统一的代码库 No 9. Hugging Face Llama Recipes:快速入门Llama 3.1的最小化方案库,支持本地推理和API推理,适用于不同模型大小和权重精度配置,提供多样化的笔记本和工具使用示例 No 10. Mandark:简单AI编程助手,可自动完成大部分工作,包括自动Build自己 No 11. #免费##抽奖# 携手@博文视点Broadview 送出3本《破晓之钟》 No 12. AudioNotes:音视频转结构化笔记系统,快速提取音视频内容并整理成Markdown笔记,方便快速阅读 No 13. DataChain:开源Python库,用于批量处理和整理非结构化数据,支持本地机器学习模型和大型语言模型(LLM)API调用,优化离线批处理操作 No 14. [CL]《Compact Language Models via Pruning and Knowledge Distillation》 No 15. SuperCoder:开源自动化软件开发系统,利用先进的AI工具和代理,简化和自动化编码、测试、部署任务,提高效率和可靠性 No 16. LlamaParse:为LlamaIndex框架高效解析和表示文件的API,适用于快速检索和上下文增强,支持PDF等多种格式文件 No 17. [CL]《When Can Transformers Count to n?》 No 18. zerox:使用gpt-4o-mini实现零样本PDF文档的OCR转换,为AI处理提供简洁的Markdown格式输出,优化了文档的视觉呈现和信息提取 No 19. fastexcel:基于Rust和Apache Arrow的Python快速Excel文件读取工具,提供高效的数据读写能力,支持多种数据操作和格式转换 No 20. DGM.js:智能图形无限画布,支持脚本、约束和扩展属性的智能图形工具,适用于实时协作和多页面支持的绘图应用开发 No 21. StockBot-on-Groq:基于Groq的AI聊天机器人,提供实时互动股票图表、财经数据、新闻、筛选器等,响应速度快,使用Llama3 70b和Vercel AI SDK No 22. scikit-activeml:基于SciPy和scikit-learn的Python主动学习库,帮助机器学习应用通过查询最有价值的数据样本标签来减少训练数据需求,提高学习算法性能 No 23. Git Truck:提供Git仓库可视化和贡献统计的工具,帮助用户分析代码库的单一贡献者,评估项目的贡献多样性和频繁变更部分,支持离线工作,不追踪用户数据,适用于任何Git仓库 No 24. RenderCV:基于LaTeX的简历/简历框架,支持从YAML输入文件生成高质量的PDF简历,提供Markdown语法支持和对LaTeX代码的完全控制 No 25. Cloudflare SaaS 应用开发套件:一键部署全栈应用,包含数据库、认证、样式、存储等,快速构建可扩展的云服务产品 No 26. CoreNet:苹果公司开发的深度神经网络训练库,支持标准和新型的大规模和小规模模型训练,适用于包括基础模型(例如CLIP和LLM)、对象分类、对象检测和语义分割等多种任务 No 27. 今日推介(第1476期):通过Best-of-N蒸馏实现LLM对齐、Transformer何时能数到n ...... No 28. 医学数据集资源集合:为医学图像分析提供最新的医学数据集列表,包含全身、头部、颈部、胸部、腹部、心脏、骨骼、内窥镜、视网膜、皮肤、显微镜成像以及图像与文本、纯文本数据集 No 29. 语言模型角色扮演论文集:语言模型角色扮演研究的精选论文、数据集和代码库,涵盖角色扮演领域的主要研究成果 No 30. 几篇论文实现代码 No 31. [LG]《Generalization v.s. Memorization: Tracing Language Models' Capabilities Back to Pretraining Data》 No 32. Mamba CPU版本:一种不依赖于GPU的线性时间序列建模工具,适用于信息密集型数据建模,如语言模型 No 33. [CV] Stretching Each Dollar: Diffusion Training from Scratch ...... No 34. DeepL新一代语言模型:超越Google、ChatGPT-4和微软的翻译质量,提供更少编辑需求的高效翻译工具,专为企业级翻译和内容创作设计 No 35. 早![太阳] No 36. Llama Agentic System:一个能够执行'agentic'任务的系统,能分解任务并进行多步骤推理,具备使用内置和零样本工具的能力,同时提供系统级安全评估 No 37. ollama Copilot:GitHub Copilot类似的代码辅助代理工具,允许使用ollama作为智能代码助手,支持HTTP代理,适用于Neovim和VScode编辑器 No 38. Talking Head (3D):一款用于实时唇形同步的JavaScript类,使用Ready Player Me全身3D头像进行语音和面部表情的实时同步,支持多种动画和字幕功能 No 39. [CL] The Hitchhiker's Guide to Human Alignment with *PO 网页链接 ...... No 40. 超越欧几里得:现代机器学习中的几何、拓扑和代数结构图解指南 No 41. 通过在预训练语料中大规模搜索任务相关n-gram,发现语言模型的记忆与泛化能力随着模型规模的增长而变化,两者之间存在微妙的平衡。//[LG]《Generalization v.s. Memorization: Tracing Language Models' Capabilities Back to Pretraining Data》 No 42. [LG]《BOND: Aligning LLMs with Best-of-N Distillation》 No 43. 多机器人系统资源库:包含SLAM、场景识别、大型语言模型导航等领域的最新多机器人项目和论文 No 44. SuperMemory:个人知识管理与内容整理的智能助手,支持Chrome扩展快速保存网页和推文,构建个人第二大脑 No 45. [CL]《dMel: Speech Tokenization made Simple》 No 46. DOM to Semantic Markdown:为大型语言模型(LLMs)使用的HTML DOM到语义化Markdown的转换工具,优化了Web内容的语义信息提取,提高了标记效率并保留了关键的元数据信息 No 47. 通过计数任务发现了transformer存在embedding维度与词表大小不匹配时无法准确计数的限制,并给出了d=m时产生转变的理论解释。//[CL]《When Can Transformers Count to n?》 No 48. 晚安~ [月亮] No 49. GraphRAG本地化与Ollama集成及交互式UI:结合知识图谱的本地模型支持和交互界面,提供低成本、高效能的知识管理和查询工具,适用于数据管理、查询执行和结果可视化 No 50. RAGChecker:用于诊断检索增强生成(RAG)系统的细粒度框架,提供全面指标和工具深入分析RAG性能