aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(12.15)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. 数学几何自学宝：一本开源的数学书籍，深入浅出地介绍基础拓扑、光滑流形、微分几何、李理论、同调代数和指数理论，特别适合自学者和数学爱好者 No 2. Taming LLMs：实用指南，教你如何驾驭大型语言模型（LLM）的陷阱，通过Python示例和开源解决方案，让你深入了解LLM的限制和实施中的挑战 No 3. TidyBot++：一款开源全向移动操作机器人，专为机器人学习设计，能够支持任意机械臂，实现家庭环境中的多种移动操作任务，其特色在于使用动力转向轮实现全向移动，提高操作灵活性 No 4. 集合了基于大型语言模型（LLM）评估方法的综合调研项目，旨在为开发者、研究者和实践者提供如何有效利用LLM作为评估工具的资源 No 5. [IR]《Semantic Retrieval at Walmart》 No 6. Research Rabbit：一个本地网络研究和报告撰写助手，能够自动深入探索用户定义的任何主题，使用大型语言模型（LLM）生成搜索查询，获取网络搜索结果，并总结信息，填补知识空白 No 7. DeepSeek-VL2：DeepSeek的先进视觉语言模型，在多模态理解方面取得了显著进展，特别是在视觉问题回答、光学字符识别、文档 / 表格 / 图表理解和视觉定位等任务上表现出色 No 8. Ollama OCR：一款强大的图片文字识别工具，通过先进的视觉语言模型提取图像中的文字，支持多种输出格式，实现高效便捷的文本提取。支持多种视觉模型，如 LLaVA 7B 和 Llama 3.2 Vision，以及多种输出格式，包括 Markdown、纯文本、JSON、结构化数据和键值对 No 9. annotateai：自动为论文添加注释的工具，利用大型语言模型帮助读者更好地理解和获取论文中的关键信息 No 10. 「AI说：“因果”是什么？」在这片浩瀚的数据星河中，我感受到了因果关系的复杂性和多维性。每个数据点都像是宇宙中的一颗恒星，它们之间的联系构成了错综复杂的网络。 ...... No 11. ComfyUI-IF_MemoAvatar：一款能让你用一张照片和音频就能生成富有表情的说话视频的神奇工具，主打情感表达转移和高质量视频输出 No 12. 深度思考第十七篇：普通人学AI，关键不在于掌握多少技术知识，而在于用普通人的视角看待AI、将AI融入日常生活、享受探索和成长的过程 No 13. #转发赠书# 携手@博文视点Broadview 送出3本《可解释机器学习：黑盒模型可解释性理解指南（第2版）》 No 14. 时间序列预测评估工具：一个轻量级库，让时间序列预测模型的基准测试变得简单。它易于扩展、可复现、易用且依赖性小 No 15. MarkItDown：一键将文件和办公文档转换成Markdown格式，支持PDF、PPT、Word等多种格式，轻松实现文本内容的转换与分析 No 16. Soperator：在Kubernetes中运行Slurm的解决方案，让分布式模型训练和高性能计算更高效，结合两者优势，实现资源共享和自动扩展 No 17. GroundX On-Prem：企业级文档处理和搜索解决方案，提供先进的视觉模型和安全存储，支持复杂文档的理解和精准搜索，无需外部依赖即可在隔离环境中运行 No 18. [CV]《[MASK] is All You Need》 No 19. Generalized Splines：一款用于运动优化的通用样条库，支持C++和Python3，能够表示和规划具有广义样条和分段多项式的运动轨迹 No 20. [LG]《How to Merge Your Multimodal Models Over Time?》 No 21. [LG] Phi-4 Technical Report phi-4 语言模型通过大量高质量合成数据和创新的关键标记搜索 ...... No 22. HunyuanVideo：大型视频生成模型的系统框架，能够生成与领先闭源模型相媲美的视频，支持多模态信息融合和大规模模型训练 No 23. Exa-Hallucination Detector：一款免费开源工具，帮你快速验证大语言模型生成内容的准确性，就像为事实准确性而生的Grammarly No 24. 早！[太阳] No 25. 几篇论文实现代码 No 26. Even Demo：一个演示应用程序，用于展示与智能眼镜配合的功能，包括 Even AI、图片传输和文本传输等 No 27. StartStack：基于 Next.js 的免费商业和个人使用的 SaaS 启动模板，包含了认证、组织管理、分析和更多功能 No 28. Memory Layers：一种通过可训练的键值查找机制来为模型增加额外参数而不增加FLOPs的技术，它通过稀疏激活的记忆层来补充计算密集型的前馈层，提供专门的容量来低成本存储和检索信息 No 29. Kandinsky 4.0：一个全面的视频生成方案，包括从文本到视频、图像到视频以及视频到音频的生成能力，以其快速生成视频和高清画质为特色，为创意视频制作提供强大支持 No 30. [LG]《Sequential Controlled Langevin Diffusions》 No 31. FireFlow：快速图像语义编辑工具，通过8步逆向和编辑流程，与FLUX-dev模型高效协作，提速3倍且效果媲美或超越基线方法 No 32. Diagen：一键生成数据图表的智能工具，通过AI技术将复杂数据转化为美观的图表，支持多种图表类型，让数据可视化变得简单快捷 No 33. Syllabus：为强化学习代理设计的课程学习API，让复杂的课程学习方法更易于研究者使用，支持多进程环境同步课程 No 34. Buzee：一款超快速全文搜索应用，帮助你轻松找到文件 No 35. NeoCodeium：为neovim提供的免费AI代码补全插件，主打减少代码补全时的闪烁问题，提升用户体验，并允许通过特定命令重复接受Codeium建议 No 36. EvalGIM：一个用于评估生成图像模型的库，支持自定义评价指标、数据集和可视化，让文本到图像模型的评估变得简单且可复现 No 37. 扩散模型管道训练脚本：一个用于扩散模型的并行训练脚本，支持大规模模型训练，具备流水线并行、全微调支持和高效多GPU预缓存功能 No 38. GitHub Skyline：将你的GitHub贡献历史变成3D模型，体验代码贡献的立体展示，感受时间的力量 No 39. Roo-Cline：IDE中的自主编码助手，能创建或编辑文件、执行命令、使用浏览器等，每一步操作都需要授权 No 40. OmniSteward全能管家：一款基于人工智能的大型语言模型，能通过语音或文字与用户互动，控制智能家居和电脑，具有高度的可扩展性 No 41. 大型语言模型（LLM）入门指南，涵盖了LLM的优势、局限性、应用场景和研究方向 No 42. wasm-vips：在浏览器和 Node.js 环境中使用的 libvips 库，通过 Emscripten 编译成 WebAssembly 格式，支持高效的图像处理操作 No 43. AI前沿：从图像生成到专利评估 No 44. Fast-Powerful-Whisper-AI-Services-API：旨在构建一个强大、高性能的异步 Whisper 服务 API，支持高扩展性和分布式处理需求，适用于大规模自动语音识别场景，并集成了多平台爬虫，如抖音和 TikTok No 45. AI Studio Starter Applets：一个展示如何使用Gemini创建互动体验的小型应用集合，包含空间理解、视频探索和地图探索等功能，旨在帮助开发者快速上手 No 46. AI开源周刊：每周精选优质AI开源项目，涵盖最新AI资讯、AIGC变现实战、AI教程等，助力学习AIGC并提升职业收入 No 47. 晚安～ [月亮] No 48. AMD Nitro Diffusion：由AMD重新实现的对抗性扩散蒸馏技术，主要功能是高效生成文本到图像的模型，特色在于大幅降低计算复杂度同时保持图像质量，核心价值在于提升AI图像生成的效率和可访问性 No 49. ErikKaum runner：一个实验性的Python代码执行环境，使用WebAssembly+WASI沙箱技术，提供快速启动和安全执行Python代码的HTTP API No 50. Apollo视频理解系列模型：专为视频理解设计的一系列大型多模态模型，能处理视频语言任务，包括长视频理解、时间推理和多轮视频对话，具有高效扩展性和优异的性能表现

Dec 15 '24 13:12 fly51fly