爱可可微博热门分享(5.21)
No 1. Llama3从零实现:从矩阵乘法逐步实现Llama3模型 No 2. PyTorch实用教程(第二版):面向深度学习工程师的全面指南,覆盖从零基础到项目应用和工程化部署的各个阶段,旨在帮助读者轻松掌握PyTorch的使用 No 3. PyNorch:从零开始重建PyTorch的深度学习框架,支持C/C++、CUDA和Python,具备GPU加速和自动微分功能 No 4. 大型语言模型与检索增强生成技术(RAG)实践指南:为技术团队提供构建基础对话式AI解决方案的全面指导,结合理论知识与代码实现,适合具有基本技术背景的人员 No 5. 知识图谱在检索增强生成(RAG)中应用实战 No 6. Marker PDF转Markdown工具:高准确度快速转换PDF文档为Markdown格式,适用于书籍和科学论文,支持多语言,去除页眉页脚及其他元素,格式化表格和代码块,提取并保存图片,转换大部分方程为LaTeX,适用于GPU、CPU或MPS No 7. [IR]《Positional encoding is not the same as context: A study on positional encoding for Sequential recommendation》 No 8. #免费##抽奖# 携手@博文视点Broadview 送出3本《解构大语言模型:从线性回归到通用人工智能(全彩)》 No 9. [CV] From Sora What We Can See: A Survey of Text-to-Video Generation ...... No 10. 机器学习系统领域的资源列表,包含精选的论文、视频和代码库,旨在帮助新入门者快速掌握机器学习系统的关键概念和应用 No 11. [CL] A Survey on Large Language Models with Multilingualism: ...... No 12. 晚安~ [月亮] No 13. mcinglis/c-style:最佳C编程实践指南 No 14. Illuminate:把学术论文变成AI生成的访谈播客 No 15. DashPlayer:为英语学习者量身打造的视频播放器,支持双语字幕、按字幕跳转、查词查询、界面尺寸可调、播放位置记录、蓝牙遥控操作、夜间模式、AI字幕生成和长视频切分功能 No 16. 几篇论文实现代码 No 17. 文本到语音转换资源列表:集成了多种文本到语音转换技术的资源库,提供包括声学模型、声码器模型、风格化语音合成、多说话人语音合成以及自适应语音合成等研究和实现的链接,旨在帮助开发者和研究人员探索和实现高质量的文本到语音转换技术 No 18. SLAM-LLM:面向语音、语言、音频、音乐处理的深度学习工具包,支持研究人员和开发者训练自定义的多模态大型语言模型(MLLM),提供详细的训练方案和高性能的推理检查点 No 19. 今日推介(第1412期):面向迁移遗忘学习的数据选择、观测缩放律和语言模型性能可预测性、面向大型语言模型高效推理的层压缩KV缓存、Transformer解码阶段的硬件感知可扩展注意力机制、序列的位置编码研究 ...... No 20. [LG]《Data Selection for Transfer Unlearning》 No 21. 机器人学习环境列表:深度强化学习、模仿学习及具身AI研究的流行环境集合 No 22. 早![太阳] No 23. CrewAI视频编辑助手:社交媒体内容编辑的自动化工具,快速提取长视频内容中的潜在病毒性片段,简化社交媒体内容的再利用和发布过程 No 24. 手语研究相关的数据集和论文列表的集合,旨在为手语识别、翻译和其他相关工作提供灵感和资源支持 No 25. EAGLEEYE图像应用开发框架:为快速将图像算法推向落地而设计的框架,通过统一的模块接口定义和数据流管线架构简化团队协同开发,支持移动端编译和多种编译脚本,提供工程目录结构和管线插件编写指南 No 26. Gemini-API:为Google Gemini web app设计的优雅异步Python封装器,提供持久Cookies、支持ImageFx图像生成、扩展支持、自动分类输出、官方风格接口以及高效的异步操作 No 27. Effect Note大纲笔记软件:一款纯文件存储的免费个人知识管理工具,支持Gitee云端同步,灵感来源于Confluence和Workflowy,致力于提升个人知识管理和发现能力 No 28. Worklenz:一站式项目管理工具,专为高效团队设计 No 29. Goku:在Kubernetes上运行大规模开源工具集的GenAIOps参考架构,提供一系列在Kubernetes上用开源工具进行生成性AI操作(GenAIOps)的参考架构 No 30. Farfalle:开源的AI驱动搜索引擎,支持本地部署大型语言模型(LLM)或使用云模型 No 31. [LG]《Lean Attention: Hardware-Aware Scalable Attention Mechanism for the Decode-Phase of Transformers》 No 32. 通过对比评估绝对编码、相对编码和旋转编码在序列推荐中的效果,发现相对编码可以提高训练稳定性,旋转编码对于稠密数据效果最佳,确定了位置编码的选择与数据集稀疏性之间的依赖关系。//[IR]《Positional encoding is not the same as context: A study on positional encoding for Sequential recommendation》 No 33. [CV] ART3D: 3D Gaussian Splatting for Text-Guided Artistic ...... No 34. 这两天在准备一个给专利局做的报告,用Gamma的时候发现一个问题——Gamma本身不支持思维导图,在其他地方做了粘进去的是图片,后续修改维护很不方便。经过摸索,发现ProcessOn提供的“嵌入第三方”功能(在“分享协作”里)可以用,将嵌入链接作为“网页或应用”组件插入Gamma,选“内联”方式,就得到 ...... No 35. 'CogVLM2 - 第二代多模态预训练对话模型,支持中英双语,显著提升文本和图像理解能力,优化模型性能’ ...... No 36. DiTing-Go:简单轻量级的即时通讯(IM)开源项目,专为Go语言初学者设计 No 37. aipan-netdisk-search:基于Vue和Nuxt.js的开源网盘搜索项目,旨在让每个人都能拥有自己的网盘搜索网站,推荐自行部署以实现个性化服务 No 38. 大模型白盒子构建指南:旨在从零开始手写代码,深入理解并实践大型语言模型(LLM)的构建,包括模型结构、RAG、Agent和Eval任务 No 39. Rockchip多媒体处理助手:为Rockchip平台提供FFmpeg命令行工具的硬件转码流水线,支持MPP和RGA,实现高效的视频编解码和图像处理功能 No 40. //@爱可可-爱生活:欢迎参与~ No 41. dqtorch:用于快速(双)四元数运算的PyTorch CUDA扩展库,通过高度优化的CUDA扩展实现对原生PyTorch实现(例如Pytorch3D)的性能显著提升,特别适合于变形NeRF训练等场景 No 42. tangermeme生物序列分析工具:现代生物学序列分析的高效助手,提供一系列原子级序列操作,支持预测模型的应用、序列设计,以及对模型学习内容的深入分析。支持多输入多输出模型,不依赖于特定距离,提供原始预测结果,并允许用户自定义损失函数。所有函数均经过单元测试,旨在计算和内存效率 No 43. [CL]《Layer-Condensed KV Cache for Efficient Inference of Large Language Models》 No 44. facontidavide/pointcloud_compression:用于点云数据压缩的实验性软件,支持无损和有损压缩,旨在提高ROS系统中点云数据的存储和传输效率 No 45. Fabric:开源框架,用AI增强人类能力,提供了一个模块化的解决方案框架,使用众包的AI提示来解决特定问题,并且可以在任何地方使用 No 46. 提出使用数据选择机制进行迁移遗忘学习,证明它在宽松定义下是精确的,并在多个数据集上获得显著性能提升,有时接近使用全部目标数据的上限。 No 47. 免费书《大语言模型》,为读者提供关于大语言模型技术的全面了解,从基础原理、关键技术到应用前景。它介绍了大模型技术的整体框架和路线图,并提供了下载链接和配套资源 No 48. document-convert:将PDF或扫描图像转换为类似Markdown格式的高效转换管道 No 49. Glider:开源的电子墨水屏项目,专注于低延迟和高刷新率,支持多种电子纸显示技术 No 50. Pytvzhen:能快速将英文YouTube视频转换成中文视频的开源项目,以其高效的翻译流程和高质量的文本转换作为最主要特色