aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(5.18)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. 生成模型的进化: - GAN(2014年,生成约10^3个像素) - StackGAN(2016年,生成约10^5个像素) ...... No 2. #免费##抽奖# 携手@博文视点Broadview 送出3本《解构大语言模型:从线性回归到通用人工智能(全彩)》 No 3. 'PAI-RAG: 基于大语言模型和多向量数据库的知识库问答系统白盒化解决方案' GitHub: github.com/aigc-apps/PAI-RAG ...... No 4. #免费##抽奖# 携手@异步图书 送出 5 本《大模型应用开发 动手做AI Agent》 No 5. 免费书:《命令行数据科学实战(第二版)》,通过Unix命令行工具,向数据科学家展示了如何高效地获取、清洗、探索和建模数据 No 6. nvImageCodec:开源的 GPU 和 CPU 加速编解码库,提供统一的接口 No 7. CM6 V2 Robotic arm:CM6 COBOT机器人臂,开源的六轴协作机器人,旨在成为研究和开发安全、顺应性机器人的平台 No 8. 用大型生成模型(LGM)加速科学发现 No 9. Llama3.java:Java 实现的 Llama 3 推理引擎项目,旨在测试和调整 JVM 上的编译器优化,特别是针对 Graal 编译器 No 10. 通过编程和数学领域的细致对比实验,发现LoRA相对全微调学习能力较弱、源域遗忘较小、提供较强正则化,且全微调学到高秩权重扰动,给出了LoRA使用的建议。 No 11. 'Kansformers: Transformers using KANs' GitHub: github.com/akaashdash/kansformers ...... No 12. sports:专注于用计算机视觉技术来推动体育领域中的目标检测、图像分割、关键点检测和基础模型的开源工具库 No 13. 几篇论文实现代码 No 14. [CL] SynthesizRR: Generating Diverse Datasets with Retrieval ...... No 15. 视觉语言模型详解 No 16. Grounding DINO 1.5:由IDEA Research开发的先进的开放式目标检测模型系列 No 17. Horizon:现代银行平台项目,基于 Next.js 框架构建的金融软件即服务 (SaaS) 平台,允许用户连接多个银行账户,查看实时交易记录和总余额,以及管理个人财务 No 18. ChatGPT-4o的数学问题解决能力测试 No 19. ROS-LLM:为机器人实体智能应用设计的ROS框架,支持自然语言交互,并利用大型语言模型(如GPT-4和ChatGPT)进行机器人决策和控制 No 20. [LG]《LoRA Learns Less and Forgets Less》 No 21. [IR]《UniRAG: Universal Retrieval Augmentation for Multi-Modal Large Language Models》 No 22. UFO : 由微软开发的,专注于Windows操作系统交互的UI Agent框架 No 23. 'zh_recogn中文语音识别 - 将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型' ...... No 24. Omni-VideoAssistant:基于大型语言模型(LLM)和帧卷积技术的视频问答助手,旨在提供多模态数据融合和无限数据生成的能力 No 25. Neural Data Simulator:用于开发脑机接口的电生理数据实时模拟器 No 26. 晚安~ [月亮] ​

No 27. [CL]《Chameleon: Mixed-Modal Early-Fusion Foundation Models》 No 28. [AI] How Far Are We From AGI 从AGI的内部能力、外部接口和支持系统三个层面详细概述了当前AI发展状况,提出AGI分级体系,为AI社区共同理解和推进AGI发展提供了基础框架和方向。 ...... No 29. Farfalle:开源的AI驱动搜索引擎,支持本地部署大型语言模型(LLM)或使用云模型 No 30. 新书《大语言模型实战》,旨在教授Python开发者如何利用大型预训练语言模型来构建先进的文本处理系统 No 31. [CV]《CAT3D: Create Anything in 3D with Multi-View Diffusion Models》 No 32. 早![太阳] ​

No 33. 今日推介(第1409期):混合模态早期融合基础模型、LoRA学得少忘得也少、用多视图扩散模型在3D中创建任意东西、多模态大语言模型的通用检索增强、换个视角看卡通结构重建 ...... No 34. 提出CAT3D,用多视图扩散模型生成一致新视角,配合鲁棒3D重建,实现任意数量图像简单高效生成高质量3D场景。//[CV]《CAT3D: Create Anything in 3D with Multi-View Diffusion Models》 No 35. ComfyUI-Inpaint-CropAndStitch:用于图像修复的 ComfyUI 插件,通过裁剪和拼接技术提高图像修复速度 No 36. 'TKAN: Temporal Kolmogorov-Arnold Networks' GitHub: github.com/remigenet/TKAN ...... No 37. Emeltal:使用最新机器学习模型的本地语音聊天工具 No 38. 免费课程:“构建多模态搜索和RAG系统”,旨在教授如何通过对比学习实现多模态模型训练,构建能处理文本、图像、音频和视频的多模态RAG系统,并用于行业实践 No 39. Introducing Whisper-TikTok:使用FFMPEG、Microsoft Edge朗读功能和OpenAI Whisper模型来创建TikTok视频 No 40. Vidur: 微软开发的大规模语言模型推理模拟框架 No 41. '懒人客服 - 基于大模型的智能对话客服工具,支持多平台接入,能处理文本、语音和图片,并通过插件访问外部资源,定制企业AI应用' ...... No 42. Glider:开源的电子墨水屏项目,专注于低延迟和高刷新率,支持多种电子纸显示技术 No 43. Pytvzhen:能快速将英文YouTube视频转换成中文视频的开源项目,以其高效的翻译流程和高质量的文本转换作为最主要特色 No 44. 通过并发编程框架详细分析了部署长上下文Transformer的效率挑战,提出KV缓存压缩作为减少1M上下文成本至4K的核心问题。//[LG]《Challenges in Deploying Long-Context Transformers: A Theoretical Peak Performance Analysis》 No 45. 受Devin启发的AI Agent的列表,旨在为软件开发提供自动化和增强能力 No 46. Learn Rust, one exercise at a time:通过解决100个练习来学习Rust编程语言的自由进度课程 No 47. Experts.js:简化使用 OpenAI Assistants API 的 JavaScript 库,允许创建和链接 AI 助手作为工具,构建具有扩展记忆和细节注意力的多AI Agent系统 No 48. [CV]《Toon3D: Seeing Cartoons from a New Perspective》 No 49. [CV] From NeRFs to Gaussian Splats, and Back 通过提取点云和渲染视图实现NeRF和GS之间的高效转换,使机器人系统同时利用两种表示的泛化性、实时渲染和编辑能力。 ...... No 50. document-convert:将PDF或扫描图像转换为类似Markdown格式的高效转换管道

fly51fly avatar May 18 '24 14:05 fly51fly