aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(5.18)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. 生成模型的进化： - GAN(2014年，生成约10^3个像素) - StackGAN(2016年，生成约10^5个像素) ...... No 2. #免费##抽奖# 携手@博文视点Broadview 送出3本《解构大语言模型：从线性回归到通用人工智能（全彩）》 No 3. 'PAI-RAG: 基于大语言模型和多向量数据库的知识库问答系统白盒化解决方案' GitHub: github.com/aigc-apps/PAI-RAG ...... No 4. #免费##抽奖# 携手@异步图书送出 5 本《大模型应用开发动手做AI Agent》 No 5. 免费书：《命令行数据科学实战（第二版）》，通过Unix命令行工具，向数据科学家展示了如何高效地获取、清洗、探索和建模数据 No 6. nvImageCodec：开源的 GPU 和 CPU 加速编解码库，提供统一的接口 No 7. CM6 V2 Robotic arm：CM6 COBOT机器人臂，开源的六轴协作机器人，旨在成为研究和开发安全、顺应性机器人的平台 No 8. 用大型生成模型(LGM)加速科学发现 No 9. Llama3.java：Java 实现的 Llama 3 推理引擎项目，旨在测试和调整 JVM 上的编译器优化，特别是针对 Graal 编译器 No 10. 通过编程和数学领域的细致对比实验，发现LoRA相对全微调学习能力较弱、源域遗忘较小、提供较强正则化，且全微调学到高秩权重扰动，给出了LoRA使用的建议。 No 11. 'Kansformers: Transformers using KANs' GitHub: github.com/akaashdash/kansformers ...... No 12. sports：专注于用计算机视觉技术来推动体育领域中的目标检测、图像分割、关键点检测和基础模型的开源工具库 No 13. 几篇论文实现代码 No 14. [CL] SynthesizRR: Generating Diverse Datasets with Retrieval ...... No 15. 视觉语言模型详解 No 16. Grounding DINO 1.5：由IDEA Research开发的先进的开放式目标检测模型系列 No 17. Horizon：现代银行平台项目，基于 Next.js 框架构建的金融软件即服务 (SaaS) 平台，允许用户连接多个银行账户，查看实时交易记录和总余额，以及管理个人财务 No 18. ChatGPT-4o的数学问题解决能力测试 No 19. ROS-LLM：为机器人实体智能应用设计的ROS框架，支持自然语言交互，并利用大型语言模型（如GPT-4和ChatGPT）进行机器人决策和控制 No 20. [LG]《LoRA Learns Less and Forgets Less》 No 21. [IR]《UniRAG: Universal Retrieval Augmentation for Multi-Modal Large Language Models》 No 22. UFO : 由微软开发的，专注于Windows操作系统交互的UI Agent框架 No 23. 'zh_recogn中文语音识别 - 将音频或视频中的中文语音识别并导出为srt字幕，基于魔塔社区Paraformer模型' ...... No 24. Omni-VideoAssistant：基于大型语言模型(LLM)和帧卷积技术的视频问答助手，旨在提供多模态数据融合和无限数据生成的能力 No 25. Neural Data Simulator：用于开发脑机接口的电生理数据实时模拟器 No 26. 晚安～ [月亮]

No 27. [CL]《Chameleon: Mixed-Modal Early-Fusion Foundation Models》 No 28. [AI] How Far Are We From AGI 从AGI的内部能力、外部接口和支持系统三个层面详细概述了当前AI发展状况，提出AGI分级体系，为AI社区共同理解和推进AGI发展提供了基础框架和方向。 ...... No 29. Farfalle：开源的AI驱动搜索引擎，支持本地部署大型语言模型(LLM)或使用云模型 No 30. 新书《大语言模型实战》，旨在教授Python开发者如何利用大型预训练语言模型来构建先进的文本处理系统 No 31. [CV]《CAT3D: Create Anything in 3D with Multi-View Diffusion Models》 No 32. 早！[太阳]

No 33. 今日推介(第1409期)：混合模态早期融合基础模型、LoRA学得少忘得也少、用多视图扩散模型在3D中创建任意东西、多模态大语言模型的通用检索增强、换个视角看卡通结构重建 ...... No 34. 提出CAT3D，用多视图扩散模型生成一致新视角，配合鲁棒3D重建，实现任意数量图像简单高效生成高质量3D场景。//[CV]《CAT3D: Create Anything in 3D with Multi-View Diffusion Models》 No 35. ComfyUI-Inpaint-CropAndStitch：用于图像修复的 ComfyUI 插件，通过裁剪和拼接技术提高图像修复速度 No 36. 'TKAN: Temporal Kolmogorov-Arnold Networks' GitHub: github.com/remigenet/TKAN ...... No 37. Emeltal：使用最新机器学习模型的本地语音聊天工具 No 38. 免费课程：“构建多模态搜索和RAG系统”，旨在教授如何通过对比学习实现多模态模型训练，构建能处理文本、图像、音频和视频的多模态RAG系统，并用于行业实践 No 39. Introducing Whisper-TikTok：使用FFMPEG、Microsoft Edge朗读功能和OpenAI Whisper模型来创建TikTok视频 No 40. Vidur: 微软开发的大规模语言模型推理模拟框架 No 41. '懒人客服 - 基于大模型的智能对话客服工具，支持多平台接入，能处理文本、语音和图片，并通过插件访问外部资源，定制企业AI应用' ...... No 42. Glider：开源的电子墨水屏项目，专注于低延迟和高刷新率，支持多种电子纸显示技术 No 43. Pytvzhen：能快速将英文YouTube视频转换成中文视频的开源项目，以其高效的翻译流程和高质量的文本转换作为最主要特色 No 44. 通过并发编程框架详细分析了部署长上下文Transformer的效率挑战，提出KV缓存压缩作为减少1M上下文成本至4K的核心问题。//[LG]《Challenges in Deploying Long-Context Transformers: A Theoretical Peak Performance Analysis》 No 45. 受Devin启发的AI Agent的列表，旨在为软件开发提供自动化和增强能力 No 46. Learn Rust, one exercise at a time：通过解决100个练习来学习Rust编程语言的自由进度课程 No 47. Experts.js：简化使用 OpenAI Assistants API 的 JavaScript 库，允许创建和链接 AI 助手作为工具，构建具有扩展记忆和细节注意力的多AI Agent系统 No 48. [CV]《Toon3D: Seeing Cartoons from a New Perspective》 No 49. [CV] From NeRFs to Gaussian Splats, and Back 通过提取点云和渲染视图实现NeRF和GS之间的高效转换，使机器人系统同时利用两种表示的泛化性、实时渲染和编辑能力。 ...... No 50. document-convert：将PDF或扫描图像转换为类似Markdown格式的高效转换管道

May 18 '24 14:05 fly51fly