爱可可微博热门分享(5.23)
No 1. Vach: 实时流式数字头像,实现音视频同步对话,基本达到商用效果,支持文本和语音交互,适用于直播间业务和展厅显示屏互动 No 2. 什么时候选择微调大模型 No 3. LLM评估详解 No 4. 最新的大模型定价表 [笑而不语] No 5. 电子健康记录分析工具:Python语言编写的电子健康记录(EHR)分析库,提供探索性和针对性分析、质量控制与预处理、可视化与探索、聚类与轨迹推断等功能,支持快速安装和使用,适用于医学研究和临床数据分析 No 6. TalkWithGemini:一键部署的私人Gemini应用,支持多种Gemini模型,具备图片识别、语音对话等功能,提供助理市场和Markdown支持,注重隐私和性能 No 7. RAG-Survey:AI生成内容的检索增强生成技术综述,系统收集和分类RAG相关论文,涵盖基础理论、方法分类、应用领域,为AI内容生成领域提供全面的研究视角 No 8. LeetCode编程题解:提供多种编程语言的LeetCode题目解决方案,注重代码的可读性和一致性风格,覆盖不同主题 No 9. 新书:基于Transformer和扩散模型的生成式AI实战,深入浅出地介绍如何使用Transformer和扩散模型进行生成式AI的实践指南,适合数据科学家和软件工程师阅读,提供丰富的代码示例和项目指导,帮助读者掌握创建文本、图像和声音生成模型的技术 No 10. OpenRedTeaming:针对大型语言模型和多模态模型的红队评估工具,提供超过120篇论文的综合调研,覆盖风险分类、攻击策略、评估指标和防御方法,旨在开发鲁棒的安全防护措施 No 11. Microsoft Phi-3 Cookbook:微软开发的Phi-3系列AI模型使用手册,提供如何在不同硬件设备上构建端到端解决方案的指南,包括在Azure AI Studio和Hugging Face上使用Phi-3模型的方法 No 12. StyleTalk语音对话数据集:用于训练大型语言模型以理解和响应不同说话风格的语音对话数据集,包含情感、语速和音量的变化,由人类标注过滤,旨在提高模型对语音模态的理解和响应能力 No 13. #免费##抽奖# 携手@博文视点Broadview 送出3本《解构大语言模型:从线性回归到通用人工智能(全彩)》 No 14. [CL] Large Language Models Meet NLP: A Survey 提出参数固定应用和参数调优应用两个视角,以此对LLM在NLP任务上的应用进行了系统的总结和展望,旨在提供统一的视角以理解LLM在NLP领域的进展和局限,并讨论了未来的研究方向和挑战。 ...... No 15. Chat2API:一个将网页版ChatGPT转换为OpenAI API格式的服务,支持多账号轮询和多种GPT模型对话,无需账号即可使用免费、无限的GPT-3.5 No 16. DIY-Astra:基于Flask的交互式AI助手应用,利用计算机视觉和自然语言处理技术,通过摄像头实时捕捉视频流,分析图像并生成文本响应,再将文本转换为语音并实时播放给用户 No 17. [LG]《Diffusion for World Modeling: Visual Details Matter in Atari》 No 18. FIFO-Diffusion:由文本生成无限视频,无需训练即可生成长视频,优化视频内容的创作和分享流程 No 19. Azure语音合成服务:用于将文本转换为语音的RESTful API,使用微软的Azure认知服务,使用Flask构建,并可以使用Docker进行容器化 No 20. GuoFeng Webnovel:多语言网络文学语料库,用于研究机器翻译和大型语言模型,包含丰富的语言文化现象和长文本上下文 No 21. [LG] Keep the Momentum: Conservation Laws beyond Euclidean ...... No 22. biobear:生物信息文件处理的高效Python库,使用Rust作为后端,支持Arrow、Polars和DuckDB,简化生物信息文件的读取和搜索 No 23. [LG]《Your Transformer is Secretly Linear》 No 24. InterProcessPyObjects:高性能的跨进程通信工具,通过共享内存实现Python对象在不同进程间的高效共享,支持多种数据类型和异步操作,适用于需要快速响应和处理能力的应用程序 No 25. Windows Copilot Runtime和C... No 26. [CL] OpenRLHF: An Easy-to-use, Scalable and High-performance ...... No 27. TiledCUDA:高效的CUDA核模板库,提供cutlass CuTe的封装,实现更高效的融合操作 No 28. Fasttext语言识别库:基于Facebook的fasttext训练模型,提供80倍速度提升和95%准确率的语言识别工具,支持多种语言识别 No 29. GPT-4o比GPT-4更容易产生幻觉? No 30. LMSYS ORG为Chatbot匿名排行榜发布 “Hard Prompts” 类,旨在通过更具挑战性的用户提交来测试和评估最新语言模型的能力 No 31. DAC-JAX:基于JAX的Descript音频编解码器实现,提供高保真音频压缩与重建,支持多种采样率与比特率模型,适用于音频处理与机器学习领域 No 32. Magic UI:面向设计工程师的UI库,提供可复制粘贴的动画组件和效果,适用于你的应用,免费且开源 No 33. Semantic Research Engine: 基于语义的学术论文搜索引擎,集成了Chainlit Copilot和Literal AI,通过arXiv API获取相关论文,并通过Chroma数据库实现检索增强生成(RAG)技术,提供用户交互式体验和应用性能观察 No 34. [LG]《Reducing Transformer Key-Value Cache Size with Cross-Layer Attention》 No 35. [IR] RecGPT: Generative Pre-training for Text-based Recommendation ...... No 36. Tap4 AI Web UI:一键部署开源AI工具目录的Web界面,旨在帮助用户轻松构建自己的AI工具目录,支持国际化、SEO友好、动态网站地图,并采用NEXT 14与Supabase无服务器数据库技术 No 37. Alpaca中文指令微调数据集:持续更新的中文指令微调数据集,支持双语微调和数据修正 No 38. DroneXtract:DJI无人机的数字取证套件,用于分析传感器数据、可视化飞行地图,并审计犯罪活动 No 39. 几篇论文实现代码 No 40. 用 PyTorch 的 FSDP(Fully Sharded Data Parallel)和 Torch.compile 技术来最大化训练吞吐量 No 41. 通过使用扩散模型取代离散自编码器构建世界模型,在保留关键视觉细节方面取得进步,在Atari游戏上取得新的状态对抗训练的智能体的最高人类归一化平均得分。//[LG]《Diffusion for World Modeling: Visual Details Matter in Atari》 No 42. tre:树状目录结构命令行工具,提供现代化的文件目录展示,支持git忽略规则、自定义别名、彩色输出,增强了经典的tree命令 No 43. minbpe:用于大型语言模型(LLM)分词的简洁干净的字节对编码(BPE)算法实现,支持自定义训练和与GPT-4分词器的比较验证 No 44. 知识图谱在检索增强生成(RAG)中应用实战 No 45. PyNorch:从零开始重建PyTorch的深度学习框架,支持C/C++、CUDA和Python,具备GPU加速和自动微分功能 No 46. [CL] PyramidInfer: Pyramid KV Cache Compression for High-throughput ...... No 47. 今日推介(第1414期):利用跨层注意力减少Transformer键值缓存大小、Transformer的线性特性、利用跨层注意力减少Transformer键值缓存大小、Transformer的线性特性、世界建模的扩散 ...... No 48. Box64Droid:在Android上运行x86_64应用程序,支持Box64、Box86、Wine Stable 8.0、DXVK、D8VK,原为Box4Droid的Box64分支 No 49. 通过黎曼几何和信息几何的角度解析Adam优化器,指出其使用对角经验Fisher信息矩阵实现自然梯度逼近,并提出增强后的Fisher Adam算法。//[LG]《FAdam: Adam is a natural gradient optimizer using diagonal empirical Fisher information》 No 50. Llama3从零实现:从矩阵乘法逐步实现Llama3模型