爱可可微博热门分享(2.9)
No 1. Redis作者antirez关于LLM的分享 No 2. 2023年最值得关注的顶级Python库 No 3. 月之暗面创始人杨植麟:个性化交互是AI-Native产品的核心价值 No 4. INFO9023《机器学习系统设计》课程资料 No 5. 是时候承认基因不是生命蓝图了 No 6. 'tt-zhipin - 头头直聘,仿Boss直聘实现。SpringCloud Alibaba 构建后端,React ...... No 7. Open Creator:开源LLM工具,用于从对话中提取可重复的任务,并将它们保存到一个定制的技能库中以供检索 No 8. Edgen:本地私有的GenAI服务器,是OpenAI的替代品。不需要GPU,可以在本地运行AI模型,包括LLM(Llama2、Mistral、Mixtral等)、语音转文本(whisper)等 No 9. MetaVoice-1B:12亿参数的基础模型,经过100,000小时的语音训练,用于文本转语音(TTS)任务。其主要优先事项包括:在英语中传达情感色彩丰富的语音节奏和语调,避免幻觉;支持(跨语言)语音克隆并可进行微调;针对美国和英国的语音进行零样本克隆,只需30秒的参考音频;支持长篇合成 No 10. microsearch:简单高效的Python搜索引擎,旨在提供简单易用的搜索功能,允许用户使用Python进行搜索,并提供了使用FastAPI创建应用程序以及网站的选项,以提供用户友好的体验 No 11. Notty:开源、简约的AI笔记应用,强大的 Markdown 编辑器。特点包括:简洁易用、AI 助力、内置 Markdown 编辑器、云同步、冲突解决、本地优先和快速响应 No 12. CatVision:开源多模态大模型,紧密模拟了GPT4V/Qwen-VL-PLUS系列模型的功能,建立在Qwen-72b-Chat的基础上,可以处理包含交错的图文输入,从Qwen72b的优势中受益,旨在有效地遵循输出格式指令 No 13. Web2pdf:一个命令行工具,用于将网页转换成精美格式的PDF文件,具有批量转换、自定义样式、多列支持、页码添加、目录生成等功能,还支持自定义CSS以进一步定制PDF外观,可以帮助用户轻松地将多个网页转换为PDF文件,并在格式和样式上进行灵活的调整 No 14. 独立开发者大列表 No 15. OpenAI API官方教程:网站问答引擎实战 No 16. awesome-generative-ai-guide:生成式AI相关资源大列表,包括相关研究、面试材料、笔记等 No 17. '哄哄模拟器开源版 - 大模型用的是 google 的 gemini,主打一个免费(每分钟60次调用) ’ GitHub: ...... No 18. 几篇论文实现代码 No 19. 机器能像小孩那样学习语言吗? No 20. Lag-Llama: 用于时间序列预测的开源基础模型 No 21. topicwizard:强大的主题模型可视化包 No 22. [CV] Blue noise for diffusion models 现有的扩散模型大多使用高斯噪声进行训练和采样,但这种噪声可能无法最优地考虑去噪网络重建的频率内容。本文提出了一种新的扩散模型,将相关噪声引入训练过程,并利用Blue ...... No 23. 2023最佳科学插图集锦 No 24. Aivis:能生成高音质、富有情感语音的工具,用于创建、训练和推断Bert-VITS2模型的数据集 No 25. [CV] ScreenAI: A Vision-Language Model for UI and Infographics ...... No 26. [LG] A Roadmap to Pluralistic Alignment 提出一个多元对齐的路线图,旨在确保AI系统服务于具有不同价值观和观点的人群。提出三种定义和操作AI系统中多元性的可能途径,提出三种多元性基准。此外,本文还指出当前的对齐技术在多元AI方面存在局限性,并提出进一步研究的需求 ...... No 27. Adam 优化器背后的数学原理 No 28. VectorLM:建立在HuggingFace模型... No 29. LGM: 用于高分辨率3D内容创建的大型多视图高斯模型 No 30. 晚安~ [月亮] No 31. Gaia:以C++编写的物理仿真代码库,旨在提供高效且灵活的仿真解决方案,支持独立运行或作为第三方模块集成到其他应用中。它包含了一系列实用工具,如高效的三角/四面体网格数据结构、便捷的参数输入输出模块、碰撞检测器以及可扩展的虚拟物理框架,以支持各种求解器 No 32. [CL] Long Is More for Alignment: A Simple but Tough-to-Beat Baseline ...... No 33. TT-Buda:一个软件栈,可以从多个不同的框架(如PyTorch和TensorFlow)中编译AI/ML模型,并在Tenstorrent硬件上以多种不同的方式执行 No 34. 早![太阳] No 35. 今日推介(第1310期):基于Transformer免搜索的大师级国际象棋对弈、模拟过参数化、面向Transformer鲁棒N:M稀疏化训练的渐进梯度流、军事和外交决策中语言模型的态势升级风险、神经网络会优先学习低阶统计量 ...... No 36. Movie101:大规模中文电影理解基准,包含101部电影,配备音频描述(AD)。数据集包含30,174个解说片段,总计92小时。基准包含两个任务:电影片段解说(MCN)和时序解说定位(TNG) No 37. [LG]《Progressive Gradient Flow for Robust N:M Sparsity Training in Transformers》 No 38. Google产品升级:对话AI系统Bard正式更名为Gemini No 39. Bunny: 轻量但功能强大的多模态模型族,包括多个即插即用的视觉编码器(如EVA-CLIP、SigLIP)和语言骨干(如Phi-1.5、StableLM-2和Phi-2) No 40. EasyKV:专门用于键-值约束生成式语言模型推理的PyTorch包 No 41. AI for Inquiry:问题改善工具,以LLM为驱动的“思考工具”,旨在提升用户提出的问题的质量和深度,利用一种新的推理算法,集成了多样的专家人格和基于图的推理节奏,系统地完善问题,使其更具洞察力、发人深省,并适合在各个领域进行深入探索,例如学术研究、商业战略或个人探究 No 42. [AS] Fast Timing-Conditioned Latent Audio Diffusion 研究着眼于使用生成模型以文本提示为基础,高效生成长音频和音效。该模型基于潜变量扩散,通过完全卷积变分自编码器定义潜变量,并结合文本提示和时间嵌入进行条件控制,能对生成音乐和声音的内容和长度进行精细控制。 ...... No 43. AlgoPlus:一个C++库,包含了现成的复杂数据结构和算法,支持图结构、最短路径计算以及可视化 No 44. LongMamba:对 Mamba 上下文扩展的探索 No 45. ChatLLM.cpp:纯C++实现的库,提供了几... No 46. 热门GPTs开发者榜单 No 47. optimī:快速、现代且低精度的PyTorch优化器,通过Kahan求和实现准确的低精度训练,支持完全解耦的权重衰减,并具有现代优化器的快速实现 No 48. [LG]《Escalation Risks from Language Models in Military and Diplomatic Decision-Making》 No 49. rtmlib:超轻量级的库,用于基于RTMPose模型进行姿态估计,无需mmcv、mmpose、mmdet等依赖,只需要numpy、opencv-python、opencv-contrib-python和onnxruntime No 50. [LG]《Learning a Decision Tree Algorithm with Transformers》