爱可可-爱生活
爱可可-爱生活
No 1. 用合成数据进行微调:蒸馏与自我改进 No 2. Design2Code:网页草图/截屏转代码工具,旨在将各种网页设计格式(如草图、线框图、Figma、XD等)转换为干净且响应式的HTML/CSS/JS代码。用户只需上传设计图像,Design2Code即可自动生成代码 No 3. Langchain之类的库到底对LLM用了什么提示?用Mitmproxy进行拦截分析 No 4. 'Multi-Agent-GPT: 一款基于RAG和agent构建的多模态专家助手GPT,集成了文本、图像和音频等模态工具,支持本地部署和私有数据库建设' ...... No 5. [LG] A Systematic Survey of Prompt Engineering in Large Language ...... No 6. [LG]...
No 1. 如果一个人的领域知识广度足以覆盖整个行业,而深度恰好多于「能够评价任务执行的好坏与否」的程度,就可以比较好地操纵 AI 去完成那些本来需要好几个不同职责的人去完成的事情 No 2. Aya:Aya模型是一个513M参数的多语种语言模型,能理解和遵循101种语言的指令;Aya数据集是迄今为止最全面的多语种指令微调数据集,包含114种语言的5.13亿个提示和补全,完全开源;Aya为自然语言理解、摘要和翻译任务中的未服务语言提供了基础 No 3. babelfish by sync.:在不到15分钟内部署一个应用,利用AI将任意视频完美翻译成任意语言并实现唇语同步 No 4. [CV] 3D Gaussian as a New Vision Era: A Survey 介绍了3D Gaussian Splatting(3D-GS)作为计算机图形学领域的重要技术进展,提供了显式场景表示和新视角合成的方法,而无需依赖神经网络等。3D-GS已在机器人、城市地图、自主导航和虚拟现实/增强现实等领域找到了广泛应用。本 ...... No...
No 1. (开源硬件)平衡立方体,可以在一个顶点上保持平衡并旋转 No 2. DataDreamer:一个强大的开源Python库,用于提示、合成数据生成和训练工作流,旨在简单、高效,且适用于研究。使用DataDreamer,可以轻松创建和运行多步骤的提示工作流,生成合成数据集,对模型进行训练 No 3. [CL] Large Language Models: A Survey 大型语言模型(LLM)因其在各种自然语言任务上的强大性能而受到关注。LLM通过在大量文本数据上训练数十亿参数的模型来获得通用的语言理解和生成能力。本文回顾了一些最著名的LLM,包括GPT、LLaMA和PaLM,讨论了它们的特点、贡献和限制。 ...... No 4. 推理、可解释性与LLM No 5. AutoRAG:RAG工作流自动化优化工具 No 6. [LG] A Survey on Transformer Compression...
No 1. (开源硬件)平衡立方体,可以在一个顶点上保持平衡并旋转 No 2. 关于高质量人工标注数据的思考 No 3. DataDreamer:一个强大的开源Python库,用于提示、合成数据生成和训练工作流,旨在简单、高效,且适用于研究。使用DataDreamer,可以轻松创建和运行多步骤的提示工作流,生成合成数据集,对模型进行训练 No 4. AutoRAG:RAG工作流自动化优化工具 No 5. TheProfessor-155b:一个特殊的大型... No 6. DEUS:超灵活的实时图像生成引擎,基于StableDiffusion和LCM Lora No 7. BUD-E: 开源的AI语音助手,旨在实现实时回复用户请求、使用自然语音、具备共情和情感智能、处理之前对话的长上下文、处理多人对话中的打断、肯定和思考暂停,并且完全在消费级硬件(如NVIDIA GTX 4090)上本地运行 No 8. cvGPUSpeedup:旨在利用内存读取的机会来提高OpenCV-CUDA代码在GPU上的运行速度,尤其是针对深度学习网络的典型预处理和后处理操作 No 9....
No 1. Whishper:开源100%本地的音频转录和字幕套件,具有完整的网页用户界面,可以将任何媒体(音频、视频等)转录成文本,支持从URL转录和上传文件转录 No 2. LLM的高效线性模型融合 No 3. Pod-Helper:一款先进的音频处理工具,不仅可以以极快的速度转录音频,还可以利用MLM(Masked Language Model)目标进行音频修复,以确保内容保持其质量和氛围,其功能包括实时音频转录、音频损坏修复以及情感分析,帮助用户理解内容的情绪 No 4. BUD-E: 开源的AI语音助手,旨在实现实时回复用户请求、使用自然语音、具备共情和情感智能、处理之前对话的长上下文、处理多人对话中的打断、肯定和思考暂停,并且完全在消费级硬件(如NVIDIA GTX 4090)上本地运行 No 5. [CL] Large Language Model based Multi-Agents: A Survey of Progress .........
No 1. Whishper:开源100%本地的音频转录和字幕套件,具有完整的网页用户界面,可以将任何媒体(音频、视频等)转录成文本,支持从URL转录和上传文件转录 No 2. 神经科学和生物医学大语言模型的数据科学机遇 No 3. Edgen:本地私有的GenAI服务器,是OpenAI的替代品。不需要GPU,可以在本地运行AI模型,包括LLM(Llama2、Mistral、Mixtral等)、语音转文本(whisper)等 No 4. 'tt-zhipin - 头头直聘,仿Boss直聘实现。SpringCloud Alibaba 构建后端,React ...... No 5. Notty:开源、简约的AI笔记应用,强大的 Markdown 编辑器。特点包括:简洁易用、AI 助力、内置 Markdown 编辑器、云同步、冲突解决、本地优先和快速响应 No 6. microsearch:简单高效的Python搜索引擎,旨在提供简单易用的搜索功能,允许用户使用Python进行搜索,并提供了使用FastAPI创建应用程序以及网站的选项,以提供用户友好的体验 No 7....
No 1. Redis作者antirez关于LLM的分享 No 2. 2023年最值得关注的顶级Python库 No 3. 月之暗面创始人杨植麟:个性化交互是AI-Native产品的核心价值 No 4. INFO9023《机器学习系统设计》课程资料 No 5. 是时候承认基因不是生命蓝图了 No 6. 'tt-zhipin - 头头直聘,仿Boss直聘实现。SpringCloud Alibaba 构建后端,React ...... No 7. Open Creator:开源LLM工具,用于从对话中提取可重复的任务,并将它们保存到一个定制的技能库中以供检索 No 8. Edgen:本地私有的GenAI服务器,是OpenAI的替代品。不需要GPU,可以在本地运行AI模型,包括LLM(Llama2、Mistral、Mixtral等)、语音转文本(whisper)等...
No 1. Adam 优化器背后的数学原理 No 2. 2023最佳科学插图集锦 No 3. EfficientML.ai:MIT 6.5940... No 4. 'XCrawler - 轻量型A股爬虫项目' GitHub: github.com/Stock-Fund/XCrawler ...... No 5. Ego-Exo4D:研究视频学习和多模态感知的基础数据集 No 6. 2023年最值得关注的顶级Python库 No 7. MetaVoice-1B:12亿参数的基础模型,经过100,000小时的语音训练,用于文本转语音(TTS)任务。其主要优先事项包括:在英语中传达情感色彩丰富的语音节奏和语调,避免幻觉;支持(跨语言)语音克隆并可进行微调;针对美国和英国的语音进行零样本克隆,只需30秒的参考音频;支持长篇合成 No 8....
No 1. Web2pdf:一个命令行工具,用于将网页转换成精美格式的PDF文件,具有批量转换、自定义样式、多列支持、页码添加、目录生成等功能,还支持自定义CSS以进一步定制PDF外观,可以帮助用户轻松地将多个网页转换为PDF文件,并在格式和样式上进行灵活的调整 No 2. EfficientML.ai:MIT 6.5940... No 3. 是时候承认基因不是生命蓝图了 No 4. 检索增强生成(RAG)实战指南 No 5. 2023年最值得关注的顶级Python库 No 6. 'Tabular LLM:构建面向表格智能任务的大型语言模型 - 本项目旨在收集开源的表格智能任务数据集(比如表格问答、表格-文本生成等),将原始数据整理为指令微调格式的数据并微调LLM,进而增强LLM对于表格数据的理解,最终构建出专门面向表格智能任务的大型语言模型' ...... No 7. ResuLLMe:用大型语言模型(LLM)来定制简... No 8. [CL] LitLLM:...
No 1. 2023年最值得关注的顶级Python库 No 2. 检索增强生成(RAG)实战指南 No 3. Web2pdf:一个命令行工具,用于将网页转换成精美格式的PDF文件,具有批量转换、自定义样式、多列支持、页码添加、目录生成等功能,还支持自定义CSS以进一步定制PDF外观,可以帮助用户轻松地将多个网页转换为PDF文件,并在格式和样式上进行灵活的调整 No 4. Qwen1.5发布,6 种模型规模:0.5B、1.8B、4B、7B、14B 和 72B,所有模型均支持 32768 tokens 的上下文长度 No 5. Gaia:以C++编写的物理仿真代码库,旨在提供高效且灵活的仿真解决方案,支持独立运行或作为第三方模块集成到其他应用中。它包含了一系列实用工具,如高效的三角/四面体网格数据结构、便捷的参数输入输出模块、碰撞检测器以及可扩展的虚拟物理框架,以支持各种求解器 No 6. [LG] A Survey on Data Augmentation in...