aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(2.10)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. Whishper:开源100%本地的音频转录和字幕套件,具有完整的网页用户界面,可以将任何媒体(音频、视频等)转录成文本,支持从URL转录和上传文件转录 No 2. 神经科学和生物医学大语言模型的数据科学机遇 No 3. Edgen:本地私有的GenAI服务器,是OpenAI的替代品。不需要GPU,可以在本地运行AI模型,包括LLM(Llama2、Mistral、Mixtral等)、语音转文本(whisper)等 No 4. 'tt-zhipin - 头头直聘,仿Boss直聘实现。SpringCloud Alibaba 构建后端,React ...... No 5. Notty:开源、简约的AI笔记应用,强大的 Markdown 编辑器。特点包括:简洁易用、AI 助力、内置 Markdown 编辑器、云同步、冲突解决、本地优先和快速响应 No 6. microsearch:简单高效的Python搜索引擎,旨在提供简单易用的搜索功能,允许用户使用Python进行搜索,并提供了使用FastAPI创建应用程序以及网站的选项,以提供用户友好的体验 No 7. [CL] More Agents Is All You Need 通过简单的采样和投票方法,大型语言模型(LLM)的性能与实例化的agent数量成比例。这种方法与现有的复杂方法无关,同时增强LLM的程度与任务难度相关。通过在广泛的LLM基准测试上进行全面实验,验证了该发现,并研究了能够促进其发生的属性。 ...... No 8. OpenAI API官方教程:网站问答引擎实战 No 9. topicwizard:强大的主题模型可视化包 No 10. 早![太阳] ​ No 11. LionAGI:先进的智能agent框架,集成了数据处理和先进的机器学习工具,如大型语言模型(如OpenAI的GPT),专为以数据为中心的生产级项目设计,大大降低了创建能够理解和与大量数据进行有意义交互的智能自动化系统的门槛 No 12. awesome-generative-ai-guide:生成式AI相关资源大列表,包括相关研究、面试材料、笔记等 No 13. Web2pdf:一个命令行工具,用于将网页转换成精美格式的PDF文件,具有批量转换、自定义样式、多列支持、页码添加、目录生成等功能,还支持自定义CSS以进一步定制PDF外观,可以帮助用户轻松地将多个网页转换为PDF文件,并在格式和样式上进行灵活的调整 No 14. Redis作者antirez关于LLM的分享 No 15. 2023年最值得关注的顶级Python库 No 16. Vaibhav (VB) Srivastav总结的中国LLM/VLMM/TTS模型重要贡献: LLM/ VLM ...... No 17. '哄哄模拟器开源版 - 大模型用的是 google 的 gemini,主打一个免费(每分钟60次调用) ’ GitHub: ...... No 18. Pod-Helper:一款先进的音频处理工具,不仅可以以极快的速度转录音频,还可以利用MLM(Masked Language Model)目标进行音频修复,以确保内容保持其质量和氛围,其功能包括实时音频转录、音频损坏修复以及情感分析,帮助用户理解内容的情绪 No 19. Osam:在本地运行开源分割任何模型的工具(受Ollama启发),提供原始SAM和高效SAM等分割任何模型,本地API(CLI、Python和HTTP接口),以及自定义功能,可托管自定义视觉模型 No 20. [LG]《Generalized Preference Optimization: A Unified Approach to Offline Alignment》 No 21. 是时候承认基因不是生命蓝图了 No 22. 晚安~ [月亮] ​ No 23. Movie101:大规模中文电影理解基准,包含101部电影,配备音频描述(AD)。数据集包含30,174个解说片段,总计92小时。基准包含两个任务:电影片段解说(MCN)和时序解说定位(TNG) No 24. [CV] Memory Consolidation Enables Long-Context Video Understanding ...... No 25. [LG] Learning on Multimodal Graphs: A Survey 多模态图学习(MGL)是一个新的研究领域,通过利用多模态图中的关系表示来实现多模态数据的学习。MGL面临的主要挑战是如何有效地处理和融合多个模态的知识,并根据图的拓扑结构进行数据融合。该领域涵盖了多种图数据类型和学习技 ...... No 26. [CL]《In-Context Principle Learning from Mistakes》 No 27. [LG]《Let Your Graph Do the Talking: Encoding Structured Data for LLMs》 No 28. Character factory:用LLM(大型语言模型)和Stable Diffusion模型生成角色卡,提供了简化角色生成过程的设计,包括名称、概述、个性、问候消息和角色头像等详细信息 No 29. [LG]《An Interactive Agent Foundation Model》 No 30. 几篇论文实现代码 No 31. MetaVoice-1B:12亿参数的基础模型,经过100,000小时的语音训练,用于文本转语音(TTS)任务。其主要优先事项包括:在英语中传达情感色彩丰富的语音节奏和语调,避免幻觉;支持(跨语言)语音克隆并可进行微调;针对美国和英国的语音进行零样本克隆,只需30秒的参考音频;支持长篇合成 No 32. LongMamba:对 Mamba 上下文扩展的探索 No 33. Toolong:查看、跟踪、合并和搜索日志文件的终端应用 No 34. GOODY-2:“最负责任的AI模型”,遵循行业领先的伦理原则,确保在任何情况下都不会回答可能被视为有争议或有问题的内容,特别适合于需要高度安全性和可靠性的企业应用,如客户服务和法律支持,旨在通过其先进的技术减少品牌风险并提升用户体验 No 35. Timm model's explorer:基于Streamlit的应用,旨在为用户提供友好的界面,以浏览timm库中提供的各种模型,timm是一个非常流行的Python库,提供了超过1000种模型架构,并在Imagenet上进行了预训练 No 36. Bunny: 轻量但功能强大的多模态模型族,包括多个即插即用的视觉编码器(如EVA-CLIP、SigLIP)和语言骨干(如Phi-1.5、StableLM-2和Phi-2) No 37. 提出一种交互式agent基础模型,通过多任务训练和多模态学习,实现了高度通用的人工智能系统,可以在多个领域和任务中进行人类水平的推理和互动。//[LG]《An Interactive Agent Foundation Model》 No 38. LinGoose:用于构建出色的AI/LLM应用的Go框架 No 39. [RO] Real-World Robot Applications of Foundation Models: A ...... No 40. [RO] Dream2Real: Zero-Shot 3D Object Rearrangement with Vision-Language ...... No 41. 提出GraphToken方法,通过学习编码函数将结构化数据以图形式表示,明确表示图结构以提高大语言模型的推理能力。//[LG]《Let Your Graph Do the Talking: Encoding Structured Data for LLMs》 No 42. 月之暗面创始人杨植麟:个性化交互是AI-Native产品的核心价值 No 43. 提出广义偏好优化(GPO)框架,通过参数化离线损失函数,统一了现有的离线偏好优化算法,并揭示了离线正则化与KL散度正则化之间的差异,为对齐实践者提供了新的工具和洞见。//[LG]《Generalized Preference Optimization: A Unified Approach to Offline Alignment》 No 44. [LG]《Learning a Decision Tree Algorithm with Transformers》 No 45. MetalSplatter:在苹果平台(iOS/iPhone/iPad、macOS 和 visionOS)上用Metal渲染Gaussian Splats No 46. 2023最佳科学插图集锦 No 47. Sudo for Windows:Windows ... No 48. 通过让模型从错误中学习任务特定的“原则”,提出一种新的in-context learning方法LEAP,显著改进了模型性能,并且不需要额外的输入或示例。//[CL]《In-Context Principle Learning from Mistakes》 No 49. CatVision:开源多模态大模型,紧密模拟了GPT4V/Qwen-VL-PLUS系列模型的功能,建立在Qwen-72b-Chat的基础上,可以处理包含交错的图文输入,从Qwen72b的优势中受益,旨在有效地遵循输出格式指令 No 50. Gaia:以C++编写的物理仿真代码库,旨在提供高效且灵活的仿真解决方案,支持独立运行或作为第三方模块集成到其他应用中。它包含了一系列实用工具,如高效的三角/四面体网格数据结构、便捷的参数输入输出模块、碰撞检测器以及可扩展的虚拟物理框架,以支持各种求解器

fly51fly avatar Feb 10 '24 14:02 fly51fly