爱可可微博热门分享(2.22)
No 1. Sora物理悖谬的几何解释 No 2. Google发布开放大语言模型Gemma No 3. '收集C/C++新手学习的入门项目,整理收纳开发者开源的小项目、工具、框架、游戏等,视频,书籍,面试题/算法题,技术文章。' ...... No 4. 中国科研常用LaTeX模板集:整理中国科研常用的LaTeX模板的资源集合,包括国家自然科学基金的正文模板、毕业论文等 No 5. [CL] A Survey on Knowledge Distillation of Large Language Models ...... No 6. AI硬件初创公司Groq:推理性能突破与成本权衡 No 7. 2023年终大放送 之 TOP50开源项目榜:No. 1 ChatGPT 中文指南,指令指南,精选资源清单,更好的使用 ...... No 8. SoraWebui:一个开源项目,允许用户使用 OpenAI 的 Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能 No 9. Home: Tech Report: HuggingFace: Demo: No 10. Library of Phi:Phi图书馆,旨在使高质量教材普及化。利用人工智能方法,处理MIT开放式课程网站等公开课程大纲,并将检索增强生成技术(RAG)应用于WIKI,以尽可能让教材基于事实,所有教材均使用GPT-3.5和GPT-4生成 No 11. GPT-4揭秘(外部视角) No 12. gemma.cpp:轻量、独立的 C++ 推理引擎,用于 Google Gemma 基础模型 No 13. GodSVG:用于编辑可伸缩矢量图形(SVG)文件的工具。与其他编辑器不同,它直接表示SVG代码,不添加任何元数据,并允许实时编辑SVG代码。其主要特色在于实时交互式SVG编辑,优化的SVG输出以及移动设备可访问性 No 14. chatpdf-yt:全栈PDF问答机器人应用,使用OpenAI API根据聊天上下文生成响应 No 15. libLLM: 专为在普通个人电脑和移动设备上高效推理大型语言模型(LLM)而设计的开源项目 No 16. 'Sora.FM - Sora AI Video Generator by Sora.FM' GitHub: github.com/all-in-aigc/sorafm ...... No 17. [CL]《Instruction-tuned Language Models are Better Knowledge Learners》 No 18. 早![太阳] No 19. '微信机器人 - 微信机器人是一个创新的基于Python 3.11开发的项目,通过结合ChatGPT模型和微信原生API,为用户提供智能聊天、自动绘画、自动发朋友圈、自动发视频号等多样的API集成服务,旨在提升日常沟通效率和趣味性' ...... No 20. 好久不做Python编程选择题了,今天来一道非常基础的哈~ 爱可可-爱生活的微博... No 21. [LG]《Neural Network Diffusion》 No 22. 晚安~ [月亮] No 23. WikiLLM:利用算法如MEMIT将事实注入LLM中,通过用户互动实时更新神经知识库 No 24. 复杂代码库(120K-token file)上的GPT-4 and Gemini 1.5比较 No 25. [CV] How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: ...... No 26. Transformer Lab:大型语言模型实验室应用,支持以下特性:下载数百种流行模型;通过聊天或完成与模型交互;使用数据集库或您自己的数据对模型进行微调;评估模型;通过 REST API 访问所有功能;通过简单的跨平台 GUI 来完成以上所有操作 No 27. GPTFast:将Hugging Face Transformers 加速6-7倍的工具 No 28. [CL] Benchmarking Retrieval-Augmented Generation for Medicine ...... No 29. [CV] VideoPrism: A Foundational Visual Encoder for Video Understanding ...... No 30. Hugging Face Space开放创建Jupyterlab实例,CPU(2vCPU/16GB)免费,GPU收费 No 31. 提出预指令微调(PIT),通过颠覆传统的训练顺序,先对问题-答案对进行指令微调再对文档进行预训练,显著提升了大型语言模型吸收新文档知识的能力,解决了即使文档困惑度最小化后仍难以提取知识的“困惑度诅咒”问题,为持续更新LLM的知识库提供了新的视角。//[CL]《Instruction-tuned Language Models are Better Knowledge Learners》 No 32. 几篇论文实现代码 No 33. 从零开始构建扩散模型理论 No 34. 大型语言模型知识蒸馏相关文献资源列表 No 35. [CL]《Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models》 No 36. 提出了一种基于扩散模型的神经网络参数生成方法,通过自编码器和潜扩散模型学习高性能参数分布,能在数秒内生成与训练模型性能相当或更优的新模型参数,创新之处在于将扩散模型的能力扩展到了神经网络的参数生成领域,突破了扩散模型在视觉生成上的应用限制。//[LG]《Neural Network Diffusion》 No 37. 今日推介(第1323期):神经网络扩散、指令调优语言模型是更好的知识学习器、基于扩散的文本到语音模型的语义潜空间研究、语言模型的通用指令微调、预训练数据中的并行结构是上下文学习能力的重要来源 ...... No 38. AutoPrompt:一个提示优化框架,旨在增强和完善提示,以适应实际应用场景。该框架自动生成高质量、详细的提示,通过迭代构建具有挑战性的边界案例数据集,并进行优化。AutoPrompt不仅减少了提示工程的手动工作量,还有效解决了常见问题,如提示敏感性和内在提示模糊性 No 39. Streamline Analyst: 由大型语言模型驱动的先进开源应用,旨在彻底改变数据分析方式,能自动完成诸如数据清洗、预处理以及识别目标对象、划分测试集、选择最适合数据的模型等任务,并提供无缝的结果可视化和评估 No 40. ChatCell:旨在利用自然语言促进单细胞分析,利用Cell2Sentence技术获取细胞语言标记,特色包括基于T5的预训练模型、单细胞任务处理、药物敏感性预测等 No 41. [LG] Generative AI Security: Challenges and Countermeasures ...... No 42. 可视化交互式布隆过滤器介绍 No 43. Mistral Cookbook:Mistral应用方案手册 No 44. MLX-graphs:基于苹果MLX构建的图神经网络(GNN)库,提供快速的GNN训练和推理功能 No 45. GLAN是一种新的大型语言模型指令微调方法,通过半自动构建人类知识和能力的分类体系并生成覆盖各学科的大规模合成指令数据,提高模型在多个领域的泛化能力和性能,其优势在于不依赖特定任务数据,通用性强,且易于定制和扩展。//[CL]《Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models》 No 46. LlamaParse:由LlamaIndex开发的API,用于高效解析和表示文件,以便利用LlamaIndex框架进行高效检索和上下文增强,目前只支持PDF文档 No 47. NAVIX: JAX 中的 minigrid,支持 Autograd 和 XLA,速度提升了 1000 倍 No 48. HexWalk - Hex Editor/Viewer/Analyzer:支持跨平台的十六进制编辑器、查看器和分析器,支持高级搜索、Binwalk集成、熵分析、字节地图、哈希计算器、二进制/十进制/十六进制转换等 No 49. 那些第一次离今天有多远: 第一条 Sora 视频:2 天 第一次 ChatGPT 聊天:1 年 第一条 TikTok 视频:7 ...... No 50. Vespa发布原生ColBERT嵌入器组件