aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(8.3)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. ONNX-SAM2-Segment-Anything:用于图像和视频分割的ONNX模型,支持通过点和掩模进行自定义标注,适用于深度学习和计算机视觉领域的研究和应用 No 2. LLMDocParser:一款利用大型语言模型(LLM)解析PDF并分析内容的工具,通过布局分析模型识别PDF页面的各个区域类型,实现更精准的文本提取和处理 No 3. ComfyUI-AdvancedLivePortrait:高级实时人像编辑工具,允许用户编辑照片中的面部表情,将面部表情插入视频,并使用多个面部表情创建动画。支持自动化安装和管理,提供工作流和样本数据,方便用户快速上手 No 4. RAG_Techniques: 先进的检索增强生成系统技术集,为研究人员和实践者提供准确、高效、内容丰富的检索增强生成系统资源,包括关键技术文档、实用实现指南和定期更新的最新进展 No 5. 掌上Linux终端:使用树莓派Zero 2W作为核心,搭载4英寸720x720 TFT显示屏的便携式Linux终端,配备原始黑莓键盘,适合黑客学习和娱乐使用 No 6. Llama Coder:开源的Claude Artifacts,通过一个提示生成小型应用,由Llama 3.1 405B驱动 No 7. 几篇论文实现代码 No 8. [LG]《Non-convolutional Graph Neural Networks》 No 9. DistillKit:开源大型语言模型蒸馏工具包,旨在提供易于使用的工具进行研究、探索和增强开源大型语言模型(LLM)蒸馏方法的应用 No 10. [LG]《Inductive or Deductive? Rethinking the Fundamental Reasoning Abilities of LLMs》 No 11. 早![太阳] No 12. [CL]《Improving Text Embeddings for Smaller Language Models Using Contrastive Fine-tuning》 No 13. GitHub Models:AI工程师的新一代工具,将行业领先的大型和小型语言模型直接带到GitHub上的超过1亿用户,让 GitHub 用户直接在平台上访问各种领先的大型语言模型和小型语言模型,包括 Llama、GPT系列、Phi等,用户可以在 playground 里免费试用这些模型 No 14. LangGraph Studio:本地原型设计和调试LangGraph应用的桌面应用程序,提供专门的Agent IDE,支持复杂Agent应用的可视化、交互和调试 No 15. Clarity:AI研究的极简网站模板,专为展示人工智能研究成果设计,具有模块化和清晰的设计,易于定制,创建简单、基于项目的个人网站 No 16. 今日推介(第1486期):非卷积图神经网络、对LLM基本推理能力的反思、迭代收敛求解不完全信息博弈的策略梯度方法、用对比微调改进较小语言模型的文本嵌入、面向基于纯视觉的GUI ...... No 17. StreamHiFiGAN音频合成助手:专为流式推理优化的HiFiGAN声码器模型,提供实时音频合成能力,适用于高效的语音合成场景 No 18. [LG]《Deep Learning for Options Trading: An End-To-End Approach》 No 19. Cardie:开源名片设计与分享平台,支持无限创建个人或商务名片,提供链接或二维码分享,可打印并保存他人名片至虚拟钱包,同时提供访问分析数据,支持名片编辑和隐私设置 No 20. Grounded SAM 2:结合Grounding DINO和SAM 2的多任务视觉模型,用于图像和视频的开放世界目标检测与跟踪,简化代码实现,增强用户便利性 No 21. #免费##抽奖# 携手@博文视点Broadview 送出3本《AI for Science:人工智能驱动科学创新》 No 22. [CV]《OmniParser for Pure Vision Based GUI Agent》 No 23. [LG]《A Policy-Gradient Approach to Solving Imperfect-Information Games with Iterate Convergence》 No 24. 受Google TPU启发的极简张量处理单元,为深度学习任务优化矩阵乘法操作,提供硬件设计和AI加速的入门指南 No 25. LlamaVoice:基于Llama的大规模语音生成模型,提供推理和训练能力,采用直接预测连续特征的新颖方法,与传统依赖向量量化的离散语音代码预测模型相比,提供了更流畅高效的处理过程 No 26. Prompt Poet:低代码方式简化和优化AI模型交互提示设计的工具,支持开发者和非技术用户,使用YAML和Jinja2混合技术实现灵活、动态的提示创建,提高效率和交互质量 No 27. [CL] A Comprehensive Survey of LLM Alignment Techniques: RLHF, ...... No 28. 爱可可AI前沿快报 Vol.32 网页链接做快报的一大初衷,是让青少年多接触一些一手的前沿技术信息,少一些二手的浮夸和危言耸听,用孩子们听得懂的语言让他们学会独立思考、尽早形成成自己的科研品味。 No 29. NotShazam:基于Shazam音乐识别算法的实现,集成Spotify和YouTube API进行音乐搜索和下载,支持音频指纹匹配技术 No 30. 自制YouTube视频摘要生成器:利用大型语言模型(LLM)和Python的yt-dlp工具,创建一个实用工具,自动从YouTube视频字幕中提取关键点和见解,帮助用户快速掌握视频内容,无需观看整个视频 No 31. 通过设计明确区分归纳和演绎的实验设置并提出SolverLearner框架,发现语言模型存在非直觉的强大归纳推理能力但较弱的演绎推理能力,尤其是在非典型任务上,提供了探索语言模型推理能力新的视角。//[LG]《Inductive or Deductive? Rethinking the Fundamental Reasoning Abilities of LLMs》 No 32. SegDrawer:支持语义分割和视频分割的简单静态网页绘图工具,采用交互式Segment Anything Model 2 (SAM2) No 33. EleutherAI稀疏自编码器解释器:提供生成和评分稀疏自编码器(SAE)特征文本解释的工具库,支持本地运行或通过OpenRouter API调用,适用于文本解释和特征评分 No 34. OpenSearch GPT:个性化AI搜索引擎,随着您浏览网页而学习您的喜好和兴趣,类似于Perplexity/SearchGPT克隆版,但专为您定制 No 35. AI路由聊天助手:利用高级大型语言模型路由技术的AI聊天应用,支持动态改进模型路由的'竞技场模式' No 36. 晚安~ [月亮] No 37. 通过RNN将随机游走的拓扑和语义特征统一在一起,设计出一种高效、可扩展、表达能力强的非卷积图神经网络RUM。//[LG]《Non-convolutional Graph Neural Networks》 No 38. 通过引入轨迹Q值、双稀释正则化和学习率增加策略,设计了第一个可以从随机轨迹迭代收敛到EFG正则化纳什均衡的策略梯度算法QFR。//[LG]《A Policy-Gradient Approach to Solving Imperfect-Information Games with Iterate Convergence》 No 39. Agent Zero AI框架:一款动态、有机成长和学习的个人AI助手,完全透明、可读、可理解、可定制和互动 No 40. 通过视觉模型微调实现用户界面元素检测与语义理解,将解析结果集成到GPT-4V中,在多个基准测试上验证了该方法对提升GPT-4V作为通用UI Agent的效果。//[CV]《OmniParser for Pure Vision Based GUI Agent》 No 41. FlashAttention2自定义掩码实现:支持自定义掩码的深度学习注意力机制优化工具,为提高语言模型效率提供了分支逻辑外的灵活解决方案,增强了模型的内存效率和计算性能 No 42. Vol.33 网页链接//爱可可AI前沿快报 Vol.32 网页链接做快报的一大初衷,是让青少年多接触一些一手的前沿技术信息,少一些二手的浮夸和危言耸听,用孩子们听得懂的语言让他们学会独立思考、尽早形成成自己的科研品味。 No 43. 本文通过对比微调的方式,显著提高了小型语言模型MiniCPM的文本嵌入质量,为小型语言模型的应用提供了有效途径。//[CL]《Improving Text Embeddings for Smaller Language Models Using Contrastive Fine-tuning》 No 44. 由北邮老师团队为青少年精心打造的免费AI通识课《AI在大前》 No 45. zerox:使用gpt-4o-mini实现零样本PDF文档的OCR转换,为AI处理提供简洁的Markdown格式输出,优化了文档的视觉呈现和信息提取 No 46. 蚂蚁多模态框架:Ant Group多模态认知团队的研究成果集成,提供数据集管理、数据处理、训练流程、模型和模块的标准化多模态功能,支持自定义扩展 No 47. 《使命召唤:战区》Caldera数据集:开放源码的3D场景数据集,用于研究和分析环境几何结构,不包含实际生产数据,专注于空间元素间的关系而非精确的视觉呈现 No 48. [LG]《MoMa: Efficient Early-Fusion Pre-training with Mixture of Modality-Aware Experts》 No 49. 'Llama3、Llama3.1 中文仓库 - 聚合资料,网友及厂商微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 ...... No 50. FLUX.1模型官方推理库:用于运行文本到图像和图像到图像的深度学习模型,由Black Forest Labs提供,支持使用Replicate和FAL服务进行模型采样

fly51fly avatar Aug 03 '24 14:08 fly51fly