aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(9.3)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. Sapiens-Pytorch-Inference:用于Pytorch中人体基础模型推理的最小代码和示例,支持多种任务并行运行,自动下载模型,提供ONNX导出脚本 No 2. Melty:开源AI代码编辑器,专为10倍效率的工程师设计,能理解你的工作流,从终端到GitHub,协助你编写生产级别的代码 No 3. WechatFerry:基于微信的机器人底层框架,支持创建和维护微信机器人,提供灵活的API和模块化设计,便于开发者快速搭建和扩展 No 4. prof8:实验性论文写作检查工具,旨在帮助研究者优化文档写作质量,特色在于其短小精悍的规则集和与Zed AI助手的协同工作能力 No 5. [LG]《Training Ultra Long Context Language Model with Fully Pipelined Distributed Transformer》 No 6. AlphaFold3:开源实现的AlphaFold3项目,旨在推进开源生物分子结构预测,提供完整的AlphaFold3模型和训练代码,支持单链蛋白质预测,并计划增加配体、多聚体和核酸预测能力 No 7. [CL]《CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models》 No 8. 从零开始的深度学习:为深度学习爱好者提供从基础到进阶的实践教程,包括Jupyter Notebook形式的代码,支持在云平台上执行,涵盖神经网络、变分自编码器等多个深度学习主题 No 9. #免费##抽奖# 携手@图灵新知 @图灵文化 送出3本《大模型辅助软件开发》 No 10. WaloViz:开源交互式频谱图音频播放器,基于Bokeh和HoloViz堆栈构建,提供直观的音频可视化体验 No 11. [RO]《Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling》 No 12. NLP Zero to Hero:自然语言处理(NLP)领域的入门到精通教程,包含从分词器到Transformer架构的全面内容,旨在帮助学习者掌握NLP的核心概念并理解其发展脉络 No 13. Awesome-Composed-Image-Retrieval:复合式图像检索(CIR)论文集,涵盖属性驱动、监督式、少样本、零样本、半监督、对话式等多种CIR方法,以及基于草图的CIR和视频检索等 No 14. 携手@博文视点Broadview 送出3本《深度神经网络高效计算:大模型轻量化原理与关键技术》 No 15. [LG]《Beyond Preferences in AI Alignment》 No 16. Dawarich:自托管的Google位置历史记录(Google地图时间线)替代品,支持从Google地图时间线和Owntracks导入位置历史记录,查看地图上的轨迹并获取统计数据,如访问过的国家和城市数量、旅行的距离等 No 17. 早![太阳] ​ No 18. MistoControlNet-Flux-dev:专为Flux1-dev模型设计的ControlNet集合,支持各种线条草图和轮廓草图,具有双流Transformer结构,提高对齐和表现力 No 19. [LG]《Text2SQL is Not Enough: Unifying AI and Databases with TAG》 No 20. 晚安~ [月亮] ​ No 21. 提出了CLOCR-C概念,通过语言模型的补全和适应上下文的能力改进OCR质量,顶级模型使字符错误率降低60%以上,并改进了下游命名实体识别任务。 No 22. 通过序列划分、双缓冲设计以及计算与访存的精心调度,实现了transformer在资源受限环境下对超长序列的高效训练。 No 23. 今日推介(第1517期):闪电自注意力的几何学、超越偏好的人工智能对齐、通过闭环重采样改进动作分块、用全流水线分布式Transformer训练超长上下文语言模型、利用预训练语言模型进行上下文关联OCR校正 ...... No 24. QShop商城:轻量级、高性能的前后端分离电商系统,支持微信小程序,源码完全开源,适合快速搭建个性化独立商城,适用于学习与商业用途 No 25. 利用代数几何工具研究了闪电自注意力网络的几何性质,包括可识别性、维数公式、奇异点等,并对归一化自注意力提出猜想。//[LG]《Geometry of Lightning Self-Attention: Identifiability and Dimension》 No 26. HK_MEMS_Dataset:多激光雷达数据集,专注于极端环境下的SLAM研究,提供城市道路和隧道的汽车级MEMS激光雷达数据,旨在提升SLAM系统在极端环境中的鲁棒性 No 27. hf-mirror-cli:国内镜像加速下载Hugging Face模型的工具,无需配置即可快速获取海外数据集和模型,支持环境检测、网络容错、并发下载及断点续传功能 No 28. Vega:一款跨平台的视频编辑软件,支持视频、音频、图像和文本编辑,具备关键帧动画和多选功能,还拥有插件系统 No 29. ReHiFace-S:实时高保真换脸算法,开放数字人生成能力,开发者可轻松生成大规模的数字人,实现实时换脸功能 No 30. How Much VRAM:开源项目,用于估算模型训练或推理所需的内存,帮助用户决定所需硬件配置 No 31. SkyScript-100M:短剧剧本和拍摄脚本的大规模数据集,包含10亿对剧本和拍摄脚本,支持短剧视频生成和文本到视频领域的研究,推动剧本优化和视频生成技术的发展 No 32. 今日推介(第1516期):通过参与语言模型Agent对话促进人类学习、扩展基于扩散和流的XGBoost模型、大型语言模型与图机器学习的结合、通过约束松弛改进等变模型训练、用TAG统一AI和数据库 ...... No 33. Yolo_Label:用于训练神经网络YOLO的图像对象边界框标记工具,具有高灵敏度和简化的标记方法,旨在减少标记过程中的手腕疲劳 No 34. Machine Learning from Scratch:一个机器学习算法的实现项目,专注于使用numpy库从零开始构建神经网络和Transformer模型,旨在帮助理解和学习机器学习的核心概念 No 35. SeqCausal:序贯因果推断工具包,专注于简单场景下的应用,通过逐步引入特征来节约计算成本 No 36. [LG]《Scaling Up Diffusion and Flow-based XGBoost Models》 No 37. 提出表增强生成模型,通过连接语言模型和数据库引擎的能力,作为回答数据库自然语言问题的统一通用范式,并构建基准测试证明这一领域还有大量挑战需求解决。 No 38. 提出双向解码算法,通过在测试时搜索最优行动样本,实现了行动分块在一致性和重活性间的高效平衡。//[RO]《Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling》 No 39. Awesome RAG:关于大型语言模型中检索增强生成(RAG)的精选列表,包括研究论文、资源、工具和其他相关集合 No 40. supertree:交互式决策树可视化工具,支持在Jupyter Notebooks等环境中以互动方式展示决策树,具备放大缩小、展开折叠节点等功能,直观探索树结构 No 41. 欢迎收听「走近具身智能」系列节目,带你了解具身智能的精彩世界! 第四集 知识从哪里来:具身智能与表征 在线收听:http://t.cn/A6RNakqV ...... No 42. [LG]《Geometry of Lightning Self-Attention: Identifiability and Dimension》 No 43. WavTokenizer设计宽广的单层向量量化编码簿空间,配合上下文建模和逆傅里叶变换解码器,实现每秒仅需40或75个token的极致压缩,同时保持语音、音乐和音频信号的高质量重建。//[AS]《WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling》 No 44. FFmpeg Sidecar:将独立的FFmpeg二进制文件封装在直观的迭代器接口中,提供极简依赖、自动下载FFmpeg CLI(如需要)、支持Windows、MacOS和Linux,以及彻底的单元测试 No 45. TAG-Bench:AI与数据库的统一范式,用于回答数据库上的自然语言问题,通过Table-Augmented Generation(TAG)模型,探索语言模型与数据库之间的广泛交互,提供首个基准测试研究TAG问题,并验证标准方法在此类查询上的挑战性 No 46. Awesome-LVLM-Attack:针对大型视觉语言模型攻击的全面资源库,收录了相关论文、方法和资源,是研究和了解LVLMs安全威胁的重要参考 No 47. Surya:多语言文档OCR工具包,可进行准确的文本行检测,即将推出文本识别功能,以及表格和图表检测功能,可以处理各种类型的文档和多种语言 No 48. ComfyUI-DeepFuze:集成ComfyUI的先进深度学习工具,提供人脸变换、唇形同步、人脸交换、唇形翻译、视频生成和声音克隆功能,适用于内容创作者、动画师、开发者等,使用户能够通过AI驱动的特性提升视频编辑项目的质量 No 49. 多智能体客户服务系统实现,通过分离的Agent来完成复杂的任务,如用户认证、查询股票价格、查询账户余额和转账等 No 50. [CL]《Scaling Law with Learning Rate Annealing》

fly51fly avatar Sep 03 '24 15:09 fly51fly