aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(7.1)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. 《大厂AI实践》 No 2. 程序员的大脑：旨在通过认知科学的角度，教授程序员如何更高效地学习和思考代码，提升编程技能 No 3. 什么是Agent No 4. MIT机器人专家Rodney Brooks认为人们严重高估了生成式AI No 5. 网球分析助手：基于YOLO和CNN的网球视频分析工具，可测量球员速度、击球速度和击球次数，适用于提升机器学习和计算机视觉技能 No 6. StableFace：基于 Stable Diff... No 7. 有人完全用Stable Diffusion制作的漫画：用SD1.5完成，model为iComix，在提示中混合著名演员以保持人脸一致，用ControlNet Reference实现服装一致，用ControlNet OpenPose控制姿态 No 8. 关于 WiFi 信道状态信息（CSI）感知技术的精... No 9. RAG检索用嵌入模型微调：针对特定领域数据优化的嵌入模型，显著提升检索性能，适用于金融领域的RAG应用 No 10. Free GPT 3.5 API：一个免费的GPT 3.5模型API服务，支持多种授权方式，简化了API接口的调用和部署过程 No 11. gptpdf: 用GPT解析PDF的自动化工具，将PDF内容转换为Markdown格式，支持排版、数学公式、表格、图片和图表的完美解析，每页平均价格0.013美元 No 12. 智谱AI实时语音转文字助手：结合流式大型语言模型和GPT-SOVITS，通过网页实现跨网络服务调用，支持实时对话功能 No 13. Arcee Spark：一款具有 70 亿参数的高性能语言模型，通过从 Qwen2 初始化并采用精细化的训练过程，包括微调、合并和直接偏好优化（DPO），在 MT-Bench 等基准测试中表现出色，在同类模型中获得最高分数，甚至在多项任务上超过了 GPT-3.5 No 14. 实时语音AI助手：快速响应语音查询的智能Agent，能够在大约500毫秒内以语音形式回答问题，具有高度灵活性，支持任意大型语言模型、文本到语音(TTS)和语音到文本(STT)模型的替换使用，适用于客户服务机器人、接待员等多种场景 No 15. Eidolon：开源智能Agent服务框架，简化智能Agent的设计和部署，支持模块化组件定制和升级，无厂商锁定，适应快速变化的AI领域 No 16. GeoSpy：基于AI的地理定位工具，揭示照片拍摄地点，由Graylark提供技术支持，支持Python语言开发 No 17. Bora：生物医学通用视频生成模型，专为文本引导的生物医学视频生成设计，可提高医学教育、机器人辅助手术和医学AI开发的数据增强 No 18. 360LayoutAnalysis：文档版式分析模型和数据集，专注于自动化文档处理和信息提取 No 19. #免费##抽奖# 携手@异步图书送出3本《Python极客项目编程(第2版)》 No 20. #免费##抽奖# 携手@图灵新知 @图灵文化送出3本《CPython设计与实现》 No 21. 看图学大模型：以图解形式介绍大型语言模型技术，帮助读者快速理解复杂概念，适合初学者和专业人士 No 22. 几篇论文实现代码 No 23. #抽奖##赠书# 携手@博文视点Broadview 送出3本《高效深度学习：模型压缩与设计（全彩）》 No 24. ScreenPipe：将屏幕内容转化为行动的智能工具，利用大型语言模型（LLM）进行屏幕内容分析与操作，灵感来源于adept.ai、rewind.ai和Apple Shortcut，采用Rust + WASM技术实现 No 25. [CL] Large Language Models Assume People are More Rational than ...... No 26. [CL] LLMs' Classification Performance is Overclaimed 通过移除分类任务中的金标准标签，设计OMNIACCURACY指标，发现当前大语言模型的分类性能被高估，仍存在理解任务本质的局限性。 ...... No 27. 集成实时网页浏览功能的 GPT-4：结合先进语言处理与互联网的实时数据检索，实现高效信息获取，适用于搜索引擎和问答系统 No 28. 通过变分顺序Monte Carlo方法拟合低秩RNN，提出一种从神经数据中推断出可解释低维度动力学模型的有效方案。//[LG]《Inferring stochastic low-rank recurrent neural networks from neural data》 No 29. AI文本到视频模型：从零开始使用Python搭建小型AI视频生成模型，输入文本提示即可生成相应视频，涵盖理论概念理解到架构编码及最终结果生成全过程 No 30. Agentic LLM漏洞扫描器：开源的大型语言模型(LLM)安全扫描工具，提供定制化规则集和基于Agent的攻击测试，全面模糊测试任何LLM，集成LLM API并进行压力测试，支持广泛的模糊测试和攻击技术 No 31. QuPath：Segment Anything Model（SAM）的深度学习模型扩展，用于细胞图像分割，支持稀疏注释训练，提高细胞图像分析的效率 No 32. [LG] SAIL: Self-Improving Efficient Online Alignment of Large ...... No 33. unet.cu：基于纯CUDA的UNet扩散模型，优化图像合成性能，实现与PyTorch相当的训练速度 No 34. portBLAS：基于SYCL开放标准的BLAS实现，为高性能计算提供现代化的C++实现 No 35. Mako: 基于Rust的极速生产级Web打包器，适用于Web应用、混合应用、小程序（部分）、低代码、无服务器等场景 No 36. jing332/tts-server-android：Android系统TTS应用，支持自定义HTTP请求和多种本地TTS引擎，具备中文双引号旁白/对话识别朗读功能，以及自动重试、备用配置和文本替换等高级功能 No 37. 利用多模态大型语言模型进行虚假信息研究的论文列表，为信息/特征提供者、数据生成器和分析器 No 38. Open-Sora：完全开源的高效复现类Sora视频生成方案，不仅实现了先进视频生成技术的低成本普及，还提供了一个精简且用户友好的方案，简化了视频制作的复杂性 No 39. [CL]《From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models》 No 40. Docker for Robotics：机器人操作系统(ROS/ROS 2)与Docker集成的最佳实践指南，提供Linux和Windows操作系统上的开发建议，涵盖图形用户界面显示、硬件操作、实时代码能力以及多机器网络设置。同时提供Visual Studio Code的容器设置指导 No 41. [RO]《Dreamitate: Real-World Visuomotor Policy Learning via Video Generation》 No 42. 晚安～ [月亮] No 43. 早！[太阳] No 44. TexPainter：多视角一致性的生成式网格纹理工具，基于预训练扩散模型的潜空间进行优化，以改善生成纹理的一致性和整体质量 No 45. 用Rust和Ratatui库构建的神经网络学习玩贪吃蛇游戏，支持自定义训练和可视化展示 No 46. cz-blog个人博客系统：基于SpringBoot + Thymeleaf + Vue开发的全栈博客平台，提供自适应的前端界面和后台管理功能，适用于毕设、实习和个人学习项目 No 47. SpeechLLM：多模态语言模型，专为分析和预测对话中说话人环节的元数据而训练，集成了语音编码器，将语音信号转换为有意义的语音表示，结合文本指令由语言模型进行处理以生成预测 No 48. ComfyUI Photoshop插件：集成AI生成功能，提升Photoshop图像编辑体验，支持一键式图像艺术化转换，简化操作流程，增强性能 No 49. Ideogram Upscale：AI驱动的图像增强工具，利用先进细节和逼真度提升每个像素，提高图像分辨率 No 50. [LG]《Efficient Evolutionary Search Over Chemical Space with Large Language Models》

Jul 01 '24 14:07 fly51fly