type
status
date
slug
summary
tags
category
comment
icon
password
这是豌豆花下猫的周刊合集,对我特别有价值,现转载如下。文尾有打包文件。
Python 潮流周刊#91:Python 在浏览器中的未来
本期分享了 12 篇文章,12 个开源项目,全文 1494 字。
🦄文章&教程
探讨了 Python 在浏览器中的未来,介绍了 SPy 实现的高性能 Python 编程。SPy 作为一种新兴的“Python-like”语言,通过将代码分为编译时执行的“蓝代码”和运行时执行的“红代码”,实现了代码的高效编译和执行。
SPy 作者与另外两位社区大佬的一周合作/游玩经历,分享了他们一起解决的几个问题、SPy 基本概念和设计决策、搭建一个简单的 SPy 游乐场。特别强调了人际关系的价值和共度时光的乐趣。
深入剖析了 FastAPI 的架构和核心组件,解读了 FastAPI 如何通过 ASGI 协议、Uvicorn 服务器、Starlette 框架以及 Pydantic 数据验证库协同工作,展示了依赖注入和自动生成文档等特性。
Flask-SQLAlchemy 使得 Flask 能无缝集成 SQLAlchemy,文章详细介绍了它的多项关键特性,以实际项目演示了 Flask-SQLAlchemy 轻松管理数据库的使用方法。
如何高效使用和存储文本嵌入向量?文章提出了用 Parquet 文件格式和 Polars 库的解决方案,可快速加载嵌入向量并进行相似性计算,同时支持动态过滤和元数据管理。
Python 的类型提示有什么价值?除了会增加代码复杂性,它能带来足够多的好处么?文章从多个角度展示了类型提示的优势,介绍了如何有效使用类型提示的一些技巧,以及使用现代工具提升开发体验。
Python 生态中有不少的 GUI 库,哪个更适合你的项目呢?文章对比了多款主流 GUI 库(Tkinter、PyQt、PySide、Kivy、PySimpleGUI、WxPython、PyGObject、Remi 等),介绍了它们的相对优势和许可限制,并用每个库编写简单的“Hello World”项目。
Notebook Intelligence 是一个 AI 编码助手和可扩展的 AI 框架,将 JupyterLab 与 AI 结合。文章介绍了如何定义多个工具(如地理坐标查询、地图生成、笔记本创建和分享)来构建一个 AI 代理。
文章介绍了如何在 macOS 上运行本地大模型,利用了 llm-mlx 插件和苹果的 MLX 框架,演示了安装插件、下载模型和用大模型生成文本,同时作模型优化和缓存的技巧。
CUDA 是一个平台和 C++ 扩展,可编写在 GPU 上运行的程序。文章探讨了 CUDA 内核的工作原理,以及它是如何将计算映射到 GPU 硬件上的。

11、日常 API 的设计原则
如何设计一个用户体验出色的 API?文章提出了几项基本原则,并通过一个发布/订阅服务的 API 设计,展示了如何通过命名规范、提供对称方法、默认值、减少重复和利用语言特性等手段,优化用户体验。
12、丑陋的代码和愚蠢的事情
在追求代码完美和快速交付之间,如何作出选择和平衡?作者通过自身经历和对 Flickr 的 Flamework 框架的分析,揭示出有时候快速迭代和解决实际问题往往比代码的优雅性更重要。
🐿️项目&资源
一个周末项目,支持将作者发明的“wend”编程语言翻译成 GNU 汇编。
100% 兼容的渲染输出,错误报告跟 Django 的错误一样有用,性能优于纯 Python 实现的版本。
将某地时间转换为其它地方/时区的时间,另外可以显示当前月相、显示满月日期、计算过去或未来时间等。
一款命令行工具,可通过 Wi-Fi 在设备间共享文件,独特之处在于它与 Apple AirDrop 兼容,支持与运行 iOS 和 macOS 的 Apple 设备共享文件。(star 8.9K)
以 FastAPI 作后端,Streamlit 作前端,支持将图片(JPG、PNG)转换为 PDF,反之也行,还支持将多张图片和多个 PDF 生成一个 PDF。
编写能够转换代码的代码。结合了 Tree-sitter 的解析能力与 rustworkx 的图算法,实现了大规模、多语言代码操作的脚本化能力。
利用大模型,从不同类型的文档中提取出核心概念、关系和细节,并将它们组织成直观的、分层的思维导图。
一款结合电子表格功能与 Python 数据分析能力的 AI 应用,支持公式、在浏览器中运行 Python 代码、数据可视化、AI 智能提示和自动化分析。
开源的 GPU 集群管理器,广泛兼容多种硬件和模型,轻松扩展 GPU 或节点,分布式推理,多种推理后端,用户和 API 密钥管理,GPU 性能和利用率监控,Token 使用和速率分析。(star 1.8K)
100 行代码实现的极简 LLM 框架,支持多代理、工作流和 RAG 等。
Huggingface 开源,仅用几行代码即可运行强大的代理,支持任意 LLM,支持文本、视觉甚至音频输入。(star 12.8K)
AI 代理优于传统 LLM,这是一份 awesome AI 代理资源列表。
Python 潮流周刊#92:一张 Python 软件包的地图
你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。周刊开源在 Github 上,喜欢请给颗小星星支持下~
本期分享了 12 篇文章,12 个开源项目,全文 1375 字。
🦄文章&教程
PyPI 上有超过 50 万个开源项目,作者通过它提供的 JSON API 和 BigQuery 数据集,生成了一份交互式的包依赖关系图,发现了一些有趣的现象。

Python pickle 模块存在什么安全问题?文章介绍了 pickle 的工作原理,演示了如何利用它的反序列化功能实现远程代码执行(RCE),提醒大家对不可信来源数据作反序列化的安全处理方法。
Django 信号是一种将应用逻辑与处理事件解耦的强大机制,文章探讨了 Django 信号的结构和工作原理,介绍了其应用场景,并分享了它们的几条最佳实践。
文章总结 Python 3.13 版本带来的一些重大突破:性能提升(比 3.12 快 5-15%)、实验性 JIT 编译器、内存占用减少 7%、数据科学优化、支持 iOS 和无 GIL 模式。
这则 PEP 提出从 Python 3.14 开始,构建 CPython 时将不再支持不包含 zlib 压缩库的情况,zlib 模块将成为标准库的必需部分,唯一的例外是 WASI 平台。
哪些将 Python 作为第二语言的开发者可能存在哪些误解?作者对比了 Python 与 Java/C++ 的差异,列举出了多个易混淆的点和示例,探讨如何帮助有其它语言背景的开发者更好地理解和使用 Python。
如何用 Python 开发一个待办事项应用?文章演示了用 Kivy + SQLite 开发一个图形化用户界面的待办应用,可作为 Python GUI 入门项目学习。

文章介绍了如何用 marimo 和 anywidget 开发一个交互式进程树可视化工具,基于进程创建事件日志构建出树结构,并通过 DependenTree 作可视化渲染。
介绍了如何在 Elixir 中嵌入 Python 解释器,通过 Pythonx 实现 Elixir 和 Python 之间的自动数据转换、代码执行和虚拟环境管理。
介绍了 Satellogic 的开放卫星数据源“Satellogic EarthView”,展示了如何使用多种工具(如 GDAL、Python、DuckDB 和 QGIS)来分析和可视化这些数据。
这是一篇为 Rails 开发者提供的转向 Django 的实用指南,对比了 Django 和 Ruby on Rails 在开发上的异同,包括语言特性和运行时管理、依赖管理、迁移机制、Postgres 配置、代码格式化和 Linting 等。
作者在将 Vision Transformer(ViT)模型从 PyTorch 转换为 TensorRT 时遇到了编译问题,文章展示了如何系统地调试和优化深度学习模型,例如通过二分法逐步排查问题和对比不同实现方案的性能。
🐿️项目&资源
719 种独特的宝可梦主题,可设为桌面壁纸和终端背景,终端包括 iTerm2、ConEmu、Terminology、Windows Terminal、Tilix 和 Kitty 等。(star 4.6K)
DeepSeek 开源的数据处理框架,基于 DuckDB,可扩展处理 PB 级别数据集。(star 3.9K)
一个自托管的 GitHub 应用,可监听 PR 事件,扫描恶意代码,并在 PR 上直接评论检测结果。
通过轮换用户代理、设置 referer、处理 Cookie、管理代理和实现重试逻辑来模拟真实的用户行为。
将任意 Python 函数变成支持 WebRTC 或 WebSockets 的实时音视频流。(star 2.6K)
一个专门用于图像秘密共享(Visual Secret Sharing, VSS)的工具包,支持视觉密码学(VC)和随机网格(Random Grid, RG)技术。
收录了一系列可执行的 demo,展示了流处理在实际场景中的应用。
将你的公司文档、应用和团队人员连接起来的 AI 平台。功能丰富的聊天界面,支持超过 40 种应用的知识同步及访问控制。(star 12.2K)
一个视频到音频生成框架,能够生成与视频语义相关且同步的逼真音效。
使用 Windows COM 自动化与 Microsoft Office(Word、Excel)、图片及文件系统接口,适合用于探索 AI 驱动桌面自动化。
端到端的机器学习框架,包括加载和转换数据、构建和训练模型、后处理模型输出以及评估模型性能,支持各种时间序列学习任务,包括预测、异常检测和单变量和多变量时间序列的变化点检测。(star 4.2K)
这个仓库收集了很多开发者的作品集主页,可以从别人的主页&作品中获取产品灵感。(star 11.9K)
Python 潮流周刊#93:为什么“if not list”比len()快2倍?
本期分享了 12 篇文章,12 个开源项目,全文 1431 字。
🦄文章&教程
Python 检查列表是否为空,if not mylist 比 if len(mylist) == 0 更优雅,也更快。文章通过剖析 CPython 的虚拟机指令和对象内存访问模式,解答了为何前者会更快。(注:该文出自付费专栏,前半部分免费可看)
介绍了用 uv 和 Dagger 来构建高效的 Python 单体仓库的方法。uv 管理依赖和工作区,Dagger 定义容器化构建流程,实现了高效的模块化构建和缓存复用。
最近,Python 3.14 的尾调用解释器很夺人眼球(性能提升 10-15%),但是,作者经过分析发现,这些提升主要是无意中绕过了 LLVM 19 的一个回归问题,在更合理的基线下,性能提升仅为 1-5%。
在引入尾调用之前,CPython 有三个不同的解释器:基于 switch 的字节码解释器、基于计算的 goto 语句的字节码解释器、以及微操作解释器。文章介绍了此前解释器的问题,以及新解释器的优化实现方案。
LinkedIn 从大约一年前每日发布“Queens”谜题,作者分享了自己编写的 Python 程序,可解决 LinkedIn 发布的所有皇后谜题。
作者认为:在 Python 中,你不需要 Singleton;如果需要,就用模块级别的变量。文章指出了几种流行的单例实现方式的问题,最后给出了一种“朴实无华”的方案。
介绍了一种不依赖复杂可视化库创建静态地图的方法:从 OpenStreetMap 下载地图,将经纬度坐标转换为像素坐标,最后在地图上绘制彩色标记。
PEP-703 中描述了自由线程 Python 的三个发展阶段,本则 PEP 是为过渡到第二阶段而确立明确的期望和要求,包括性能、稳定性、可维护性和内存使用等方面的评估标准。
Python for 循环中可以用 break 语句跳出循环,作者建议我们可以根据不同的目的,使用其它的替代实现,包括用 in 操作符、用 any() 函数、用 next()、用 itertools.takewhile()。
Python 核心开发者 Victor Stinner 在 2 月份有 18 个提交被合入,文章对这些代码贡献做了总结记录。
许多大投资银行在使用 Python 的哪些软件?文章介绍了“Bank Python”的多个核心子系统:Barbara 对象键值存储、Dagger 依赖管理、Walpole 银行级作业调度、MnTable 专有表格处理。
作者想要回答这个问题:如果需要存储所有的值,为什么还要用生成器写法?通过博客侧边栏的标签和年份交错排列实现,介绍了生成器的灵活运用和不同实现方式的权衡。
🐿️项目&资源
自托管的新闻阅读器,支持 Feed 管理、自动打标签、基于标签的规则评分、过滤和排序。

旨在将 OpenAPI 规范扩展为适用于 AI agent 与 API 交互的 agents.json 标准,通过定义清晰的 API 调用流程和数据交互方式,帮助 AI agent 更高效地执行多步任务。
控制汽车的油门、刹车、转向等,读取速度、转向角度等。(star 2.2K)
零依赖 Webdriver,原生验证码绕过(Cloudflare Turnstile 和 reCAPTCHA v3 *),模拟现实人类的交互行为,支持高级和响应式自动化。(star 2.6K)
自动化创作短视频,无缝集成 Discord 等服务的通知功能,GPU 加速处理,模块化设计。
支持零样本语音转换、零样本实时语音转换和零样本歌声转换。无需任何训练,只需 1~30 秒的参考语音,即可克隆声音。(star 1.7K)
肖像动画领域的一大创新,强调全局音频感知,通过多模态融合实现高保真音频驱动的肖像动画生成。(star 2.1K)
微软新发布的连接到 SQL Server 和 Azure SQL 的驱动库,使用 DDBC,可直接连接到 SQL Server 而无需外部驱动管理器。
与 Manus、Computer Use Agent(CUA)和 Omniparser 一样,AI 驱动的自动化工具。无代码自动化、全界面操控、本地化部署。(star 1.9K)
深入分析 Linux 系统的性能问题,通过 eBPF 技术对系统内部运行状态的作实时观测和诊断。(star 1.5K)(分享自@请叫我大萌萌)
将人工智能运用到地理空间数据分析与可视化,关键特性:高级地理数据可视化、数据准备与处理、图像分割、图像分类。
探索生成高质量古典乐谱的潜力,在 160 万首音乐上预训练,使用 9K 首古典作品进行微调,使用 CLaMP-DPO 方法作强化学习。
Python 潮流周刊#94:如何解决 FastAPI 的大文件传输问题?
你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。周刊开源在 Github 上,喜欢请给颗小星星支持下~
本期分享了 11 篇文章,12 个开源项目,全文 1514 字。
重要提示:本周刊即将迎来第 100 期,即日起续订或新订阅,可享受八五折优惠,欢迎领取优惠券 --> https://www.xiaobot.net/coupon/d2c69b05-91b8-4e2b-b346-e7bc4dbc141a
🦄文章&教程
使用 FastAPI/Starlette 作大文件传输时,为何会比其它框架慢?在文件上传和下载场景中,作者分别对比了不同实现方案的性能差异,剖析了问题原因,并分享了多种性能优化方案。

Python 写起来很棒,但维护起来可能令人沮丧。文章分析了 Python 让人感觉痛苦的一些原因,比如不同编程文化碰撞和包依赖管理,最后分享提升可维护性的建议。
Python Discord 社区 2024 年的调查结果,涵盖用户编程经验、社区参与度、学习资源使用、帮助寻求与提供、社区活动体验、语音频道使用、开源贡献意向等方面。
Ruff 和 uv 所属团队正在开发一个 Python 类型检查器,旨在成为 mypy 的替代。文章介绍了 Red Knot 的安装、配置和使用方法,并通过与 mypy 的比较和性能测试,展示了其在速度上的显著优势。
针对 Django Admin 在处理大数据集时的性能问题,文章介绍了多种优化策略:限制排序字段、调整分页大小、使用估算计数、缓存、优化搜索字段等。
PEP-776 提议在 Python 3.14 将 Emscripten 添加为 Tier 3 支持。Emscripten 是一个编译器工具链,可将 C/C++ 代码编译为 WebAssembly/JavaScript,适用于浏览器和 Node.js 等 JavaScript 运行时。
文章提出了一种基于双向生成器的二分查找实现,利用 Python 生成器的 send 方法来动态调整算法行为。该方法可扩展成无届搜索,提供了新的实现思路。
作者指出在函数或 API 中使用布尔参数容易引发问题,如代码可读性差、扩展性受限及潜在错误,建议使用枚举作为替代方案。
Marimo 是一种新型的 notebook,不同于传统的 Jupyter notebook,它保存的是 Python 文件,解决了版本控制、代码复用和测试等痛点,同时支持导入和作为脚本执行等用途。
用代码编程与用毛线编织,它们能有什么关系呢?除了需要耐心、逻辑和创造力,文章还分享了几组有趣的对照关系。
11、“主动型枚举”模式
文章指出传统的枚举存在维护困难、行为与数据分离等问题,因此提出了“Active Enum”模式,使枚举不仅作为数据容器,还能主动执行相关操作。演示了具体代码示例,揭示了它的优势、可能遇到的问题和对应的解决方案。
🐿️项目&资源
用 Django 和 React 开发的协作式文档编辑器,是 Notion、Outline 与 Confluence 的开源替代。(star 8.9K)

MCP(Model Context Protocol)中间件,用于开发高精度的垂直人工智能 agent。
纯 Python 实现的事件驱动框架,功能特性:事件驱动、事件溯源、基于 Tick 的系统、高级事件查询、开箱即用的示例、类型安全。
纯 Python 实现的 HTML 解析库,符合 WHATWG HTML 规范。(star 1.2K)
一个在线执行 Python 脚本的网站,提供了浏览器中的 Python 编译器和 IDE,内置了常用的 Python 库,支持文件上传下载。
将 SQL 关系型数据高效转化为知识图谱,通过 Rust 实现底层高性能计算,提供 Python 绑定降低使用门槛。
使用猴子补丁让 Pandas 的 map、apply、applymap、aggregate 和 transform 支持异步。
这是一个知识管理系统,利用与大模型的对话来构建持久化知识,保存成 Markdown 文件。
在线电子书,主旨是帮你理解开发 Python 包的复杂生态:uv、Poetry、Flit、Setuptools 和 Hatch 到底是什么?它们的优缺点是什么?如何比较和取舍?另外,还涵盖了代码审查、格式化和依赖管理的内容。
一个简单可组合的 agent 开发框架,使用 MCP 协议和 Building Effective Agents 中描述的所有模式。(star 1.6K)
开源、可定制的 E-Ink 显示屏,提供 Web 界面可用于任何联网设备,易于安装和配置,支持定时播放列表。(star 1K)
使用最先进的 SciML 方法构建、训练和微调深度学习模型。提供了工具和优化管道,可开发结合物理知识和数据的 AI 模型,实现实时预测。(star 1.3K)
🐢播客&视频
视频探讨了选择单页应用(SPA)和服务器端渲染应用的影响因素,比如状态管理、用户体验管理、性能和可扩展性、项目限制和开发团队专业知识等。
Talking Postgres 播客讨论了为什么特别多 Python 和 Django 开发者对 Postgres 情有独钟?嘉宾是 Python 软件基金会主席,其新书《领域驱动 Django》有一章为“Just Use Postgres”。
Python 潮流周刊#95:像人类一样使用计算机
🦄文章&教程
希望将装饰器同时用在同步和异步函数上,会遇到哪些挑战?文章介绍了如何用生成器创建出对同步和异步函数都适用的装饰器。文章出自 Patreon 技术博客。
作者分享了将一个小型 Python 项目完全重构为无服务器架构的过程,从 VPS 到 AWS Lambda,成本从每年 350 美元降到每月 2 美元。
文章介绍了一些常见的负载均衡算法实现,分享了 Python 代码示例,包括随机选择算法、轮询算法、最小链接算法、一致性 Hash 算法。
Python 中有一则比较出名的 xkcd 漫画彩蛋:import antigravity ,除此之外,作者偶然发现了另一个 xkcd 彩蛋,关于“unreachable state”:当出现了不可能出现的情况,那么一切皆有可能……
八年 Python 经验的作者吐槽了两个主要痛点:类型和异常。
文章分享了 Qodo 公司选择 LangGraph 框架来开发 AI 编程助手的原因和过程,介绍了 LangGraph 的状态机模型、简洁 API 设计、节点式架构、内置状态管理等特性。
介绍了一个名为 Unvibe 的 Python 工具,可通过单元测试来生成正确的代码实现,其原理是用单元测试作为奖励函数,通过蒙特卡洛树搜索算法调用大模型生成代码,直至通过所有测试。
分享了如何通过垃圾回收优化一个 Python 程序,将运行时间从 40 秒缩短到 10 秒,内存使用从近 60 GB降至 1 GB。另外使用 CuPy 替代 NumPy,运行时间缩短至 1.5 秒。
一篇非常长的文章,深入介绍了 PyTorch 的内部机制,包括张量数据结构、自动微分机制、内存管理和操作实现等。
《Python工匠》作者的技术文章分享系列的第三部分,该系列偏重于程序员通识、软件工程、后端开发、技术写作、Python 语言、Go 语言。
11、编程十年的感悟
作者分享了多年对编程技术的思考,以及对职场人生的体味。“程序员的竞争力并不是写代码,也并不是哪门语言或者框架, 其核心竞争力是通过技术解决问题的能力”。
🐿️项目&资源
一个模块化可扩展的计算机使用框架,旨在实现与计算机的自主交互,自动执行复杂任务。(star 1.4K)

pyright 的 fork 分支,具有类型检查改进、改进的 vscode 支持和内置在语言服务器中的 pylance 功能。(star 1.7K)
开源的 RAG 系统,支持网页、PDF、视频和 GitHub 仓库等多种数据源,快速开发网站小部件、Slack 机器人和 Discord 机器人。
操作压缩的 JSON 文件,支持的格式有 gzip、bz2 和 lzma(或 xz)。
纯 Python 实现的 Web 框架,特性有依赖注入、OpenAPI 文档 & 错误响应生成器、问题页面、数据验证&参数解析、内置消息系统、对 AI 的强大支持。
自动发现所有 FastAPI 接口并将其转换为 MCP 工具,直接将 MCP 服务器挂载到 FastAPI 应用上。
使用声明式、基于类的策略开发模块化的命令行应用。
通过 Obsidian 的 REST API 社区插件,让 MCP 可与 Obsidian 交互,如列出目录和文件、读取文件内容、搜索文件、编辑笔记等。
利用 Ollama 或 LMStudio 的 LLM,联网搜索、总结并反思,最终生成 Markdown 总结。(star 6.7K)

批量下载抖音内容,去水印,支持视频、图集、合集、音乐(原声)。支持命令行参数或 YAML 配置文件方式运行。(star 2.3K)
使用 Pydantic v2 和各种框架(Falcon、Flask、Quart、Sanic、Starlette、Tornado)来生成和集成 OpenAPI 文档。
用于可缩放矢量图形(SVG)生成的多模态视觉语言模型,它可用于执行图像到 SVG 和文本到 SVG 的生成。(star 2.7K)
Python 潮流周刊#96:MCP 到底是什么?
🦄文章&教程
最近很火的 MCP 到底是什么?文章介绍了 MCP 的技术背景、优势及开发流程,展示了它与传统的 Function Calling 技术的本质区别,演示了 MCP 客户端和服务端开发的代码案例。(附:什么是 MCP(模型上下文协议)?)

一个黑客团队分享了在 Google 的 LLM bugSWAT 活动中发现 Gemini 漏洞并获得“最有价值黑客”称号的经历,详细介绍了探索 Python 沙盒环境的思路。
Duolingo 官方博客分享了它们将一个同步微服务改造成异步的经验,包括如何达成做迁移的共识、如何设计同步库的异步版本、如何处理异步代码。
PEP-723 “内联脚本元数据”规范可将外部依赖直接嵌入到单文件脚本中,无需额外的requirements.txt 。结合 uv 和 shebang,简化 Python 脚本的分发和执行。
使用服务器端事件(SSE)从 FastAPI 向 Svelte 前端实时推送数据更新,开发出一个实时更新的交互式仪表板。
streamlit 是一个快速开发简单网页的 Python 库,文章分析了它的三项基本设计哲学:用后端语言写前端、收到新事件会重新构建、支持会话级别的缓存。
探讨了 Python 生成器的工作机制,通过数据对比,展示它在内存效率和数据处理中的优势。
Socket 除了能做聊天室,还有哪些玩法?文章介绍了端口扫描器、简易 HTTP 服务器、局域网游戏、远程控制、文件传输、负载均衡、DDOS 攻击模拟器、网络代理服务器等用法。
介绍了 Python 3.13 引入的“自由线程”模式,如何与 PyTorch 实现高效的并行模型推理。通过无 GIL 方式训练 GPT-2 模型,展示了在 AI 推理场景中充分利用多核 CPU 资源的好处。
使用 uv 简化 Python 包管理,使用 PyPI 的 Trusted Publisher 作安全连接,利用 Github Action 自动触发软件包上传到 PyPI。
作者利用 WhisperX 的语音转文字和对齐功能,快速处理音频文件,再利用本地 LLM 来整理转录文本,生成高质量的播客字幕。
作者发现用 subprocess + shlex + open 方式打开网页会有操作系统不兼容问题,使用标准库 webbrowser 却可轻松解决,于是分析了 webbrowser 的实现原理。
🐿️项目&资源
fork 自 Django 的 Web 框架,由一个核心包和一些可选的三方包组成。

提供了可并行的懒加载接口,访问 PDF 文件内部结构;可在命令行查看各类 PDF 元数据;提取文本或文本对象,支持提取 JPEG 图片。
灵感来源于 Rust 的 Result 类型,可以在不依赖 try/catch 块的情况下作更明确的错误处理。
轻量级的 CLI 框架,类型安全、异步运行、易于测试、可组合命令、灵活配置。
将混乱的提交转换为有意义的叙事。自动化生成提交信息,增强 Git 工作流,通过 20+ 智能命令使版本控制变得轻松。(分享自@Zeeland)
多层的配置管理框架,类似于 VSCode 的用户/工作区设置模式,简化 Python 程序中分层配置的定义、访问和同步。(分享自@Zeeland)
按日期和类别过滤 arXiv 论文,下载和阅读论文内容,查看已下载论文,本地存储论文。
Amazon 开源的实验性 SDK,用于开发在浏览器中可靠执行操作的 agent。
自动将 uv/poetry 项目生成 Docker 镜像,兼容 PEP-621,支持在 pyproject.toml 添加配置。
O'Reilly 出品,有免费在线阅读版本。帮助 Python 开发者管理复杂项目的架构设计,包括依赖倒置、领域驱动设计、事件驱动架构和反应式微服务等。
自动化发布视频到各大社交媒体平台,支持定时上传。(star 4.4K)
一个视频生成的 pipeline,可用于生成 AI 图片与视频、训练 Diffusion Transformer 的基线模型与 Lora 模型。
🥂讨论&问题
PEP-751 在几天前被正式接纳了!这是 Python 打包生态的重大新闻!它提议指定一种标准的依赖库锁文件格式,实现可重复的安装。(附:Reddit 关于该 PEP 被接纳的讨论,PEP 751(Python 的标准化锁文件)被接纳!)
关于风头正盛的 uv 在下载量方面的一些讨论。
Python 潮流周刊#97:CUDA 终于原生支持 Python 了!
本期分享了 12 篇文章,12 个开源项目,2 则热门话题,全文 1620 字。
🦄文章&教程
NVIDIA 在 CUDA 工具包中实现原生支持 Python,将 Python 提升为一等公民,开发者不需要了解 C/C++,可以更方便使用 CUDA 工具包了。
Django 5.2 版本已发布了,文章详细介绍了多项新功能和改进:自动模型导入、复合主键支持、表单自定义、内容协商、模板块标签、URL 生成改进、测试优化等。
作者希望摆脱对 Google Calendar 等服务的依赖,通过自托管方案掌握个人日历数据,介绍了从 CalDAV 到 iCalendar 的探索过程,利用 Python 实现日历数据的格式转换。
这篇教程详细介绍了如何开发一款桌面便利贴应用,使用 PySide6 和 SQLAlchemy,实现无边框可拖动便签、多便签管理、自定义便签样式、集成系统托盘等功能。
一则草稿态 PEP,提议添加一个新的标准库,将 Meta 的 zstd 库作为默认实现。Zstandard 提供高压缩比和快速解压,优于 zlib 和 bzip2。
如何在 Django 项目中处理长时间运行的任务?如何将 Celery 与 Django 集成?如何在 Django 管理后台触发任务,并获取实时的任务状态?
Textual 项目的作者分享了如何在终端中实现高性能图形用户界面的技术细节,包括如何解决多窗口重叠问题、如何快速确定哪些窗口在可见区域、如何优化终端应用的渲染速度,等等。
word2vec 是一种用于生成词嵌入(word embeddings)的模型,文章详细介绍了如何用 JAX 重新实现它。
推荐系统和搜索技术在如今的 LLM 时代,发生了哪些演变?文章讨论了业界搜索和推荐系统在过去一年多的发展,涵盖模型架构、数据生成、训练范式和统一框架等方面。
大模型能否正确地理解 null 值,这对生成代码至关重要。文章介绍了如何通过模型输出和内部状态来评估模型对空值的理解,展示了模型训练及代码上下文对大模型的影响。
为什么有些 Python 库会被云服务供应商屏蔽?为什么 Scrapy、BeautifulSoup、Selenium 等库被识别为高风险库?机器人开发者如何应对这些限制?
- -(...==...) 等于 1,--(...==...)--(...==...) 等于 2,利用这点可以写出一长串内容来表示“hello, world”,但这种晦涩难懂的代码,是对过度追求技巧而忽视可读性的讽刺。

🐿️项目&资源
旨在提供一个简易部署计算机运行智能体(CUA)的解决方案,可在 PC 和个人笔记本上运行。

Python 开发的简单命令行工具,用于管理 Apple Notes 和 Apple Reminders,从终端创建、搜索和组织你的笔记。
一个针对 iOS 17.0 至 18.1.1 设备的工具,通过漏洞解锁设备的隐藏功能(启用动态岛、设备伪装、动态壁纸与 AOD等),禁用不必要的系统服务。(star 2.5K)
支持音频转录、多语言翻译、为视频添加字幕,并能执行复杂的媒体处理,适用于内容创作。它还支持跨云服务的文件管理,包括 Google Drive、Amazon S3、Google Cloud Storage 和 Dropbox。
一款特殊的 curl 构建,可模拟四大浏览器:Chrome、Edge、Safari 和 Firefox。能够执行与真实浏览器完全相同的 TLS 和 HTTP 握手。(star 5.1K)
便于用 Python 检索维基百科的信息,支持从维基百科提取文本、章节、链接、分类、翻译等。
谷歌开源的 Agent Development Kit (ADK),助力打造高效、智能的 AI agent,特色:代码优先、多代理架构、丰富的生态、灵活编排、原生流支持、状态/记忆与组件管理。(star 3.2K)
通过装饰器将文档字符串直接转换为 LLM 函数,支持 Jinja2 模板,支持异步函数,使用 Pydantic 模型定义响应结构,确保输出格式一致。
支持多种拼写格式的转换(如 snake_case、kebab-case、camelCase 等),智能识别缩写(如 HTTPRequest)并支持非 ASCII 字符。
PDF 科学论文翻译和双语对照库。有在线版沉浸式翻译,也支持自部署。(star 1.6K)

解析结构化文本,并将它们转换为基于层级标题的树形式,适用于处理具有嵌套标题的文档,如大纲、报告和技术文档。(分享自@Enoch)
强大的混合专家(MoE)大模型,总参数量为 671B,用了多头潜在注意力(MLA)和 DeepSeekMoE 架构,开创了无辅助损失的负载均衡策略。(star 95.4K)
🥂讨论&问题
这是 Flask 作者 Armin Ronacher 在 X 上发帖的问题,话题热度很高。
无独有偶,也是一则有关 uv 的讨论。标题很引战,建议先深呼吸调整到平常心,再点开链接看内容……
Python 潮流周刊#98:t-string 语法被正式接纳了
本期分享了 12 篇文章,12 个开源项目,2 则音视频,全文 1518 字。
🦄文章&教程
PEP-750 已被接纳了,将合入 Python 3.14。它提议引入 t-string,返回的是 Template 类型而非字符串,适用于自定义字符串处理、Web 模板、DSL 等场景,避免 SQL 注入、XSS 攻击等安全问题。(附:PEP750 模板字符串 Template Strings 中文翻译)
该 PEP 提议扩展 subprocess 和 shlex 模块以支持模板字符串(t-string),从而更安全、更方便地执行带插值的 shell 命令。
介绍了如何编译 Python 代码为原生代码,使其性能接近于 Rust。利用 CPython 的 frame evaluation API 实现符号追踪,构建 IR 图,再将 IR 图逐步降低为特定平台的原生代码。

如何用 Python 和 scapy 开发一个简易的 TCP 协议栈?文章分析了 TCP 三次握手过程,通过代码实现了其交互机制,并展示出 Python 在网络通信中的速度局限性。
文章分享了 Python 中 14 个高级的特性及示例,包括类型重载、泛型、模式匹配、高级 f-string、代理属性、元类等。
Python 不支持控制数据结构的内存布局,这是否意味着 CPU 缓存对 Python 性能没有影响?作者经过测试,发现随机访问列表比顺序访问慢 1.2~1.5 倍,这表明缓存优化对解释型语言同样适用。
作者建议在数据分析项目中使用 polars,因为它性能更快、API 设计更简洁直观、类型系统更统一。作者还提到 polars 的两点不足之处。
一个系列文章的第二篇,介绍如何将一些 dataframe 操作翻译成 SQL,包括使用窗口函数过滤、表达式组合和嵌套数据类型。
建议不写 __init__ 方法,避免冗余、不易测试和不够灵活等问题。作者推荐用 dataclass 自动生成 __init__,用 classmethod 作为对象工厂,并通过 NewType 强化类型约束。
介绍如何基于 Django Web 框架和 GeoDjango 模块,使用图像库 Pillow 从图像中提取 GPS 信息,然后创建带有图像的 Web 地图。
深入浅出介绍了模型上下文协议(MCP),演示了环境搭建、使用 Python 作 MCP 的实践操作以及实现其它工具的集成应用。
一个系列文章的第一篇,试图去寻找 DeepSeek 一步步探索的轨迹(DeepSeek LLM -> DeepSeek MoE -> DeepSeek V2 -> DeepSeek V3 -> DeepSeek R1),展现 DeepSeek 在技术路线选择和模型优化上的独到之处。
🐿️项目&资源
Google 最新开源的 Agent2Agent 协议,让不同框架实现的 agent 可以无缝通信和协同工作。(star 12K)
快速查看程序正在执行的所有操作,无需修改任何代码。集成 Firefox Profiler,支持多种分析视图,包括堆栈图、火焰图和调用树。

专为高效的分布式爬取和数据提取而设计的网页爬虫,使用异步 I/O、健壮的日志记录、插件架构和 Celery 的分布式任务处理构建。
专注于将扫描书籍的 PDF 文件转化为各种其它格式。提取正文,并过滤掉页眉、页脚、脚注、页码等元素,利用算法处理跨页顺接问题。(star 2.1K)
微软新开源的基于 Minecraft 的交互式世界模型,具备高生成质量、强大的可控性、快速的推理速度。
支持多 agent、自主的 agent 管理、集成区块链、集成社交媒体(Twitter 和 Telegram 等)、可扩展的技能系统、可扩展的插件系统。(star 6.1K)
本地的 AI 聊天工具,无需复杂配置,可用于 AI 对话与文本生成、图像生成与编辑、文本转语音、语音转文本等。
这是一个网站项目,它可以搜索和查看 Python 的下载量趋势图,支持对比查看多个包的下载趋势。
Python 操作 CUDA 的工具箱,包含多个相关组件包。(star 2.3K)
支持将 Markdown 转换为 HTML、PDF、DOCX 和 PPTX,支持执行代码块和渲染绘图。利用 LLM 的输出,创建带图表的美观报告。

支持从 Excel 中调用 Python,反之亦然。支持 Windows 和 MacOS 上的 Excel,以及 Google Sheet 和网页上的 Excel。(star 3.1K)
一个纯属恶搞的库,讽刺美国肆意征收进口关税。它可以设置导入某个库(如 numpy)所需的“关税”,效果是在 import 这个库时,延长导入的时间……(star 2.2K)
🐢播客&视频
“Conf42 Python”的视频合集,已有 50+ 视频。
视频嘉宾是两位 Jupyter 贡献者与项目负责人,话题包括 Jupyter 是如何工作的?他们是如何开发一个交互式语言执行引擎的?
Python 潮流周刊#99:如何在生产环境中运行 Python?
🦄文章&教程
作者分享了自己在生产环境中运行 Python 的一些实践经验,包括提升项目质量、保障可维护性、运维部署等多个方面。
Browser Use 是近期爆火的明星项目,两个人的纯技术开源项目,核心代码 8000 行,融资 1700 万美元!它具体做了什么,又为什么这么值钱呢?
分享了一些 Django Admin 主题:Dracula、Daisy、django-jazzmin、django-admin-kubi、django-jet-reboot、django-semantic-admin、Simple UI、Grapelli、django-admin-interface、Unfold。
介绍了 Python 引入验证过的 HACL 密码学库的历程。作者在 2022 年因 SHA3 漏洞提议替换 Python 的哈希实现,经 2.5 年努力,如今 Python 默认的哈希和 HMAC 算法均由 HACL 提供。
上期周刊分享了一篇文章建议不要写__init__ 方法,这篇文章作者受其启发,分享了自己写过的一个极端的__init__ 案例,解释了为何代码会出现错误。
Python 即将推出新的 ASN.1 API,它用纯 Rust 解析器提升了性能,与 PyCA Cryptography 共享解析器减少了差异风险,提供数据类风格接口提高了易用性。
分享了一个使用正则表达式进行文本操作的案例,介绍了几个实用特性,如启用详细模式提升可读性、通过命名组捕获文本、利用非捕获组优化匹配逻辑等。
作者回顾了 Python 30 多年演变的美好时光,同时引发思考,Python 未来如何发展以及应对挑战?作者呼吁应简化程序分发以及提升移动平台的开发体验。
介绍如何用 Copier 工具一键生成 Python 项目模板,集成 README、LICENSE、项目结构、动态配置、CI 流程等基础配置,实现项目脚手架自动化。
探讨了在 Python 中处理 I/O 密集型任务时遇到 CPU 瓶颈的问题,并提出了一种结合多线程和多进程的解决方案:在多个进程中用线程池来充分利用 CPU 资源,解决了单线程 CPU 使用率高的问题。
AI agent 的工作原理是什么?文章用通俗易懂的方式作出解释,揭示出 agent 实际是由节点、分支和循环构成的有向图, 并以代码展示如何定义节点、搭建并执行一个 agent。
一个关于谷歌从 ChatGPT 发布引发危机到重新确立AI领导地位的故事,通过 50 多位员工/高管的详细回忆,展现谷歌两年动荡时期的故事、所做的权衡和取舍。
🐿️项目&资源
本周超热门项目,仅 1.6B 参数量的文本生成语音模型,可生成高逼真度的对话,包含笑声、咳嗽、清嗓子等。(star 11K)
微软开源的 agent 入门课程,教你从零开始开发一个 AI agent。包含有中文翻译版本。(star 17.2K)
由 uv 驱动的可重复性 Jupyter notebook 工具包,支持 PEP-723。
通过 UI 界面可视化定义数据库模型,选择要集成的服务,快速生成带测试和接口的完整容器化项目。
用 Python 实现的小智语音客户端,旨在通过代码学习和在没有硬件条件下体验 AI 小智的语音功能。 (star 1.1K)
PyCon Taiwan 2024 中一场演讲的演示材料。

使用 Django Web 框架开发的财务管理系统,支持复式记账、分级科目表、财务报表、采购订单、财务比率计算、账户管理、OFX/QFX 文件导入等。(star 1.1K)
agent 组成的社区,一句话创建出强大的 agent,与其它 agent 自由组合,协作完成复杂任务。
利用 AI 分析 GitHub 代码库并创建面向初学者的教程,配有清晰的可视化图解,详细解释代码是如何工作的。(star 5.9K)
面向 AI 工程师的项目,通过提供可视化工作流,更高效地开发、测试和部署 AI agent。(star 4.7K)
利用微软的 Florence-2 模型精确检测水印,并利用 LaMA 模型擦除水印并自然填充。提供 CLI 方式和基于 PyQt6 的图形界面。
用于 Web 自动化的 agent,支持多种大模型,智能操作网页元素,自定义浏览器设置,实时更新会话并记录操作。(star 1.8K)
🐢播客&视频
core.py 播客第 21 期,深入探讨了 Cpython 垃圾回收的相关话题。其它话题还有:是否对标准库本身做类型检查、自由线程开发进展、http.server 支持 HTTPS 等。
《Latent Space: The AI Engineer Podcast》播客节目,嘉宾是 MCP(Model Context Protocol)的作者,聊了该协议的起源、挑战以及未来发展。
🥂讨论&问题
研究生的课堂项目做什么东西,如何做出新意?
Python 潮流周刊#100:有了 f-string,为什么还要 t-string?
你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。周刊开源在 Github 上,喜欢请给颗小星星支持下~
本期分享了 12 篇文章,12 个开源项目,1 则音视频,全文 1584 字。
重要提示: 本周刊迎来第 100 期,限时订或新订阅,可享受八折优惠,欢迎领取优惠券 --> https://www.xiaobot.net/coupon/d2c69b05-91b8-4e2b-b346-e7bc4dbc141a
🦄文章&教程
Python 有了 f-string,为什么还要设计出 t-string?文章解读了 PEP-750 设计出 t-string 的原因,同时也是一篇全面的 t-string 教程,介绍了它的基本应用场景以及几种进阶用法。
作者遇到了一个有趣的 bug:用 f"{x}" 抛出了 TypeError,但 str(x) 却正常。文章介绍了调试的过程,详细分析了 f-string 处理字符串插值的底层原理,最后发现是工作流编排引擎 Temporal 的问题。
探讨了 Python 3.14 在调试生态方面的重大改进,PEP-768 允许用户远程的为一个 Python 进程注入一段调试代码,使得调试工具能以更好的方式对 Python 进程进行无侵入的调试与观测。
Python 3.15 的开发和发布计划已公布,17 个月的开发周期:2025.6.6 开始开发,2025.10.14 发布 alpha 1 版本,2026.5.5 发布 beta 1,2026.10.1 发布正式版。
作者分享了今年参加 DjangoCon 的收获,包括一些数据库优化技巧、性能测试方法、网络算法调整、查询分析技巧、多个实用工具和最佳实践等。
介绍了如何在 Django 项目中集成 Meilisearch,以实现高效的全文搜索功能。通过 Docker 配置 Meilisearch,利用 Pydantic 定义搜索模式,并通过自定义的模型方法和 Django 管理命令实现数据的自动和批量索引更新。
介绍了 PyXL,一种能在硬件层面直接执行 Python 代码的自定义处理器,无虚拟机、无解释器、无 JIT、无 C 语言。GPIO 圆程仅需 480 纳秒,比 MicroPython 快 30 倍,时钟速度归一化后优势达 50 倍。
分享了如何利用 Gemini 2.0 Flash 高效完成代码生成/重构,实现自动化删除 200 多个 GN 构建文件。讨论了如何利用 AI 和普通脚本混合处理繁琐代码任务。
介绍了如何系统地优化了 Warehouse(为 PyPI 提供动力的后端)的测试套件,将执行时间从 163 秒减少到 30 秒,同时测试数量从 3,900 增长到 4,700 多。

如何给 Python 的混合类(mixin class)添加类型提示?文章介绍了两种情况的解决方法:基类继承法和协议定义法,提升了混合类的类型安全性和可维护性。
你是否了解 Python 3.8 引入的海象操作符(PEP-572)?什么情况下使用它,带来的好处是什么,对代码可读性有什么影响?
Wired 网站发布的一份调查报告,调查了 730 位开发者,了解他们在工作中如何使用 AI 聊天机器人、使用的频率以及如何评价 AI 等。AI 正在改变编程工作,但还远不能取代程序员。
🐿️项目&资源
Meta 正在开发中的 Python 类型检查工具,计划于 2025 年底完全取代 Pyre,使用 Rust 开发,希望提高性能并提供生成类型化的 AST 等新功能。
一个多 agent LLM 系统,自动将论文转换为代码。遵循三阶段流程:规划、分析和代码生成,每个阶段由专门的 agent 处理。(star 1K)

可以作异常检测,阻止可疑 IP,防止 UUID 篡改,阻止蜜罐字段利用,并每日基于日志再训练持续改进。
微软开源的 Pyton 日志库,比标准库中的 logging 模块快 4-17 倍。
一个模块化、多 agent 协调系统,专为自动化社交媒体中的任务而设计,深度集成 TikTok、Instagram、YouTube、X、Quora、WhatsApp 等平台。
matplotlib.pyplot 的替代库,具有基于 SVG 的交互式图表,提供简洁、高质量的渲染。
开源的分布式、可扩展工作流编排引擎,支持自托管和云服务部署,持久化执行、自动重试机制、单向安全连接。
通过简单代码,自动生成 GUI、TUI 和 CLI,无需手动编写界面代码。自动处理配置文件的读取和解析,简化了配置管理。
对 Python 软件包整个生命周期进行基准测试的工具,结果展示为交互式 Web 前端。
Jupyter 官方开源的工具,为 Jupyter Notebook 提供结构化的差异比较(diff)和合并(merge)功能。(star 2.7K)
阿里最新开源大模型,首创“快思考(非推理模式)”与“慢思考(深度推理模式)”的动态切换机制,数学推理能力超 GPT-4 等模型。(star 20K)
月之暗面开源的通用音频基础模型,基于 1300 万小时多样化音频数据训练,在语音识别、音频理解与生成等任务中实现多项 SOTA 性能突破。(star 3.3K)
🐢播客&视频
视频揭示出 Python 装饰器有值得警惕的地方,因为它会破坏代码的类型安全、隐藏函数的依赖、并且难以调试。
- 作者:KAI
- 链接:https://blog.985864.xyz/technology/1df805b5-5b95-80cc-9840-c8959ee53cb4
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。