Mice World

RKYOLO诞生记 (七)：小结与展望——折腾不止，快乐不息

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，边缘计算部署， RKYOLO诞生记

好了好了，到了给这个系列收尾的时候了。回头看看，这个叫 rkyolo 的小东西，从一个念头开始，居然真的被我一点点攒成了一个能跑、能看、还能给自己打分的 Rust 推理框架，想想也是挺神奇的。

在这最后一篇，咱不吹牛，就唠点实在的。说说我都捣鼓了啥，还有哪些地方让我挠头，以及以后还能怎么接着玩。

阅读全文 »

RKYOLO诞生记 (六)：构建完整评估工具链——rkyolo-eval的实践与洞察

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，边缘计算部署， RKYOLO诞生记

在完成了rKYOLO核心推理引擎和多种 IO 功能后，项目已经具备了完整的应用能力。然而，我深知在机器学习项目中，可靠的评估体系与高效的推理能力同等重要。为此，我构建了rkyolo-eval工具链，为项目增添了专业的模型评估能力。

阅读全文 »

RKYOLO诞生记 (五)：从静态图片到实时视频——全功能应用的构建之旅

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，边缘计算部署， RKYOLO诞生记

在前几轮的扎实工作后，RKYOLO 的核心推理引擎已经变得相当可靠：安全、自适应且性能良好。但它当时更像一个“库”，离一个开箱即用的“工具”还有一步之遥。我的下一个目标，就是为这个强大的引擎，打造一个完整的外壳，让它能灵活地处理现实世界中的各种视觉输入。

阅读全文 »

RKYOLO诞生记 (四)：零拷贝踩坑记 —— 和内存搬运说再见

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，边缘计算部署， RKYOLO诞生记

前面的文章里，我们给 RKYOLO 搭好了结实的地基——安全的 FFI 层和聪明的后处理。项目是能跑了，但作为一个爱折腾的人，我总觉得还能再抠点性能出来。

当我琢磨怎么用它来处理实时视频流时，我意识到真正的挑战来了。目标不再是“能跑”，而是得“跑得飞起”。为此，我决定去碰一碰性能优化里最硬的那块骨头——零拷贝(Zero-Copy)。

阅读全文 »

RKYOLO诞生记 (三)：和模型输出玩“配对游戏”——折腾出一个能自适应变化的笨办法

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，边缘计算部署， RKYOLO诞生记

上一篇文章里，我们好不容易打赢了“数值之战”，让模型终于能看清楚东西了。我美滋滋地想，导师给的玉米穗模型部署任务，这下总该顺利了吧？

于是，我满心期待地把模型从 COCO 的yolo11n.rknn换成了自己的MTDC-UAV.rknn。结果……程序又扑街了。

阅读全文 »

RKYOLO诞生记 (二)：模型“指鹿为马”？我的Bug侦探笔记

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，边缘计算部署， RKYOLO诞生记

上一篇文章，我们聊了为什么我选择用 Rust 来为 RKNN 库构建一个安全、独立的地基。当地基打好，我信心满满地将所有模块串联起来，加载了官方示例中那张经典的bus.jpg，期待着一次完美的推理。

程序没有崩溃，有输出了！我兴奋地将结果绘制出来，然后……我傻眼了。

案发现场：一切混乱的开始

眼前的景象让我大跌眼镜。这哪里是目标检测，这简直是抽象艺术……

阅读全文 »

RKYOLO诞生记 (一)：告别C++"动物园"，为何我选择用Rust从零开始？

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，边缘计算部署， RKYOLO诞生记

大家好，我是个大三的学生。最近因为导师的一个课题，需要把一个我自己训练的、用于识别玉米穗的 YOLO11n 模型，部署到一块 Rockchip RK3588 开发板上。

这其实还有个“前传”：为了让板子支持最新的模型，我已经折腾了好一阵子，把整个 Linux 内核连带 RKNPU 驱动都给交叉编译升级了一遍。所以，当底层环境就绪，模型也转换成.rknn格式后，我当时觉得，接下来应该就是顺理成章的“应用开发”了。

很自然地，我找到了野火社区的“鲁班猫”AI 教程，他们提供了一个yolo11的 C++示例。我寻思着，既然有现成的，改改用就行了呗？

事实证明，我还是太年轻了。

阅读全文 »

一次对香港服务器的网络优化与安全加固笔记

发表于 2025-09-10 更新于 2025-12-13 分类于技术实践，开发运维，服务器运维，网络与安全

最近抽了点时间，准备把个人博客 miceworld.top 和一些自托管服务迁移到一台新的香港云服务器上。想着能有更完全的控制权，也方便自己折腾。

服务器的初始化很顺利，Debian 系统，Nginx + Hexo 部署网站，再用 Certbot 跑一下，HTTPS 的小绿锁很快就亮起来了。一切都按部就班。

阅读全文 »

U-Net 学习总结

发表于 2024-11-16 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，模型理论与实践

1. 什么是 U-Net？

U-Net 是一种用于图像分割的卷积神经网络，最初由 Olaf Ronneberger 等人在 2015 年为医学图像分割设计。其独特的 U 形架构使其在生成高质量分割图像方面表现出色。

阅读全文 »

2024.11.16随笔

发表于 2024-11-16 更新于 2025-12-13 分类于技术实践，人工智能，计算机视觉，模型理论与实践

开始的地方：数据集和准备工作
最开始，我选择了 MTDC-UAV 数据集，这个数据集包含了许多图像和标注，适合做目标检测和回归任务。我编写了一个脚本，把 800 张有标注的图像按照 7:2:1 的比例随机分配成 Train、Valid、Test 集。重要的是，确保每个集合里的图片都是随机选取的，三个集合之间没有重复，并且每张图像都能找到对应的标注文件。

阅读全文 »