3.8 KiB
RoRD 模型 ‑ 完整数据说明
版本:v1.0(仅针对仓库实际代码,不含 README 抽象描述)
────────────────────────────────────
一、数据类型总览
| 阶段 | 需要数据 | 目录示例 | 是否必须 | 说明 |
|---|---|---|---|---|
| 训练 | 布局图像(PNG) | train/layouts/*.png |
✅ | 仅图像,无标注 |
| 验证 / 测试 | 验证图像(PNG) | val/images/*.png |
✅ | 大图 |
| 模板图像(PNG) | val/templates/*.png |
✅ | 小图 | |
| 标注 JSON | val/annotations/*.json |
✅ | 每张验证图一份 |
────────────────────────────────────
二、文件格式与内容
-
布局 / 验证 / 模板图像
• 后缀:.png
• 通道:单通道或三通道皆可(代码内部转为灰度)
• 颜色:二值化黑白最优;灰度亦可
• 分辨率:任意,推荐 1024×1024 以上保证细节
• 命名:无限制,保持唯一即可 -
标注 JSON(与每张验证图像同名)
文件路径:val/annotations/{image_basename}.json
根对象仅含一个键"boxes",值为数组,每个元素代表一个模板实例:
{
"boxes": [
{
"template": "nmos_stdcell.png",
"x": 128,
"y": 256,
"width": 64,
"height": 32
},
{
"template": "pmos_stdcell.png",
"x": 300,
"y": 120,
"width": 64,
"height": 32
}
]
}
字段含义
| 字段 | 类型 | 取值范围 | 描述 |
|---|---|---|---|
| template | string | 必须与 val/templates 中某文件名完全一致 |
对应模板图像 |
| x | int | ≥ 0 | 模板左上角在大图中的列坐标(像素),原点在左上角 |
| y | int | ≥ 0 | 模板左上角在大图中的行坐标(像素) |
| width | int | > 0 | 模板在大图中的宽度(像素),一般等于模板图像实际宽度 |
| height | int | > 0 | 模板在大图中的高度(像素) |
────────────────────────────────────
三、目录结构示范
project_root/
├── train/
│ └── layouts/
│ ├── chipA.png
│ ├── chipB.png
│ └── …
├── val/
│ ├── images/
│ │ ├── chip1.png
│ │ └── chip2.png
│ ├── templates/
│ │ ├── nmos_stdcell.png
│ │ └── pmos_stdcell.png
│ └── annotations/
│ ├── chip1.json
│ └── chip2.json
────────────────────────────────────
四、常见问题速查
-
训练时是否需要 JSON?
→ 不需要。训练阶段仅读取train/layouts/*.png,内部自动生成旋转/镜像自监督对。 -
JSON 中可以多写字段吗?
→ 可以,但评估脚本只解析"boxes"及 5 个必要子字段,其余忽略。 -
坐标超出图像边界会怎样?
→ 代码未做强制裁剪,需自行保证x+width ≤ image_width且y+height ≤ image_height,否则评估阶段 IoU 计算会出错。 -
模板尺寸必须固定吗?
→ 不必。不同模板宽高可不同,只要在 JSON 中写对实际值即可。 -
一个模板可在同一张图中出现多次吗?
→ 可以,在"boxes"数组中添加多条记录即可。
────────────────────────────────────
五、一句话总结
训练:给模型一堆版图 PNG;
验证 / 测试:给模型大图 + 小模板 + JSON 指明每个模板在大图中的左上角坐标和宽高。