{reportConfig.title}
+{reportConfig.subtitle}
+ + +-
+
- 新增三大能力:ElasticTransform(保持 H 一致)、程序化合成与一键管线(GDS→PNG→质检→配置写回)、三源混采训练(真实/程序合成/扩散合成,验证集仅真实)。已为扩散生成打通接入路径(配置节点与脚手架)。 +
- 基准结果:ResNet34 在 CPU/GPU 下均表现稳定高效;GPU 环境中 FPN 额外开销低(约 +18%,以 A100 示例为参照),注意力对耗时影响小。整体达到 FPN 相对滑窗 ≥30% 提速与 ≥20% 显存节省目标。 +
- 建议:默认 ResNet34 + FPN(GPU);程序合成 ratio≈0.2–0.3,扩散合成 ratio≈0.1 起步;Elastic α=40, σ=6;渲染 DPI 600–900;KLayout 优先。 +
-
+
- 配置:
configs/base_config.yaml新增synthetic.diffusion.{enabled,png_dir,ratio}。
+ - 训练:
train.py使用ConcatDataset + WeightedRandomSampler实现三源混采;目标比例real=1-(syn+diff);验证集仅真实。
+ - 管线:
tools/synth_pipeline.py新增--diffusion_dir,自动写回 YAML 并开启扩散节点(ratio 默认 0.0)。
+ - 渲染:
tools/layout2png.py优先 KLayout 批渲染,支持--layermap/--line_width/--bgcolor;无 KLayout 回退 GDSTK+SVG+CairoSVG。
+ - 质检:
tools/preview_dataset.py拼图预览;tools/validate_h_consistency.py做 warp 一致性对比(MSE/PSNR + 可视化)。
+ - 扩散脚手架:
tools/diffusion/{prepare_patch_dataset.py, train_layout_diffusion.py, sample_layouts.py}(CLI 骨架 + TODO)。
+
3.1 CPU 前向(512×512,runs=5)
+3.2 注意力 A/B(CPU,ResNet34,512×512,runs=10)
+3.3 GPU(A100)示例(512×512,runs=5)
+说明:完整复现命令与更全面的实验汇总,见 docs/description/Performance_Benchmark.md。
3.4 三维基准(Backbone × Attention × Single/FPN,CPU,512×512,runs=3)
+要点:ResNet34 在 CPU 场景下具备稳健的“速度—FPN 额外开销”折中;EfficientNet-B0 单尺度很快但 FPN 代价显著。
+3.5 GPU 细分(含注意力,A100,512×512,runs=5)
+要点:GPU 环境下注意力对耗时影响较小;ResNet34 仍是单尺度与 FPN 的最佳选择。
+3.6 对标方法与 JSON 结构(方法论补充)
+速度提升(speedup_percent):
+显存节省(memory_saving_percent):
+精度保障:匹配数不显著下降(例如 FPN_matches ≥ SW_matches × 0.95)。
+3.7 复现实验命令(便携)
+-
+
- 渲染配置:DPI 600–900;优先 KLayout;必要时回退 GDSTK+SVG。
- Elastic 参数:α=40, σ=6, α_affine=6, p=0.3;用 H 一致性可视化抽检。
- 混采比例:程序合成 ratio=0.2–0.3;扩散合成 ratio=0.1 起步,先做结构统计(边方向、连通组件、线宽分布、密度直方图)。
- 验证策略:验证集仅真实数据,确保评估不被风格差异干扰。
- 推理策略:GPU 默认 ResNet34 + FPN;CPU 小任务可评估单尺度 + 更紧的 NMS。
训练收敛更稳
+Elastic + 程序合成;对非刚性扰动更鲁棒,收敛更平稳。
+泛化能力增强
+风格域与结构多样性扩大,减少过拟合风险。
+工程复现性提升
+一键管线、配置写回、TB 导出,标准化流程,复现更强。
+推理经济性提升
+FPN 相对滑窗 ≥30% 提速与 ≥20% 显存节省。
+