Jiao77/RoRD-Layout-Recognation

Fork 0

Files

Jiao77 49fe21fb2f improve IC Layout Diffussion model 20251120

2025-11-20 01:47:09 +08:00

6.9 KiB

Raw Blame History

优化的IC版图扩散模型

针对曼哈顿多边形IC版图光栅化图像生成的去噪扩散模型优化版本。

🎯 优化目标

专门优化以曼哈顿多边形为全部组成元素的IC版图光栅化图像生成，主要特点：

曼哈顿几何感知：模型架构专门处理水平/垂直线条特征
边缘锐化：保持IC版图清晰的边缘特性
多尺度结构：保持从微观到宏观的结构一致性
几何约束：确保生成结果符合曼哈顿几何规则
后处理优化：进一步提升生成质量

📁 文件结构

tools/diffusion/
├── ic_layout_diffusion_optimized.py  # 优化的核心模型实现
├── train_optimized.py                # 训练脚本
├── generate_optimized.py             # 生成脚本
├── run_optimized_pipeline.py         # 一键运行管线
├── README_OPTIMIZED.md              # 本文档
└── original/                        # 原始实现（参考用）
    ├── ic_layout_diffusion.py
    └── ...

🚀 快速开始

1. 基本使用 - 一键运行

# 完整管线（训练 + 生成）
python tools/diffusion/run_optimized_pipeline.py \
    --data_dir data/ic_layouts \
    --output_dir outputs/diffusion_optimized \
    --epochs 50 \
    --num_samples 200

# 仅生成（使用已有模型）
python tools/diffusion/run_optimized_pipeline.py \
    --skip_training \
    --checkpoint outputs/diffusion_optimized/model/best_model.pth \
    --data_dir data/ic_layouts \
    --output_dir outputs/diffusion_generated \
    --num_samples 500

2. 分步使用

训练模型

python tools/diffusion/train_optimized.py \
    --data_dir data/ic_layouts \
    --output_dir models/diffusion_optimized \
    --image_size 256 \
    --batch_size 4 \
    --epochs 100 \
    --lr 1e-4 \
    --edge_condition \
    --augment \
    --manhattan_weight 0.1

生成样本

python tools/diffusion/generate_optimized.py \
    --checkpoint models/diffusion_optimized/best_model.pth \
    --output_dir generated_layouts \
    --num_samples 200 \
    --num_steps 50 \
    --use_ddim \
    --use_post_process

🔧 关键优化特性

1. 曼哈顿几何感知U-Net

class ManhattanAwareUNet(nn.Module):
    """曼哈顿几何感知的U-Net架构"""

    def __init__(self, use_edge_condition=False):
        # 专门的方向感知卷积
        self.horiz_conv = nn.Conv2d(in_channels, 32, (1, 7), padding=(0, 3))
        self.vert_conv = nn.Conv2d(in_channels, 32, (7, 1), padding=(3, 0))
        self.standard_conv = nn.Conv2d(in_channels, 32, 3, padding=1)

        # 特征融合
        self.fusion = nn.Conv2d(96, 64, 3, padding=1)

优势：

专门提取水平和垂直特征
保持曼哈顿几何结构
增强线条检测能力

2. 多目标损失函数

# 组合损失函数
total_loss = mse_loss +
             0.3 * edge_loss +           # 边缘感知损失
             0.2 * structure_loss +      # 多尺度结构损失
             0.1 * manhattan_loss       # 曼哈顿约束损失

优势：

保持边缘锐利度
维持多尺度结构一致性
强制曼哈顿几何约束

3. 几何保持的数据增强

# 只使用不破坏曼哈顿几何的增强
self.aug_transform = transforms.Compose([
    transforms.RandomHorizontalFlip(p=0.5),
    transforms.RandomVerticalFlip(p=0.5),
    # 移除旋转，保持几何约束
])

4. 后处理优化

def manhattan_post_process(image):
    """曼哈顿化后处理"""
    # 形态学操作强化直角特征
    # 水平和垂直增强
    # 二值化处理
    return processed_image

📊 质量评估指标

生成样本会自动评估以下指标：

曼哈顿几何合规性 - 角度偏差损失（越低越好）
边缘锐度 - 边缘强度平均值
对比度 - 图像标准差
稀疏性 - 低像素值比例（IC版图特性）

🎛️ 参数调优指南

训练参数

参数	推荐值	说明
`manhattan_weight`	0.05 - 0.2	曼哈顿约束权重
`schedule_type`	cosine	余弦调度通常效果更好
`edge_condition`	True	使用边缘条件提高质量
`batch_size`	4 - 8	根据GPU内存调整

生成参数

参数	推荐值	说明
`num_steps`	20 - 50	DDIM采样步数
`eta`	0.0 - 0.3	随机性控制（0=确定性）
`guidance_scale`	1.0 - 3.0	引导强度
`post_process_threshold`	0.4 - 0.6	后处理阈值

🔍 故障排除

1. 训练问题

Q: 损失不下降

检查数据质量和格式
降低学习率
增加批次大小
调整曼哈顿权重

Q: 生成的图像模糊

增加边缘损失权重
使用边缘条件训练
调整后处理阈值
增加训练轮数

2. 生成问题

Q: 生成结果不符合曼哈顿几何

增加 manhattan_weight
启用后处理
降低 eta 参数

Q: 生成速度慢

使用DDIM采样
减少 num_steps
增加 batch_size

3. 内存问题

Q: GPU内存不足

减少批次大小
减小图像尺寸
使用梯度累积

📈 性能对比

特性	原始模型	优化模型
曼哈顿几何合规性	❌	✅
边缘锐度	中等	优秀
训练稳定性	一般	优秀
生成质量	基础	优秀
后处理	无	有
质量评估	无	有

🔄 与现有管线集成

更新配置文件以使用优化的扩散数据：

synthetic:
  enabled: true
  ratio: 0.0  # 禁用程序化合成

  diffusion:
    enabled: true
    png_dir: "outputs/diffusion_optimized/generated"
    ratio: 0.3  # 扩散数据在训练中的比例
    model_checkpoint: "outputs/diffusion_optimized/model/best_model.pth"

📚 技术原理

曼哈顿几何约束

IC版图具有以下几何特征：

所有线条都是水平或垂直的
角度只能是90°
结构具有高度的规则性

模型通过以下方式强制这些约束：

方向感知卷积核
角度偏差损失函数
几何保持后处理

多尺度结构损失

确保生成结果在不同尺度下都保持结构一致性：

原始分辨率：细节保持
2x下采样：中层结构
4x下采样：整体布局

🛠️ 开发者指南

添加新的损失函数

class CustomLoss(nn.Module):
    def forward(self, pred, target):
        # 实现自定义损失
        return loss

# 在训练器中使用
self.custom_loss = CustomLoss()

自定义后处理

def custom_post_process(image):
    # 实现自定义后处理逻辑
    return processed_image

📄 许可证

本项目遵循与主项目相同的许可证。

🤝 贡献

欢迎提交问题报告和改进建议！

注意：这是针对特定IC版图生成任务的优化版本，对于一般的图像生成任务，请使用原始的扩散模型实现。

6.9 KiB Raw Blame History Unescape Escape