<!--                                                                                                                              
                                                                                                                             
                                                                                                                             
                                         ..;+$&& &&&&$Xx;                                                                  
                                      ..;+$&&&&&&&&&&&&&&&&&$Xx;                                                                  
                                      .x&&&&&&&&&&&&&&&&&&&&&&&&&&&&:                                                             
                                   .x&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&;                                                          
                                   X&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&;                                                       
                                 .x&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&X:                                                    
                                :X&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&x                                                   
                              :$&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&.                                                 
                             :$&&&&&&&&&&&&&$$$$$$$$$$$$$$&&&&&&&&&&&&&&&&&&&&&&&+                                                
                            ;$&&&&&&&&&$$$XXXXXXXxxxxxxXXXXXX$$$$&&&&&&&&&&&&&&&&&x                                               
                            X&&&&&&&&$$XXXXXXxXxxxxxxxxxxxxxxxxxxxxX$&&&&&&&&&&&&&&&                                              
                           :&&&&&&&$$$XXXXXXxxxxxxx+x++++++++++++xxxxxxX$&&&&&&&&&&&;                                             
                          .$&&&&&&$$$XXXXXxxxxxxxxxx++++++++++++++++++xxxx$&&&&&&&&&X                                             
                          $&&&&&&$$$XXXXxxxxxxxxx+++++++++++++++++++++++xxxx$&&&&&&&&                                             
                         :&&&&&&$$$XXXXXxxxxxxxxx+++++++++++++;+++++++++++xxxX$&&&&&&.                                            
                         $&&&&&$$$XXXXXXxxxxxxx++++++++++++++++++++++++++++xxxX$&&&&&+                                            
                        .&&&&&&$$XXXXXxxxxxxxxx++++++++++++;;+++++++++++++++xxxX$&&&&+                                            
                        ;&&&&&&$$XXXXxxxxxxxx+++++++++++++++++++++;++++++++++xxxX&&&&x                                            
                        X&&&&&$$XXXXXXXXxxxxx+++++;;+;;;;;;;;;++;;;;++++++++++xxX$&&&&.                                           
                        X&&&&&$XX$&&&&&&&&&$$Xxxx++++++;;;;;+++++;++++++++++++xxX$&&&&X                                           
                        X&&&&$X$&&&&&&&&&&&&&&&$$Xxxxx++++++++++++++++++++++xxxxx$&&&&$                                           
                        &&&&&XX$&&&$$$$$$$$$$&&$$$$XXXx+++++++xxxXXX$$$&&&$$$$$XxX&&&&+                                           
                        X&&&&XXXXXXXxxxx++xxXX$$$$XXXXxx++++xxXXXX$$$&&&&&&&&&&&Xx&&&&.                                           
                        +&&&XXxXXxxxxxx++++++xxxXXXXXxxx++++xxXXXXXXXXxxxxxxX$$$$X&&&x                                            
                        X&&&XXXXXxXX$XXXXxxxX$XxxXXXXxxx+++++xXXXXxxxx++++++++xxxx&&&;                                            
                       ;$&&XxxXXXX$$&&&&&&&&&&$$xXXXXXx++;+++xXXXX$$&&$$$$Xx++++++X&&                                             
                       X$&&xxxxXX$$$$$$&&&&&&X$&$+xxxXx++;+++xxxX&&&&&&&&$&&&$Xx++x&+                                             
                      ;$$&$XxxxxxxxxXxxXXXXxxx+++++xxxx++;++++++++xxX&&&&XXXXXXx+++&$:                                            
                      +$$$$xxxxxxx++xxxxxxxxxx++x+xxxxx++;;+++++++xxx++++++++++++++$$+                                            
                      .XX$$xxxxxxx+++++++++++++++xxxxxx++;+++++++++++xxx+++++++++++Xx+                                            
                       xX$$xxxxxxx++++++++++++++xxxxxxx++;;+++++++;+++;+;;;;;++++++x++                                            
                       ;XX$Xxxxxxx+++++++++++++xxxxxxxx++;+++++++++;;;;;;;;;;+++++++;.                                            
                        +X$XXxxxx+++++++++++++xxXXxxxxx+;;;++++xx+++;;;;;;++++++++++.                                             
                         +$XXXxxxx+++++++++++xxxxxxxxxx+;;;+++++xxx+++;;;+;;;++++++:                                              
                          XXXXxxxx+++++++++xxxxx+++xxxx++++++++++xxx++++++++++++++.                                               
                           ;XXXXxxxx++++xxxxxxxxxxxxxxxx++++++++++xxxx+++++++++++;                                                
                            xXXXXxxxxxxxxxxxxX$$$$&&&$$XXXX$&&$$Xx++xxxx+++++++++:                                                
                            +XXXXXXXXxXxxxxxxX$$$$$$$$$$$$$$$$$$X++++xxxxxxxxx+++                                                 
                            ;XXX$$XXXxxxxxxxxXXXXXXXXXXXXx++++++++++++xxxxxxxxx+;                              ;++;:              
                            .xXX$$$XxxxxxxxxXxxxxxxx++++++++++++++xxx++++xxxxx++                              ;xx++;;             
                             +XXX$XXxxxxxxXXXXxxxxxx++++++++++++++xxxxx+++xxxxx:            .                .xxx+++;             
                              XXXXXXXxxxxX$&&&&&&$$$$XxxxXX$$$$$$&&&$Xx++++xxx;           :+++;.             +xxxx++;             
                              .XXX$XXXxxxxxxXX$$$$$$$$&$$$XxXXXXx+xxXXxx+xxxx;            x+++;;             Xxx+x++:             
                               ;$$$$XXXxxxxxxxxXXX$$$XXxxxxXXxx++++++xxxxxxx+            .xx++;;.           :Xxxxx++.             
                                +$$$$$$XXxxxxxxxxXXXXXXXXXXxxxx++++++xxxxxx;             :xx+++;;           ;Xxxxxx+              
                                 $&$$$$$$XXxxxxxxxxXXXXXXXXxxxx++++xxxxxXx;              :x+++++;           xx+++++:              
                            ..   $&&&$$$$XXXxxxxxxxxxxxxxxxxxxxxxxxxxxxxX:               .Xx+++++          .xx+++++.              
                        X&&&&&&&&&&&&&&&$$XXXxxxxxxxxxxxxxxxxxxxxxxxxxx+                  XXxxx++.         +xx+++++.              
                      $&&&&&&&&&&&&$&&&&&$$$XXXxxxxxxxxxxxxxxxxxxxxXXX+                   +xx+++;;        .Xx++++++               
                   :$&&&&&&&&&&&&&&&&$&&&&&&$$XXXXXXXXXXXXxxxxXXXXXXXx.                   ;Xx+++++.       ;Xxx+++++               
                  $&&&&&&&&&&&&&&$$$&&&&&&&&&&&$$$XXXXXXXXXXXX$$$$$Xxx                    +Xx+++++;       xxx+xxx+;               
             .;&&&&&&&&&&&&&&&&&&$$$$$&&&&&&&&&&&&&&&$$$$$$&&&&$$XXxx+                    +Xxxxx+++      :Xxx+++++:               
       +$&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$&&&&&&&&&&&&&&&&&&&&&$$XXxxxx+                    .$Xxxx+++:     xXxx++++;.               
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$&&&&&&&&&&&&&&&&&&$$XXxxxxx;                     XXx+++++:    .XXxx++++;                
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$XXX$$$$&&&&&&$$&&&&&$$$$Xxxxxxxx&.                    +Xx+++++;    ;XXxx++++:                
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&XXXXX$$$$$&&&&&&&$$$$$$XXXxxxxxX&&:                   ;Xxx+++++   .xXxxxxx++                 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&XxxxXXXX$$$$$$$$$$$XXXXxxxxxxx&&&&                   .$Xxx++++.  +xxxxxxx+;                 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&xxxxxxxxxxx+++x++xxxxxxxxxxx$&&&&&&&&&&&&X.        .XXxx+++++;;;;+++++++;                 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&x+xxxxxxxxxxxxx+xxxxxxxxxX&&&&&&&&&&&&&&&&&;     .$$Xx+++++++++++++++++;;::.            
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&+xxxxxxxx++xxxxxxxxxxXX$&&&&&&&&&&&&&&&&&&&.   .$Xxx++++++++++++++x+++xxxxxx+++       
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&Xxxxxxx+++++xxxxxxxXX$&&&&&&&&&&&&&&&&&&&&X  .$$Xxx++++++++++x++xxxXXxxXxx++;++.    
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$xxxxx+++++++xxxxX$$&$&&&&&&&&&&&&&&&&&&&&  $$Xx+++++++++++xx+XXX$$$X$Xx++++++.   
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&Xxx++++++++xxxX$$$$&&&&&&&&&&&&&&&&&&&&&:X$$x+x++xx+x++xxxxX$X$$$$$Xx++++++.   
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&Xx++++xxxX$$&&&&&&&&&&&&&&&&&&&&&&&&&$$X++x++xx+++xxxXX$$$$$$Xx+++++++.   
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XXX+++++++++xxxXX$$$$$$Xx+++++++x;  
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XX$X++++++++xxxXX$$$$$$x++++++++++; 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$Xxx$$x+++++xxxxX$$$$$$Xx+++++++++++:
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$Xxxx$Xx+++++xxxX$$$$$Xxx++++++++++++
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$Xxxxx$$x++++xXX$$$$$$Xxx+++++x+++++:
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&XXxxxxX$x+++xXXxxXXxxxxxx+;+xx++++; 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XXxxxxxXXXXXxxxxXXXxx++++++xx++++: 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$XXXX$$$$$Xxx++xxxxxxx+++++xXxx++. 
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$$$Xx++++xxXXxxx++x+xXXxx:  
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$$$Xxx+xxxxxxxxxxxXXXXx    
     &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&$$$$$$$$$$$XxxxxxxxxxxXxxXXx+.     
    
    这些是HTML代码，真没啥好看的 - 杰
    
-->


<!-- 
conda换源：
conda config --show channels
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

pip换源：
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
-->


<!DOCTYPE html>
<html lang="zh-CN" color-mode="light">

<head>
  <meta charset="utf-8">
  <!-- <meta name="viewport" content="width=device-width, initial-scale=1" /> -->
  <meta name="viewport" content="width=device-width, initial-scale=0.8, maximum-scale=1, user-scalable=no">

  
  <meta name="author" content="杰" />
  <meta name="description" content="" />
  
  
  <title>
    
      实验：Unet道路分割 
      
      
      |
    
     人工智能小站站
  </title>

  
    <link rel="apple-touch-icon" href="/images/favicon.png">
    <link rel="icon" href="/images/favicon.png">
  

  <!-- Raleway-Font -->
  <!-- <link href="https://fonts.googleapis.com/css?family=Raleway&display=swap" rel="stylesheet"> -->

  <!-- hexo site css -->
  <link rel="stylesheet" href="/css/main.css" />
  <link rel="stylesheet" href="//at.alicdn.com/t/font_1886449_67xjft27j1l.css" />

  <!-- <style>
    @font-face {
      font-family: 'NotoSansSC';
      src: url('https://pub-0a02c629549c4638b41011dd3ce66f6a.r2.dev/NotoSansSC-Regular.ttf') format('truetype');
    }

    body {
      font-family: NotoSansSC,sans-serif;
    }
  </style> -->

  <!-- 代码块风格 -->
  

  <!-- jquery3.3.1 -->
  
    <script defer type="text/javascript" src="/plugins/jquery.min.js"></script>
  

  <!-- fancybox -->
  
    <link href="/plugins/jquery.fancybox.min.css" rel="stylesheet">
    <script defer type="text/javascript" src="/plugins/jquery.fancybox.min.js"></script>
  
  
<script src="/js/fancybox.js"></script>


  <script>
    var html = document.documentElement
    const colorMode = localStorage.getItem('color-mode')
    if (colorMode) {
      document.documentElement.setAttribute('color-mode', colorMode)
    }
  </script>
<!-- hexo injector head_end start -->
<link rel="stylesheet" href="/plugins/katex/dist/katex.min.css">

<link rel="stylesheet" href="/plugins/hexo-math/dist/style.css">
<!-- hexo injector head_end end --><meta name="generator" content="Hexo 7.3.0"></head>


  <body>
    <div id="app">
      <div class="header">
  <div class="avatar">
    <a href="/">
      <!-- 头像取消懒加载，添加no-lazy -->
      
        <img src="/images/avatar.webp" alt="">
      
    </a>
    <div class="nickname"><a href="/">hahaha.love 个人学习笔记</a></div>
  </div>
  <div class="navbar">
    <ul>
      
        <li class="nav-item" data-path="/">
          <a href="/">首页</a>
        </li>
      
        <li class="nav-item" data-path="/tags/编程语言/">
          <a href="/tags/编程语言/">编程语言</a>
        </li>
      
        <li class="nav-item" data-path="/archives/">
          <a href="/archives/">日期归档</a>
        </li>
      
        <li class="nav-item" data-path="/tags/">
          <a href="/tags/">标签</a>
        </li>
      
        <li class="nav-item" data-path="/life/">
          <a href="/life/">生活</a>
        </li>
      
        <li class="nav-item" data-path="/software/">
          <a href="/software/">软件下载</a>
        </li>
      
        <li class="nav-item" data-path="/about/">
          <a href="/about/">关于我</a>
        </li>
      
    </ul>
  </div>
</div>


<script src="/js/activeNav.js"></script>


        <div class="flex-container">
          <!-- 文章详情页，展示文章具体内容，url形式：https://yoursite/文章标题/ -->
<!-- 同时为「标签tag」，「朋友friend」，「分类categories」，「关于about」页面的承载页面，具体展示取决于page.type -->


  <!-- LaTex Display -->

  
    <script async type="text/javascript" src="/plugins/mathjax/tex-chtml.js"></script>
  
  <script>
    MathJax = {
      tex: {
        inlineMath: [['$', '$'], ['\\(', '\\)']]
      }
    }
  </script>


        <!-- clipboard -->

  
    <script async type="text/javascript" src="/plugins/clipboard.min.js"></script>
  
  
<script src="/js/codeCopy.js"></script>


                                  <!-- 文章内容页 url形式：https://yoursite/文章标题/ -->
                                  <div class="container post-details" id="post-details">
                                    <div class="post-content">
                                      <div class="post-title">实验：Unet道路分割</div>
                                      <div class="post-attach">
                                        <span class="post-pubtime">
                                          <i class="iconfont icon-updatetime mr-10" title="更新时间"></i>
                                          2024-10-22 14:52:45
                                        </span>
                                        
                                          <span class="post-tags">
                                            <i class="iconfont icon-tags mr-10" title="标签"></i>
                                            
                                              <span class="span--tag mr-8">
                                                <a href="/tags/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/" title="人工智能">
                                                  #人工智能
                                                </a>
                                              </span>
                                              
                                              <span class="span--tag mr-8">
                                                <a href="/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/" title="机器学习">
                                                  #机器学习
                                                </a>
                                              </span>
                                              
                                          </span>
                                          
                                      </div>
                                      <div class="markdown-body">
                                        <h1 id="实验：Unet道路分割"><a href="#实验：Unet道路分割" class="headerlink" title="实验：Unet道路分割"></a>实验：Unet道路分割</h1><h2 id="Unet网络模型介绍："><a href="#Unet网络模型介绍：" class="headerlink" title="Unet网络模型介绍："></a>Unet网络模型介绍：</h2><p><img src="/images/Unet%E9%81%93%E8%B7%AF%E5%88%86%E5%89%B2/assets/1_f7YOaE4TWubwaFF7Z1fzNw.png" alt="UNet — Line by Line Explanation. Example UNet Implementation | by Jeremy  Zhang | Towards Data Science"></p>
<p>Unet（U-Net）是一种用于图像分割任务的深度学习模型架构，它在医学图像分割等领域广泛应用。这个架构的名称“U-Net”是因为它的网络结构外观类似字母“U”。</p>
<p>U-Net 最初是为了解决生物医学图像分割问题而提出的，尤其是对细胞图像进行精确分割。它的独特之处在于它将卷积神经网络（CNN）的编码器（捕捉图像特征）和解码器（生成分割结果）结合在一起，形成了一个对称的结构。这种结构使 U-Net 在保留图像上下文信息的同时，能够准确地捕捉不同尺度的特征。</p>
<p>U-Net 的主要组成部分包括：</p>
<ol>
<li><strong>编码器（Encoder）</strong>：编码器部分通常由一系列的卷积层和池化层组成，用来逐步提取图像中的特征。这些特征在不同的层级上表示不同的抽象程度，从低级特征（如边缘）到高级特征（如纹理和形状）。</li>
<li><strong>跳跃连接（Skip Connections）</strong>：这是 U-Net 的一个关键特点。在编码器的每一层之后，会添加一个连接，将相应分辨率的特征图与解码器的对应层连接起来。这样做有助于传递更详细的信息给解码器，帮助它更好地还原细节。</li>
<li><strong>解码器（Decoder）</strong>：解码器部分也由一系列的卷积层和上采样（反池化）层组成，用来将编码器提取的特征重新映射到原始图像尺寸，并生成分割结果。跳跃连接帮助解码器在生成分割时融合不同层级的信息。</li>
<li><strong>最后的卷积层</strong>：解码器的最后一层使用卷积层来生成最终的分割图像，通常使用适当的激活函数（如 sigmoid 或 softmax）来产生像素级的预测。</li>
</ol>
<h1 id="数据集划分"><a href="#数据集划分" class="headerlink" title="数据集划分"></a>数据集划分</h1><p>将数据集分为训练集、验证集和测试集是在机器学习和深度学习中常见的做法，其主要目的是评估模型的性能并进行泛化能力的估计。这种分割有助于模型的开发和优化过程，以及避免过拟合（在训练数据上表现良好，但在新数据上表现糟糕）的问题。</p>
<p>以下是每个集合的主要目的：</p>
<ol>
<li><strong>训练集（Training Set）</strong>： 训练集是模型用来学习和调整参数的数据集。模型在训练集上进行多轮迭代，逐渐调整自己的权重和偏差，以最小化损失函数。模型在训练集上的表现会逐步提升，但这并不一定代表它在未见过的数据上也会表现良好。</li>
<li><strong>验证集（Validation Set）</strong>： 验证集用于调整模型的超参数（如学习率、正则化参数等），以优化模型的性能。在训练过程中，通过在验证集上进行评估，可以监控模型在未见过数据上的表现。如果模型在训练集上表现得很好，但在验证集上表现较差，可能出现了过拟合的情况。根据验证集的表现，可以进行超参数的调整，以达到更好的泛化性能。</li>
<li><strong>测试集（Test Set）</strong>： 测试集是用来评估模型在真实世界数据上的性能的数据集。测试集是模型完全没有见过的数据，用于最终评估模型的泛化能力。测试集的结果可以提供关于模型在真实情况下的性能指标，帮助判断模型是否足够好，是否适合部署到实际应用中。</li>
</ol>
<p>通过将数据集分为训练集、验证集和测试集，可以更好地监控模型的表现、避免过拟合，并获得关于模型泛化性能的可靠估计。分割数据集还有助于在模型的开发过程中进行迭代和改进，以构建更准确、鲁棒的机器学习模型。</p>
<p>换个说法就是：</p>
<p>当我们训练一个模型时，为了确保它在不同情况下都能表现得好，我们通常把数据分成三份：训练集、验证集和测试集。这就好像是在学习时分成练习、考试前复习和最终考试三个阶段。</p>
<ol>
<li><strong>训练集</strong>：就像练习题一样，模型通过在训练集上学习，逐渐调整自己的能力。它会试着找到规律，让自己在练习上做得越来越好。</li>
<li><strong>验证集</strong>：想象一下在考试前的复习。我们用验证集来调整模型的“策略”，比如要不要在解题中使用哪些方法，或者要不要调整学习的速度。这样，我们可以更好地准备模型应对真正的考试，也就是测试集。</li>
<li><strong>测试集</strong>：就是最终考试。测试集包含了模型完全没有见过的问题，这样我们就可以看看模型在真实情况下的表现如何。这个阶段能告诉我们模型是否真的学得很好，能不能应对新的问题。</li>
</ol>
<p>所以，分成这三部分有助于我们监控模型的学习过程，防止它只是死记硬背了训练集上的题目。同时，它也能让我们调整模型，确保它在各种情况下都能有好的表现。最后，通过测试集，我们能判断模型是否准备好面对真实世界中的挑战。</p>
<h1 id="道路分割实验："><a href="#道路分割实验：" class="headerlink" title="道路分割实验："></a>道路分割实验：</h1><h2 id="1、数据处理"><a href="#1、数据处理" class="headerlink" title="1、数据处理"></a>1、数据处理</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br><span class="line">46</span><br><span class="line">47</span><br><span class="line">48</span><br><span class="line">49</span><br><span class="line">50</span><br><span class="line">51</span><br><span class="line">52</span><br><span class="line">53</span><br><span class="line">54</span><br><span class="line">55</span><br><span class="line">56</span><br><span class="line">57</span><br><span class="line">58</span><br><span class="line">59</span><br><span class="line">60</span><br><span class="line">61</span><br><span class="line">62</span><br><span class="line">63</span><br><span class="line">64</span><br><span class="line">65</span><br><span class="line">66</span><br><span class="line">67</span><br><span class="line">68</span><br><span class="line">69</span><br><span class="line">70</span><br><span class="line">71</span><br><span class="line">72</span><br><span class="line">73</span><br><span class="line">74</span><br><span class="line">75</span><br><span class="line">76</span><br><span class="line">77</span><br><span class="line">78</span><br><span class="line">79</span><br><span class="line">80</span><br><span class="line">81</span><br><span class="line">82</span><br><span class="line">83</span><br><span class="line">84</span><br><span class="line">85</span><br><span class="line">86</span><br><span class="line">87</span><br><span class="line">88</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> os</span><br><span class="line"><span class="keyword">import</span> cv2</span><br><span class="line"></span><br><span class="line"><span class="comment"># 构建新数据集的文件夹</span></span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/train/LABEL&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/train/SIGHT&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/train/LABEL_IMAGE&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/test/LABEL&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/test/SIGHT&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/test/LABEL_IMAGE&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/predict/LABEL&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/predict/SIGHT&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line">os.makedirs(<span class="string">&#x27;./UAS_NEW/predict/LABEL_IMAGE&#x27;</span>, exist_ok=<span class="literal">True</span>)</span><br><span class="line"></span><br><span class="line">IMAGE_SIZE = (<span class="number">224</span>, <span class="number">224</span>)</span><br><span class="line"></span><br><span class="line"><span class="comment">#遍历原始数据对图片进行压缩并分类</span></span><br><span class="line"><span class="keyword">for</span> dirname1 <span class="keyword">in</span> os.listdir(<span class="string">&#x27;./UAS&#x27;</span>):</span><br><span class="line">    image_path = <span class="string">&#x27;./UAS/&#x27;</span>+dirname1</span><br><span class="line">    <span class="keyword">for</span> dirname2 <span class="keyword">in</span> os.listdir(image_path):</span><br><span class="line">        <span class="keyword">if</span> dirname2 == <span class="string">&#x27;train&#x27;</span>:</span><br><span class="line">            image_path2 = image_path +<span class="string">&#x27;/train&#x27;</span></span><br><span class="line">            <span class="keyword">for</span> filename <span class="keyword">in</span> os.listdir(image_path2):</span><br><span class="line">                <span class="keyword">if</span> <span class="string">&#x27;jpg&#x27;</span> <span class="keyword">in</span> filename:</span><br><span class="line">                    <span class="keyword">if</span> <span class="built_in">int</span>(filename.split(<span class="string">&#x27;.&#x27;</span>)[<span class="number">0</span>].split(<span class="string">&#x27;t&#x27;</span>)[-<span class="number">1</span>])%<span class="number">9</span>!=<span class="number">1</span>:</span><br><span class="line">                        sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                        pic = cv2.imread(sight_path)</span><br><span class="line">                        pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                        cv2.imwrite(<span class="string">&#x27;./UAS_NEW/train/SIGHT/&#x27;</span>+filename,pic)</span><br><span class="line">                    <span class="keyword">else</span>:</span><br><span class="line">                        sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                        pic = cv2.imread(sight_path)</span><br><span class="line">                        pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                        cv2.imwrite(<span class="string">&#x27;./UAS_NEW/predict/SIGHT/&#x27;</span>+filename,pic)</span><br><span class="line">                <span class="keyword">elif</span> <span class="string">&#x27;Graph&#x27;</span> <span class="keyword">in</span> filename:</span><br><span class="line">                    <span class="keyword">if</span> <span class="built_in">int</span>(filename.split(<span class="string">&#x27;.&#x27;</span>)[<span class="number">0</span>].split(<span class="string">&#x27;h&#x27;</span>)[-<span class="number">1</span>])%<span class="number">9</span>!=<span class="number">1</span>:</span><br><span class="line">                        sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                        pic = cv2.imread(sight_path)</span><br><span class="line">                        pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                        cv2.imwrite(<span class="string">&#x27;./UAS_NEW/train/LABEL_IMAGE/&#x27;</span>+filename,pic)</span><br><span class="line">                    <span class="keyword">else</span>:</span><br><span class="line">                        sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                        pic = cv2.imread(sight_path)</span><br><span class="line">                        pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                        cv2.imwrite(<span class="string">&#x27;./UAS_NEW/predict/LABEL_IMAGE/&#x27;</span>+filename,pic)</span><br><span class="line">                <span class="keyword">else</span>:</span><br><span class="line">                    <span class="keyword">if</span> <span class="built_in">int</span>(filename.split(<span class="string">&#x27;.&#x27;</span>)[<span class="number">0</span>].split(<span class="string">&#x27;l&#x27;</span>)[-<span class="number">1</span>])%<span class="number">9</span>!=<span class="number">1</span>:</span><br><span class="line">                        sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                        pic = cv2.imread(sight_path)</span><br><span class="line">                        pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                        cv2.imwrite(<span class="string">&#x27;./UAS_NEW/train/LABEL/&#x27;</span>+filename,pic)</span><br><span class="line">                    <span class="keyword">else</span>:</span><br><span class="line">                        sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                        pic = cv2.imread(sight_path)</span><br><span class="line">                        pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                        cv2.imwrite(<span class="string">&#x27;./UAS_NEW/predict/LABEL/&#x27;</span>+filename,pic)</span><br><span class="line">        <span class="keyword">else</span>:</span><br><span class="line">            image_path2 = image_path +<span class="string">&#x27;/test&#x27;</span></span><br><span class="line">            <span class="keyword">for</span> filename <span class="keyword">in</span> os.listdir(image_path2):</span><br><span class="line">                <span class="keyword">if</span> <span class="string">&#x27;jpg&#x27;</span> <span class="keyword">in</span> filename:</span><br><span class="line">                    sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                    pic = cv2.imread(sight_path)</span><br><span class="line">                    pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                    cv2.imwrite(<span class="string">&#x27;./UAS_NEW/test/SIGHT/&#x27;</span>+filename,pic)</span><br><span class="line">                <span class="keyword">elif</span> <span class="string">&#x27;Graph&#x27;</span> <span class="keyword">in</span> filename:</span><br><span class="line">                    sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                    pic = cv2.imread(sight_path)</span><br><span class="line">                    pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                    cv2.imwrite(<span class="string">&#x27;./UAS_NEW/test/LABEL_IMAGE/&#x27;</span>+filename,pic)</span><br><span class="line">                <span class="keyword">else</span>:</span><br><span class="line">                    sight_path = image_path2+<span class="string">&#x27;/&#x27;</span>+filename</span><br><span class="line">                    pic = cv2.imread(sight_path)</span><br><span class="line">                    pic = cv2.resize(pic, IMAGE_SIZE)</span><br><span class="line">                    cv2.imwrite(<span class="string">&#x27;./UAS_NEW/test/LABEL/&#x27;</span>+filename,pic)</span><br><span class="line"></span><br><span class="line"><span class="keyword">def</span> <span class="title function_">CollectImgName</span>(<span class="params">filepath, output</span>):</span><br><span class="line">    images = <span class="built_in">sorted</span>(os.listdir(filepath + <span class="string">&#x27;/SIGHT&#x27;</span>))</span><br><span class="line">    labels = <span class="built_in">sorted</span>(os.listdir(filepath + <span class="string">&#x27;/LABEL&#x27;</span>))</span><br><span class="line">    label_images = <span class="built_in">sorted</span>(os.listdir(filepath + <span class="string">&#x27;/LABEL_IMAGE&#x27;</span>))</span><br><span class="line"></span><br><span class="line">    <span class="keyword">with</span> <span class="built_in">open</span>(output, <span class="string">&#x27;w&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">        <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="built_in">len</span>(images)):</span><br><span class="line">            f.write(filepath + <span class="string">&#x27;/SIGHT/&#x27;</span> + images[i] + <span class="string">&#x27;\t&#x27;</span> + filepath + <span class="string">&#x27;/LABEL/&#x27;</span> + labels[i] + <span class="string">&#x27;\t&#x27;</span> + filepath + <span class="string">&#x27;/LABEL_IMAGE/&#x27;</span> + label_images[i] + <span class="string">&#x27;\n&#x27;</span>)</span><br><span class="line"></span><br><span class="line">CollectImgName(<span class="string">&#x27;UAS_NEW/train&#x27;</span>, <span class="string">&#x27;./train.txt&#x27;</span>)</span><br><span class="line">CollectImgName(<span class="string">&#x27;UAS_NEW/test&#x27;</span>, <span class="string">&#x27;./test.txt&#x27;</span>)</span><br><span class="line">CollectImgName(<span class="string">&#x27;UAS_NEW/predict&#x27;</span>, <span class="string">&#x27;./predict.txt&#x27;</span>)</span><br><span class="line"></span><br></pre></td></tr></table></figure>


<h2 id="2、抽样检查"><a href="#2、抽样检查" class="headerlink" title="2、抽样检查"></a>2、抽样检查</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> numpy <span class="keyword">as</span> np</span><br><span class="line"><span class="keyword">import</span> matplotlib.pyplot <span class="keyword">as</span> plt</span><br><span class="line"><span class="keyword">from</span> PIL <span class="keyword">import</span> Image <span class="keyword">as</span> PilImage</span><br><span class="line"></span><br><span class="line"><span class="keyword">with</span> <span class="built_in">open</span>(<span class="string">&#x27;./train.txt&#x27;</span>, <span class="string">&#x27;r&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">    i = <span class="number">0</span></span><br><span class="line">    <span class="keyword">for</span> line <span class="keyword">in</span> f.readlines():</span><br><span class="line">        image_path, label_path, label_image_path = line.strip().split(<span class="string">&#x27;\t&#x27;</span>)</span><br><span class="line">        image = np.array(PilImage.<span class="built_in">open</span>(image_path))</span><br><span class="line">        label = np.array(PilImage.<span class="built_in">open</span>(label_path))</span><br><span class="line">        label_image = np.array(PilImage.<span class="built_in">open</span>(label_image_path))</span><br><span class="line"></span><br><span class="line">        <span class="keyword">if</span> i &gt; <span class="number">2</span>:</span><br><span class="line">            <span class="keyword">break</span></span><br><span class="line"></span><br><span class="line">        <span class="comment"># 进行图片的展示</span></span><br><span class="line">        plt.figure()</span><br><span class="line"></span><br><span class="line">        plt.subplot(<span class="number">1</span>, <span class="number">3</span>, <span class="number">1</span>),</span><br><span class="line">        plt.title(<span class="string">&#x27;Train Image&#x27;</span>)</span><br><span class="line">        plt.imshow(image.astype(<span class="string">&#x27;uint8&#x27;</span>))</span><br><span class="line">        plt.axis(<span class="string">&#x27;off&#x27;</span>)</span><br><span class="line"></span><br><span class="line">        plt.subplot(<span class="number">1</span>, <span class="number">3</span>, <span class="number">2</span>),</span><br><span class="line">        plt.title(<span class="string">&#x27;Label&#x27;</span>)</span><br><span class="line">        plt.imshow(label.astype(<span class="string">&#x27;uint8&#x27;</span>), cmap=<span class="string">&#x27;gray&#x27;</span>)</span><br><span class="line">        plt.axis(<span class="string">&#x27;off&#x27;</span>)</span><br><span class="line"></span><br><span class="line">        plt.subplot(<span class="number">1</span>, <span class="number">3</span>, <span class="number">3</span>),</span><br><span class="line">        plt.title(<span class="string">&#x27;Label Image&#x27;</span>)</span><br><span class="line">        plt.imshow(label_image.astype(<span class="string">&#x27;uint8&#x27;</span>))</span><br><span class="line">        plt.axis(<span class="string">&#x27;off&#x27;</span>)</span><br><span class="line"></span><br><span class="line">        plt.show()</span><br><span class="line">        i = i + <span class="number">1</span></span><br></pre></td></tr></table></figure>


<h2 id="3、构建Unet模型网络-编码器"><a href="#3、构建Unet模型网络-编码器" class="headerlink" title="3、构建Unet模型网络-编码器"></a>3、构建Unet模型网络-编码器</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> paddle</span><br><span class="line"></span><br><span class="line"><span class="comment"># 编码器</span></span><br><span class="line"><span class="keyword">class</span> <span class="title class_">Encoder</span>(paddle.nn.Layer):</span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__init__</span>(<span class="params">self, in_channels, out_channels</span>):</span><br><span class="line">        <span class="built_in">super</span>(Encoder, self).__init__()</span><br><span class="line"></span><br><span class="line">        self.relus = paddle.nn.LayerList(</span><br><span class="line">            [paddle.nn.ReLU() <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="number">2</span>)])</span><br><span class="line">        self.separable_conv_01 = paddle.nn.Conv2D(in_channels,</span><br><span class="line">                                                  out_channels,</span><br><span class="line">                                                  kernel_size=<span class="number">3</span>,</span><br><span class="line">                                                  padding=<span class="string">&#x27;same&#x27;</span>)</span><br><span class="line">        self.bns = paddle.nn.LayerList(</span><br><span class="line">            [paddle.nn.BatchNorm2D(out_channels) <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="number">2</span>)])</span><br><span class="line"></span><br><span class="line">        self.separable_conv_02 = paddle.nn.Conv2D(out_channels,</span><br><span class="line">                                                  out_channels,</span><br><span class="line">                                                  kernel_size=<span class="number">3</span>,</span><br><span class="line">                                                  padding=<span class="string">&#x27;same&#x27;</span>)</span><br><span class="line">        self.pool = paddle.nn.MaxPool2D(kernel_size=<span class="number">3</span>, stride=<span class="number">2</span>, padding=<span class="number">1</span>)</span><br><span class="line">        self.residual_conv = paddle.nn.Conv2D(in_channels,</span><br><span class="line">                                              out_channels,</span><br><span class="line">                                              kernel_size=<span class="number">1</span>,</span><br><span class="line">                                              stride=<span class="number">2</span>,</span><br><span class="line">                                              padding=<span class="string">&#x27;same&#x27;</span>)</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">forward</span>(<span class="params">self, inputs</span>):</span><br><span class="line">        previous_block_activation = inputs</span><br><span class="line"></span><br><span class="line">        y = self.relus[<span class="number">0</span>](inputs)</span><br><span class="line">        y = self.separable_conv_01(y)</span><br><span class="line">        y = self.bns[<span class="number">0</span>](y)</span><br><span class="line">        y = self.relus[<span class="number">1</span>](y)</span><br><span class="line">        y = self.separable_conv_02(y)</span><br><span class="line">        y = self.bns[<span class="number">1</span>](y)</span><br><span class="line">        y = self.pool(y)</span><br><span class="line"></span><br><span class="line">        residual = self.residual_conv(previous_block_activation)</span><br><span class="line">        y = paddle.add(y, residual)</span><br><span class="line"></span><br><span class="line">        <span class="keyword">return</span> y</span><br></pre></td></tr></table></figure>


<h2 id="4、构建Unet模型网络-解码器"><a href="#4、构建Unet模型网络-解码器" class="headerlink" title="4、构建Unet模型网络-解码器"></a>4、构建Unet模型网络-解码器</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> paddle</span><br><span class="line"></span><br><span class="line"><span class="comment"># 解码器</span></span><br><span class="line"><span class="keyword">class</span> <span class="title class_">Decoder</span>(paddle.nn.Layer):</span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__init__</span>(<span class="params">self, in_channels, out_channels</span>):</span><br><span class="line">        <span class="built_in">super</span>(Decoder, self).__init__()</span><br><span class="line"></span><br><span class="line">        self.relus = paddle.nn.LayerList(</span><br><span class="line">            [paddle.nn.ReLU() <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="number">2</span>)])</span><br><span class="line">        self.conv_transpose_01 = paddle.nn.Conv2DTranspose(in_channels,</span><br><span class="line">                                                           out_channels,</span><br><span class="line">                                                           kernel_size=<span class="number">3</span>,</span><br><span class="line">                                                           padding=<span class="number">1</span>)</span><br><span class="line">        self.conv_transpose_02 = paddle.nn.Conv2DTranspose(out_channels,</span><br><span class="line">                                                           out_channels,</span><br><span class="line">                                                           kernel_size=<span class="number">3</span>,</span><br><span class="line">                                                           padding=<span class="number">1</span>)</span><br><span class="line">        self.bns = paddle.nn.LayerList(</span><br><span class="line">            [paddle.nn.BatchNorm2D(out_channels) <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="number">2</span>)]</span><br><span class="line">        )</span><br><span class="line">        self.upsamples = paddle.nn.LayerList(</span><br><span class="line">            [paddle.nn.Upsample(scale_factor=<span class="number">2.0</span>) <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="number">2</span>)]</span><br><span class="line">        )</span><br><span class="line">        self.residual_conv = paddle.nn.Conv2D(in_channels,</span><br><span class="line">                                              out_channels,</span><br><span class="line">                                              kernel_size=<span class="number">1</span>,</span><br><span class="line">                                              padding=<span class="string">&#x27;same&#x27;</span>)</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">forward</span>(<span class="params">self, inputs</span>):</span><br><span class="line">        previous_block_activation = inputs</span><br><span class="line"></span><br><span class="line">        y = self.relus[<span class="number">0</span>](inputs)</span><br><span class="line">        y = self.conv_transpose_01(y)</span><br><span class="line">        y = self.bns[<span class="number">0</span>](y)</span><br><span class="line">        y = self.relus[<span class="number">1</span>](y)</span><br><span class="line">        y = self.conv_transpose_02(y)</span><br><span class="line">        y = self.bns[<span class="number">1</span>](y)</span><br><span class="line">        y = self.upsamples[<span class="number">0</span>](y)</span><br><span class="line"></span><br><span class="line">        residual = self.upsamples[<span class="number">1</span>](previous_block_activation)</span><br><span class="line">        residual = self.residual_conv(residual)</span><br><span class="line"></span><br><span class="line">        y = paddle.add(y, residual)</span><br><span class="line"></span><br><span class="line">        <span class="keyword">return</span> y</span><br></pre></td></tr></table></figure>


<h2 id="6、构建Unet模型网络"><a href="#6、构建Unet模型网络" class="headerlink" title="6、构建Unet模型网络"></a>6、构建Unet模型网络</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br><span class="line">46</span><br><span class="line">47</span><br><span class="line">48</span><br><span class="line">49</span><br><span class="line">50</span><br><span class="line">51</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> paddle</span><br><span class="line"><span class="keyword">from</span> Library.Encoder <span class="keyword">import</span> Encoder</span><br><span class="line"><span class="keyword">from</span> Library.Decoder <span class="keyword">import</span> Decoder</span><br><span class="line"></span><br><span class="line"><span class="comment"># 网络</span></span><br><span class="line"><span class="keyword">class</span> <span class="title class_">RoadNet</span>(paddle.nn.Layer):</span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__init__</span>(<span class="params">self, num_classes</span>):</span><br><span class="line">        <span class="built_in">super</span>(RoadNet, self).__init__()</span><br><span class="line"></span><br><span class="line">        self.conv_1 = paddle.nn.Conv2D(<span class="number">3</span>, <span class="number">32</span>,</span><br><span class="line">                                       kernel_size=<span class="number">3</span>,</span><br><span class="line">                                       stride=<span class="number">2</span>,</span><br><span class="line">                                       padding=<span class="string">&#x27;same&#x27;</span>)</span><br><span class="line">        self.bn = paddle.nn.BatchNorm2D(<span class="number">32</span>)</span><br><span class="line">        self.relu = paddle.nn.ReLU()</span><br><span class="line"></span><br><span class="line">        in_channels = <span class="number">32</span></span><br><span class="line">        self.encoders = []</span><br><span class="line">        self.encoder_list = [<span class="number">64</span>, <span class="number">128</span>, <span class="number">256</span>]</span><br><span class="line">        self.decoder_list = [<span class="number">256</span>, <span class="number">128</span>, <span class="number">64</span>, <span class="number">32</span>]</span><br><span class="line"></span><br><span class="line">        <span class="comment"># 根据下采样个数和配置循环定义子Layer，避免重复写一样的程序</span></span><br><span class="line">        <span class="keyword">for</span> out_channels <span class="keyword">in</span> self.encoder_list:</span><br><span class="line">            block = self.add_sublayer(<span class="string">&#x27;encoder_&#123;&#125;&#x27;</span>.<span class="built_in">format</span>(out_channels), Encoder(in_channels, out_channels))</span><br><span class="line">            self.encoders.append(block)</span><br><span class="line">            in_channels = out_channels</span><br><span class="line"></span><br><span class="line">        self.decoders = []</span><br><span class="line"></span><br><span class="line">        <span class="comment"># 根据上采样个数和配置循环定义子Layer，避免重复写一样的程序</span></span><br><span class="line">        <span class="keyword">for</span> out_channels <span class="keyword">in</span> self.decoder_list:</span><br><span class="line">            block = self.add_sublayer(<span class="string">&#x27;decoder_&#123;&#125;&#x27;</span>.<span class="built_in">format</span>(out_channels), Decoder(in_channels, out_channels))</span><br><span class="line">            self.decoders.append(block)</span><br><span class="line">            in_channels = out_channels</span><br><span class="line"></span><br><span class="line">        self.output_conv = paddle.nn.Conv2D(in_channels,</span><br><span class="line">                                            num_classes,</span><br><span class="line">                                            kernel_size=<span class="number">3</span>,</span><br><span class="line">                                            padding=<span class="string">&#x27;same&#x27;</span>)</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">forward</span>(<span class="params">self, inputs</span>):</span><br><span class="line">        y = self.conv_1(inputs)</span><br><span class="line">        y = self.bn(y)</span><br><span class="line">        y = self.relu(y)</span><br><span class="line">        <span class="keyword">for</span> encoder <span class="keyword">in</span> self.encoders:</span><br><span class="line">            y = encoder(y)</span><br><span class="line">        <span class="keyword">for</span> decoder <span class="keyword">in</span> self.decoders:</span><br><span class="line">            y = decoder(y)</span><br><span class="line">        y = self.output_conv(y)</span><br><span class="line">        <span class="keyword">return</span> y</span><br><span class="line"></span><br></pre></td></tr></table></figure>


<h2 id="7、训练集读取器"><a href="#7、训练集读取器" class="headerlink" title="7、训练集读取器"></a>7、训练集读取器</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br><span class="line">46</span><br><span class="line">47</span><br><span class="line">48</span><br><span class="line">49</span><br><span class="line">50</span><br><span class="line">51</span><br><span class="line">52</span><br><span class="line">53</span><br><span class="line">54</span><br><span class="line">55</span><br><span class="line">56</span><br><span class="line">57</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> paddle.io <span class="keyword">import</span> Dataset</span><br><span class="line"><span class="keyword">from</span> paddle.vision.transforms <span class="keyword">import</span> transforms <span class="keyword">as</span> T</span><br><span class="line"><span class="keyword">from</span> PIL <span class="keyword">import</span> Image <span class="keyword">as</span> PilImage</span><br><span class="line"><span class="keyword">import</span> numpy <span class="keyword">as</span> np</span><br><span class="line"><span class="keyword">import</span> io</span><br><span class="line"></span><br><span class="line">IMAGE_SIZE = (<span class="number">224</span>, <span class="number">224</span>)</span><br><span class="line"></span><br><span class="line"><span class="keyword">class</span> <span class="title class_">PredictDataset</span>(<span class="title class_ inherited__">Dataset</span>):</span><br><span class="line">    <span class="comment"># 数据集定义</span></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__init__</span>(<span class="params">self, mode=<span class="string">&#x27;train&#x27;</span></span>):</span><br><span class="line">        <span class="comment"># 构造函数</span></span><br><span class="line">        self.image_size = IMAGE_SIZE</span><br><span class="line">        self.mode = mode.lower()</span><br><span class="line">        self.train_images = []</span><br><span class="line"></span><br><span class="line">        <span class="keyword">with</span> <span class="built_in">open</span>(<span class="string">&#x27;./&#123;&#125;.txt&#x27;</span>.<span class="built_in">format</span>(self.mode), <span class="string">&#x27;r&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">            <span class="keyword">for</span> line <span class="keyword">in</span> f.readlines():</span><br><span class="line">                image = line.strip().split(<span class="string">&#x27;\t&#x27;</span>)[<span class="number">0</span>]</span><br><span class="line">                self.train_images.append(image)</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">_load_img</span>(<span class="params">self, path, color_mode=<span class="string">&#x27;rgb&#x27;</span>, transforms=[]</span>):</span><br><span class="line">        <span class="comment"># 统一的图像处理接口封装，用于规整图像大小和通道</span></span><br><span class="line">        <span class="keyword">with</span> <span class="built_in">open</span>(path, <span class="string">&#x27;rb&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">            img = PilImage.<span class="built_in">open</span>(io.BytesIO(f.read()))</span><br><span class="line">            <span class="keyword">if</span> color_mode == <span class="string">&#x27;grayscale&#x27;</span>:</span><br><span class="line">                <span class="comment"># if image is not already an 8-bit, 16-bit or 32-bit grayscale image</span></span><br><span class="line">                <span class="comment"># convert it to an 8-bit grayscale image.</span></span><br><span class="line">                <span class="keyword">if</span> img.mode <span class="keyword">not</span> <span class="keyword">in</span> (<span class="string">&#x27;L&#x27;</span>, <span class="string">&#x27;I;16&#x27;</span>, <span class="string">&#x27;I&#x27;</span>):</span><br><span class="line">                    img = img.convert(<span class="string">&#x27;L&#x27;</span>)</span><br><span class="line">            <span class="keyword">elif</span> color_mode == <span class="string">&#x27;rgba&#x27;</span>:</span><br><span class="line">                <span class="keyword">if</span> img.mode != <span class="string">&#x27;RGBA&#x27;</span>:</span><br><span class="line">                    img = img.convert(<span class="string">&#x27;RGBA&#x27;</span>)</span><br><span class="line">            <span class="keyword">elif</span> color_mode == <span class="string">&#x27;rgb&#x27;</span>:</span><br><span class="line">                <span class="keyword">if</span> img.mode != <span class="string">&#x27;RGB&#x27;</span>:</span><br><span class="line">                    img = img.convert(<span class="string">&#x27;RGB&#x27;</span>)</span><br><span class="line">            <span class="keyword">else</span>:</span><br><span class="line">                <span class="keyword">raise</span> ValueError(<span class="string">&#x27;color_mode must be &quot;grayscale&quot;, &quot;rgb&quot;, or &quot;rgba&quot;&#x27;</span>)</span><br><span class="line"></span><br><span class="line">            <span class="keyword">return</span> T.Compose([</span><br><span class="line">                                 T.Resize(self.image_size)</span><br><span class="line">                             ] + transforms)(img)</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__getitem__</span>(<span class="params">self, idx</span>):</span><br><span class="line">        <span class="comment"># 返回 image</span></span><br><span class="line">        train_image = self._load_img(self.train_images[idx],</span><br><span class="line">                                     transforms=[</span><br><span class="line">                                         T.Transpose(),</span><br><span class="line">                                         T.Normalize(mean=<span class="number">127.5</span>, std=<span class="number">127.5</span>)</span><br><span class="line">                                     ])</span><br><span class="line"></span><br><span class="line">        train_image = np.array(train_image, dtype=<span class="string">&#x27;float32&#x27;</span>)</span><br><span class="line">        <span class="keyword">return</span> train_image</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__len__</span>(<span class="params">self</span>):</span><br><span class="line">        <span class="keyword">return</span> <span class="built_in">len</span>(self.train_images)</span><br><span class="line"></span><br></pre></td></tr></table></figure>


<h2 id="9、训练"><a href="#9、训练" class="headerlink" title="9、训练"></a>9、训练</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> paddle</span><br><span class="line"><span class="keyword">from</span> Library.RoadDataset <span class="keyword">import</span> RoadDataset</span><br><span class="line"><span class="keyword">from</span> Library.RoadNet <span class="keyword">import</span> RoadNet</span><br><span class="line"></span><br><span class="line">num_classes = <span class="number">2</span></span><br><span class="line">IMAGE_SIZE = (<span class="number">224</span>, <span class="number">224</span>)</span><br><span class="line">network = RoadNet(num_classes)</span><br><span class="line">model = paddle.Model(network)</span><br><span class="line"></span><br><span class="line">train_dataset = RoadDataset(mode=<span class="string">&#x27;train&#x27;</span>) <span class="comment"># 训练数据集</span></span><br><span class="line">val_dataset = RoadDataset(mode=<span class="string">&#x27;test&#x27;</span>) <span class="comment"># 验证数据集</span></span><br><span class="line"></span><br><span class="line">optim = paddle.optimizer.RMSProp(learning_rate=<span class="number">0.001</span>,</span><br><span class="line">                                 rho=<span class="number">0.9</span>,</span><br><span class="line">                                 momentum=<span class="number">0.0</span>,</span><br><span class="line">                                 epsilon=<span class="number">1e-07</span>,</span><br><span class="line">                                 centered=<span class="literal">False</span>,</span><br><span class="line">                                 parameters=model.parameters())</span><br><span class="line"></span><br><span class="line">model.prepare(optim, paddle.nn.CrossEntropyLoss(axis=<span class="number">1</span>))</span><br><span class="line"></span><br><span class="line">paddle.set_device(<span class="string">&#x27;gpu&#x27;</span>)</span><br><span class="line">model.fit(train_dataset, val_dataset, epochs=<span class="number">15</span>, batch_size=<span class="number">32</span>, verbose=<span class="number">1</span>, save_dir=<span class="string">&#x27;./work&#x27;</span>)</span><br></pre></td></tr></table></figure>


<h2 id="10、推理"><a href="#10、推理" class="headerlink" title="10、推理"></a>10、推理</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">from</span> Library.RoadDataset <span class="keyword">import</span> RoadDataset</span><br><span class="line"><span class="keyword">from</span> Library.RoadNet <span class="keyword">import</span> RoadNet</span><br><span class="line"><span class="keyword">import</span> paddle</span><br><span class="line"><span class="keyword">import</span> pickle</span><br><span class="line"></span><br><span class="line">num_classes = <span class="number">2</span></span><br><span class="line">IMAGE_SIZE = (<span class="number">224</span>, <span class="number">224</span>)</span><br><span class="line">network = RoadNet(num_classes)</span><br><span class="line">model = paddle.Model(network)</span><br><span class="line">model.load(<span class="string">&quot;./work/final&quot;</span>)</span><br><span class="line">optim = paddle.optimizer.RMSProp(learning_rate=<span class="number">0.001</span>,</span><br><span class="line">                                 rho=<span class="number">0.9</span>,</span><br><span class="line">                                 momentum=<span class="number">0.0</span>,</span><br><span class="line">                                 epsilon=<span class="number">1e-07</span>,</span><br><span class="line">                                 centered=<span class="literal">False</span>,</span><br><span class="line">                                 parameters=model.parameters())</span><br><span class="line"></span><br><span class="line">model.prepare(optim, paddle.nn.CrossEntropyLoss(axis=<span class="number">1</span>))</span><br><span class="line">paddle.set_device(<span class="string">&#x27;gpu&#x27;</span>)</span><br><span class="line"></span><br><span class="line">predict_dataset = RoadDataset(mode=<span class="string">&#x27;predict&#x27;</span>)</span><br><span class="line">predict_results = model.predict(predict_dataset)</span><br><span class="line"></span><br><span class="line"><span class="keyword">with</span> <span class="built_in">open</span>(<span class="string">&quot;./predict_results.txt&quot;</span>, <span class="string">&#x27;wb&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">    result = pickle.dumps(predict_results)</span><br><span class="line">    f.write(result)</span><br><span class="line"></span><br></pre></td></tr></table></figure>


<h2 id="11、推理结果可视化"><a href="#11、推理结果可视化" class="headerlink" title="11、推理结果可视化"></a>11、推理结果可视化</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br><span class="line">46</span><br><span class="line">47</span><br><span class="line">48</span><br><span class="line">49</span><br><span class="line">50</span><br><span class="line">51</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">import</span> matplotlib.pyplot <span class="keyword">as</span> plt</span><br><span class="line"><span class="keyword">import</span> numpy <span class="keyword">as</span> np</span><br><span class="line"><span class="keyword">from</span> PIL <span class="keyword">import</span> Image <span class="keyword">as</span> PilImage</span><br><span class="line"><span class="keyword">from</span> paddle.vision.transforms <span class="keyword">import</span> transforms <span class="keyword">as</span> T</span><br><span class="line"><span class="keyword">import</span> pickle</span><br><span class="line"></span><br><span class="line"><span class="keyword">with</span> <span class="built_in">open</span>(<span class="string">&#x27;./predict_results.txt&#x27;</span>, <span class="string">&#x27;rb&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">    content = f.read()</span><br><span class="line">    predict_results = pickle.loads(content)</span><br><span class="line"></span><br><span class="line">plt.figure(figsize=(<span class="number">10</span>, <span class="number">10</span>))</span><br><span class="line"></span><br><span class="line">i = <span class="number">0</span></span><br><span class="line">mask_idx = <span class="number">0</span></span><br><span class="line">IMAGE_SIZE = (<span class="number">224</span>, <span class="number">224</span>)</span><br><span class="line"><span class="keyword">with</span> <span class="built_in">open</span>(<span class="string">&#x27;./predict.txt&#x27;</span>, <span class="string">&#x27;r&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">    <span class="keyword">for</span> line <span class="keyword">in</span> f.readlines():</span><br><span class="line">        image_path, label_path, label_image_path = line.strip().split(<span class="string">&#x27;\t&#x27;</span>)</span><br><span class="line">        resize_t = T.Compose([</span><br><span class="line">            T.Resize(IMAGE_SIZE)</span><br><span class="line">        ])</span><br><span class="line">        image = resize_t(PilImage.<span class="built_in">open</span>(image_path))</span><br><span class="line">        label = resize_t(PilImage.<span class="built_in">open</span>(label_image_path))</span><br><span class="line"></span><br><span class="line">        image = np.array(image).astype(<span class="string">&#x27;uint8&#x27;</span>)</span><br><span class="line">        label = np.array(label).astype(<span class="string">&#x27;uint8&#x27;</span>)</span><br><span class="line"></span><br><span class="line">        <span class="keyword">if</span> i &gt; <span class="number">8</span>:</span><br><span class="line">            <span class="keyword">break</span></span><br><span class="line">        plt.subplot(<span class="number">3</span>, <span class="number">3</span>, i + <span class="number">1</span>)</span><br><span class="line">        plt.imshow(image)</span><br><span class="line">        plt.title(<span class="string">&#x27;Input Image&#x27;</span>)</span><br><span class="line">        plt.axis(<span class="string">&quot;off&quot;</span>)</span><br><span class="line"></span><br><span class="line">        plt.subplot(<span class="number">3</span>, <span class="number">3</span>, i + <span class="number">2</span>)</span><br><span class="line">        plt.imshow(label, cmap=<span class="string">&#x27;gray&#x27;</span>)</span><br><span class="line">        plt.title(<span class="string">&#x27;Label&#x27;</span>)</span><br><span class="line">        plt.axis(<span class="string">&quot;off&quot;</span>)</span><br><span class="line"></span><br><span class="line">        <span class="comment"># 模型只有一个输出，所以我们通过predict_results[0]来取出预测的结果</span></span><br><span class="line">        <span class="comment"># 映射原始图片的index来取出预测结果，提取mask进行展示</span></span><br><span class="line">        data = predict_results[<span class="number">0</span>][mask_idx][<span class="number">0</span>].transpose((<span class="number">1</span>, <span class="number">2</span>, <span class="number">0</span>))</span><br><span class="line">        mask = np.argmax(data, axis=-<span class="number">1</span>)</span><br><span class="line"></span><br><span class="line">        plt.subplot(<span class="number">3</span>, <span class="number">3</span>, i + <span class="number">3</span>)</span><br><span class="line">        plt.imshow(mask.astype(<span class="string">&#x27;uint8&#x27;</span>), cmap=<span class="string">&#x27;gray&#x27;</span>)</span><br><span class="line">        plt.title(<span class="string">&#x27;Predict&#x27;</span>)</span><br><span class="line">        plt.axis(<span class="string">&quot;off&quot;</span>)</span><br><span class="line">        i += <span class="number">3</span></span><br><span class="line">        mask_idx += <span class="number">1</span></span><br><span class="line">plt.show()</span><br></pre></td></tr></table></figure>


<h2 id="12、模型评估（参考）"><a href="#12、模型评估（参考）" class="headerlink" title="12、模型评估（参考）"></a>12、模型评估（参考）</h2><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br><span class="line">46</span><br><span class="line">47</span><br><span class="line">48</span><br><span class="line">49</span><br><span class="line">50</span><br><span class="line">51</span><br><span class="line">52</span><br><span class="line">53</span><br><span class="line">54</span><br><span class="line">55</span><br><span class="line">56</span><br><span class="line">57</span><br><span class="line">58</span><br><span class="line">59</span><br><span class="line">60</span><br><span class="line">61</span><br><span class="line">62</span><br><span class="line">63</span><br><span class="line">64</span><br><span class="line">65</span><br><span class="line">66</span><br><span class="line">67</span><br><span class="line">68</span><br><span class="line">69</span><br><span class="line">70</span><br><span class="line">71</span><br><span class="line">72</span><br><span class="line">73</span><br><span class="line">74</span><br><span class="line">75</span><br><span class="line">76</span><br><span class="line">77</span><br><span class="line">78</span><br><span class="line">79</span><br><span class="line">80</span><br><span class="line">81</span><br><span class="line">82</span><br><span class="line">83</span><br><span class="line">84</span><br><span class="line">85</span><br><span class="line">86</span><br><span class="line">87</span><br><span class="line">88</span><br><span class="line">89</span><br><span class="line">90</span><br><span class="line">91</span><br><span class="line">92</span><br><span class="line">93</span><br><span class="line">94</span><br><span class="line">95</span><br><span class="line">96</span><br><span class="line">97</span><br><span class="line">98</span><br><span class="line">99</span><br><span class="line">100</span><br><span class="line">101</span><br><span class="line">102</span><br><span class="line">103</span><br><span class="line">104</span><br><span class="line">105</span><br><span class="line">106</span><br><span class="line">107</span><br><span class="line">108</span><br><span class="line">109</span><br><span class="line">110</span><br><span class="line">111</span><br><span class="line">112</span><br><span class="line">113</span><br><span class="line">114</span><br><span class="line">115</span><br><span class="line">116</span><br><span class="line">117</span><br><span class="line">118</span><br><span class="line">119</span><br><span class="line">120</span><br><span class="line">121</span><br><span class="line">122</span><br><span class="line">123</span><br><span class="line">124</span><br><span class="line">125</span><br><span class="line">126</span><br><span class="line">127</span><br><span class="line">128</span><br><span class="line">129</span><br><span class="line">130</span><br><span class="line">131</span><br><span class="line">132</span><br><span class="line">133</span><br><span class="line">134</span><br><span class="line">135</span><br><span class="line">136</span><br><span class="line">137</span><br><span class="line">138</span><br><span class="line">139</span><br><span class="line">140</span><br><span class="line">141</span><br><span class="line">142</span><br><span class="line">143</span><br><span class="line">144</span><br><span class="line">145</span><br><span class="line">146</span><br><span class="line">147</span><br><span class="line">148</span><br><span class="line">149</span><br></pre></td><td class="code"><pre><span class="line">__all__ = [<span class="string">&#x27;SegmentationMetric&#x27;</span>]</span><br><span class="line"></span><br><span class="line"><span class="keyword">import</span> numpy <span class="keyword">as</span> np</span><br><span class="line"><span class="keyword">import</span> cv2</span><br><span class="line"><span class="keyword">from</span> paddle.vision.transforms <span class="keyword">import</span> transforms <span class="keyword">as</span> T</span><br><span class="line"><span class="keyword">from</span> PIL <span class="keyword">import</span> Image <span class="keyword">as</span> PilImage</span><br><span class="line"><span class="keyword">import</span> pickle</span><br><span class="line"></span><br><span class="line"><span class="keyword">class</span> <span class="title class_">SegmentationMetric</span>(<span class="title class_ inherited__">object</span>):</span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">__init__</span>(<span class="params">self, numClass</span>):</span><br><span class="line">        self.numClass = numClass</span><br><span class="line">        self.confusionMatrix = np.zeros((self.numClass,) * <span class="number">2</span>)  <span class="comment"># 混淆矩阵（空）</span></span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">pixelAccuracy</span>(<span class="params">self</span>):</span><br><span class="line">        <span class="comment"># return all class overall pixel accuracy 正确的像素占总像素的比例</span></span><br><span class="line">        <span class="comment">#  PA = acc = (TP + TN) / (TP + TN + FP + TN)</span></span><br><span class="line">        acc = np.diag(self.confusionMatrix).<span class="built_in">sum</span>() / self.confusionMatrix.<span class="built_in">sum</span>()</span><br><span class="line">        <span class="keyword">return</span> acc</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">classPixelAccuracy</span>(<span class="params">self</span>):</span><br><span class="line">        <span class="comment"># return each category pixel accuracy(A more accurate way to call it precision)</span></span><br><span class="line">        <span class="comment"># acc = (TP) / TP + FP</span></span><br><span class="line">        classAcc = np.diag(self.confusionMatrix) / self.confusionMatrix.<span class="built_in">sum</span>(axis=<span class="number">1</span>)</span><br><span class="line">        <span class="keyword">return</span> classAcc  <span class="comment"># 返回的是一个列表值，如：[0.90, 0.80, 0.96]，表示类别1 2 3各类别的预测准确率</span></span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">meanPixelAccuracy</span>(<span class="params">self</span>):</span><br><span class="line">        <span class="string">&quot;&quot;&quot;</span></span><br><span class="line"><span class="string">        Mean Pixel Accuracy(MPA，均像素精度)：是PA的一种简单提升，计算每个类内被正确分类像素数的比例，之后求所有类的平均。</span></span><br><span class="line"><span class="string">        :return:</span></span><br><span class="line"><span class="string">        &quot;&quot;&quot;</span></span><br><span class="line">        classAcc = self.classPixelAccuracy()</span><br><span class="line">        meanAcc = np.nanmean(classAcc)  <span class="comment"># np.nanmean 求平均值，nan表示遇到Nan类型，其值取为0</span></span><br><span class="line">        <span class="keyword">return</span> meanAcc  <span class="comment"># 返回单个值，如：np.nanmean([0.90, 0.80, 0.96, nan, nan]) = (0.90 + 0.80 + 0.96） / 3 =  0.89</span></span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">IntersectionOverUnion</span>(<span class="params">self</span>):</span><br><span class="line">        <span class="comment"># Intersection = TP Union = TP + FP + FN</span></span><br><span class="line">        <span class="comment"># IoU = TP / (TP + FP + FN)</span></span><br><span class="line">        intersection = np.diag(self.confusionMatrix)  <span class="comment"># 取对角元素的值，返回列表</span></span><br><span class="line">        union = np.<span class="built_in">sum</span>(self.confusionMatrix, axis=<span class="number">1</span>) + np.<span class="built_in">sum</span>(self.confusionMatrix, axis=<span class="number">0</span>) - np.diag(</span><br><span class="line">            self.confusionMatrix)  <span class="comment"># axis = 1表示混淆矩阵行的值，返回列表； axis = 0表示取混淆矩阵列的值，返回列表</span></span><br><span class="line">        IoU = intersection / union  <span class="comment"># 返回列表，其值为各个类别的IoU</span></span><br><span class="line">        <span class="keyword">return</span> IoU</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">meanIntersectionOverUnion</span>(<span class="params">self</span>):</span><br><span class="line">        mIoU = np.nanmean(self.IntersectionOverUnion())  <span class="comment"># 求各类别IoU的平均</span></span><br><span class="line">        <span class="keyword">return</span> mIoU</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">genConfusionMatrix</span>(<span class="params">self, imgPredict, imgLabel</span>):  <span class="comment">#</span></span><br><span class="line">        <span class="string">&quot;&quot;&quot;</span></span><br><span class="line"><span class="string">        同FCN中score.py的fast_hist()函数,计算混淆矩阵</span></span><br><span class="line"><span class="string">        :param imgPredict:</span></span><br><span class="line"><span class="string">        :param imgLabel:</span></span><br><span class="line"><span class="string">        :return: 混淆矩阵</span></span><br><span class="line"><span class="string">        &quot;&quot;&quot;</span></span><br><span class="line">        <span class="comment"># remove classes from unlabeled pixels in gt image and predict</span></span><br><span class="line">        mask = (imgLabel &gt;= <span class="number">0</span>) &amp; (imgLabel &lt; self.numClass)</span><br><span class="line">        label = self.numClass * imgLabel[mask] + imgPredict[mask]</span><br><span class="line">        count = np.bincount(label, minlength=self.numClass ** <span class="number">2</span>)</span><br><span class="line">        confusionMatrix = count.reshape(self.numClass, self.numClass)</span><br><span class="line">        <span class="comment"># print(confusionMatrix)</span></span><br><span class="line">        <span class="keyword">return</span> confusionMatrix</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">Frequency_Weighted_Intersection_over_Union</span>(<span class="params">self</span>):</span><br><span class="line">        <span class="string">&quot;&quot;&quot;</span></span><br><span class="line"><span class="string">        FWIoU，频权交并比:为MIoU的一种提升，这种方法根据每个类出现的频率为其设置权重。</span></span><br><span class="line"><span class="string">        FWIOU =     [(TP+FN)/(TP+FP+TN+FN)] *[TP / (TP + FP + FN)]</span></span><br><span class="line"><span class="string">        &quot;&quot;&quot;</span></span><br><span class="line">        freq = np.<span class="built_in">sum</span>(self.confusion_matrix, axis=<span class="number">1</span>) / np.<span class="built_in">sum</span>(self.confusion_matrix)</span><br><span class="line">        iu = np.diag(self.confusion_matrix) / (</span><br><span class="line">                np.<span class="built_in">sum</span>(self.confusion_matrix, axis=<span class="number">1</span>) + np.<span class="built_in">sum</span>(self.confusion_matrix, axis=<span class="number">0</span>) -</span><br><span class="line">                np.diag(self.confusion_matrix))</span><br><span class="line">        FWIoU = (freq[freq &gt; <span class="number">0</span>] * iu[freq &gt; <span class="number">0</span>]).<span class="built_in">sum</span>()</span><br><span class="line">        <span class="keyword">return</span> FWIoU</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">addBatch</span>(<span class="params">self, imgPredict, imgLabel</span>):</span><br><span class="line">        <span class="keyword">assert</span> imgPredict.shape == imgLabel.shape</span><br><span class="line">        self.confusionMatrix += self.genConfusionMatrix(imgPredict, imgLabel)  <span class="comment"># 得到混淆矩阵</span></span><br><span class="line">        <span class="keyword">return</span> self.confusionMatrix</span><br><span class="line"></span><br><span class="line">    <span class="keyword">def</span> <span class="title function_">reset</span>(<span class="params">self</span>):</span><br><span class="line">        self.confusionMatrix = np.zeros((self.numClass, self.numClass))</span><br><span class="line"></span><br><span class="line"><span class="comment"># 图片颜色转换</span></span><br><span class="line"><span class="keyword">def</span> <span class="title function_">green2black</span>(<span class="params">img</span>):</span><br><span class="line">    <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="built_in">len</span>(img)):</span><br><span class="line">        <span class="keyword">for</span> j <span class="keyword">in</span> <span class="built_in">range</span>(<span class="built_in">len</span>(img[i])):</span><br><span class="line">            <span class="keyword">if</span> (img[i][j][<span class="number">0</span>] == <span class="number">255</span>) <span class="keyword">and</span> (img[i][j][<span class="number">1</span>] == <span class="number">255</span>) <span class="keyword">and</span> (img[i][j][<span class="number">2</span>] == <span class="number">255</span>):</span><br><span class="line">                img[i][j][<span class="number">0</span>] = <span class="number">0</span></span><br><span class="line">                img[i][j][<span class="number">1</span>] = <span class="number">0</span></span><br><span class="line">                img[i][j][<span class="number">2</span>] = <span class="number">0</span></span><br><span class="line">            <span class="keyword">elif</span> (img[i][j][<span class="number">0</span>] == <span class="number">0</span>) <span class="keyword">and</span> (img[i][j][<span class="number">1</span>] == <span class="number">255</span>) <span class="keyword">and</span> (img[i][j][<span class="number">2</span>] == <span class="number">255</span>):</span><br><span class="line">                img[i][j][<span class="number">0</span>] = <span class="number">255</span></span><br><span class="line">    <span class="keyword">return</span> img</span><br><span class="line"></span><br><span class="line"><span class="keyword">def</span> <span class="title function_">create_img</span>(<span class="params">arr</span>):</span><br><span class="line">    img = np.ones((<span class="number">224</span>,<span class="number">224</span>,<span class="number">3</span>), dtype=np.float32)</span><br><span class="line">    <span class="keyword">for</span> i <span class="keyword">in</span> <span class="built_in">range</span>(<span class="built_in">len</span>(arr)):</span><br><span class="line">        <span class="keyword">for</span> j <span class="keyword">in</span> <span class="built_in">range</span>(<span class="built_in">len</span>(arr[i])):</span><br><span class="line">            <span class="keyword">if</span> arr[i][j] == <span class="number">0</span>:</span><br><span class="line">                img[i][j][<span class="number">0</span>] = <span class="number">0</span></span><br><span class="line">                img[i][j][<span class="number">1</span>] = <span class="number">0</span></span><br><span class="line">                img[i][j][<span class="number">2</span>] = <span class="number">0</span></span><br><span class="line">            <span class="keyword">else</span>:</span><br><span class="line">                img[i][j][<span class="number">0</span>] = <span class="number">255</span></span><br><span class="line">                img[i][j][<span class="number">1</span>] = <span class="number">255</span></span><br><span class="line">                img[i][j][<span class="number">2</span>] = <span class="number">255</span></span><br><span class="line">    <span class="keyword">return</span> img</span><br><span class="line"></span><br><span class="line"></span><br><span class="line"><span class="keyword">with</span> <span class="built_in">open</span>(<span class="string">&#x27;./predict_results.txt&#x27;</span>, <span class="string">&#x27;rb&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">    content = f.read()</span><br><span class="line">    predict_results = pickle.loads(content)</span><br><span class="line"></span><br><span class="line"><span class="comment"># 测试内容</span></span><br><span class="line">mask_idx = <span class="number">0</span></span><br><span class="line">metric, hist, pa, cpa, mpa, IoU, mIoU = [], [], [], [], [], [], []</span><br><span class="line">IMAGE_SIZE = (<span class="number">224</span>, <span class="number">224</span>)</span><br><span class="line"><span class="keyword">with</span> <span class="built_in">open</span>(<span class="string">&#x27;./predict.txt&#x27;</span>, <span class="string">&#x27;r&#x27;</span>) <span class="keyword">as</span> f:</span><br><span class="line">    <span class="keyword">for</span> line <span class="keyword">in</span> f.readlines():</span><br><span class="line">        image_path, label_path, label_image_path = line.strip().split(<span class="string">&#x27;\t&#x27;</span>)</span><br><span class="line">        resize_t = T.Compose([</span><br><span class="line">            T.Resize(IMAGE_SIZE)</span><br><span class="line">        ])</span><br><span class="line">        label = resize_t(PilImage.<span class="built_in">open</span>(label_image_path))</span><br><span class="line">        label = np.array(label).astype(<span class="string">&#x27;uint8&#x27;</span>)</span><br><span class="line">        <span class="comment"># 模型只有一个输出，所以我们通过predict_results[0]来取出预测的结果</span></span><br><span class="line">        <span class="comment"># 映射原始图片的index来取出预测结果，提取mask进行展示</span></span><br><span class="line">        data = predict_results[<span class="number">0</span>][mask_idx][<span class="number">0</span>].transpose((<span class="number">1</span>, <span class="number">2</span>, <span class="number">0</span>))</span><br><span class="line">        mask = np.argmax(data, axis=-<span class="number">1</span>)</span><br><span class="line">        mask_idx += <span class="number">1</span></span><br><span class="line"></span><br><span class="line">        imgPredict = create_img(mask.astype(<span class="string">&#x27;uint8&#x27;</span>))</span><br><span class="line">        imgLabel = green2black(label)</span><br><span class="line">        imgPredict = np.array(cv2.cvtColor(imgPredict, cv2.COLOR_BGR2GRAY) / <span class="number">255.</span>, dtype=np.uint8)</span><br><span class="line">        imgLabel = np.array(cv2.cvtColor(imgLabel, cv2.COLOR_BGR2GRAY) / <span class="number">255.</span>, dtype=np.uint8)</span><br><span class="line">        <span class="comment"># imgPredict = np.array([0, 0, 1, 1, 2, 2])  # 可直接换成预测图片</span></span><br><span class="line">        <span class="comment"># imgLabel = np.array([0, 0, 1, 1, 2, 2])  # 可直接换成标注图片</span></span><br><span class="line"></span><br><span class="line">        metric = SegmentationMetric(<span class="number">2</span>)  <span class="comment"># 2表示有2个分类，有几个分类就填几</span></span><br><span class="line">        hist.append(metric.addBatch(imgPredict, imgLabel))</span><br><span class="line">        pa.append(metric.pixelAccuracy())</span><br><span class="line">        cpa.append(metric.classPixelAccuracy())</span><br><span class="line">        mpa.append(metric.meanPixelAccuracy())</span><br><span class="line">        IoU.append(metric.IntersectionOverUnion())</span><br><span class="line">        mIoU.append(metric.meanIntersectionOverUnion())</span><br><span class="line"></span><br><span class="line"><span class="built_in">print</span>(<span class="string">&#x27;hist is :\n&#x27;</span>, np.mean(hist))</span><br><span class="line"><span class="built_in">print</span>(<span class="string">&#x27;PA is : %f&#x27;</span> % np.mean(pa))</span><br><span class="line"><span class="built_in">print</span>(<span class="string">&#x27;IoU is : &#x27;</span>, np.mean(IoU))</span><br></pre></td></tr></table></figure>


                                      </div>
                                      
                                        <div class="prev-or-next">
                                          <div class="post-foot-next">
                                            
                                              <a href="/2023/07/15/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%8E%9F%E7%90%86/" target="_self">
                                                <i class="iconfont icon-chevronleft"></i>
                                                <span>
                                                  上一页
                                                </span>
                                              </a>
                                              
                                          </div>
                                          <div class="post-attach">
                                            <span class="post-pubtime">
                                              <i class="iconfont icon-updatetime mr-10"
                                                title="更新时间"></i>
                                              2024-10-22 14:52:45
                                            </span>
                                            
                                              <span class="post-tags">
                                                <i class="iconfont icon-tags mr-10" title="标签"></i>
                                                
                                                  <span class="span--tag mr-8">
                                                    <a href="/tags/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/" title="人工智能">
                                                      #人工智能
                                                    </a>
                                                  </span>
                                                  
                                                  <span class="span--tag mr-8">
                                                    <a href="/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/" title="机器学习">
                                                      #机器学习
                                                    </a>
                                                  </span>
                                                  
                                              </span>
                                              
                                          </div>
                                          <div class="post-foot-prev">
                                            
                                              <a href="/2023/08/01/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E4%B8%8E%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%EF%BC%9A%E5%9F%BA%E7%A1%80%E4%B8%8E%E5%8E%86%E5%8F%B2/" target="_self">
                                                <span>
                                                  下一页
                                                </span>
                                                <i class="iconfont icon-chevronright"></i>
                                              </a>
                                              
                                          </div>
                                        </div>
                                        
                                    </div>
                                    
  <div id="btn-catalog" class="btn-catalog">
    <i class="iconfont icon-catalog"></i>
  </div>
  <div class="post-catalog hidden" id="catalog">
    <div class="title">目录</div>
    <div class="catalog-content">
      
        <ol class="toc"><li class="toc-item toc-level-1"><a class="toc-link" href="#%E5%AE%9E%E9%AA%8C%EF%BC%9AUnet%E9%81%93%E8%B7%AF%E5%88%86%E5%89%B2"><span class="toc-text">实验：Unet道路分割</span></a><ol class="toc-child"><li class="toc-item toc-level-2"><a class="toc-link" href="#Unet%E7%BD%91%E7%BB%9C%E6%A8%A1%E5%9E%8B%E4%BB%8B%E7%BB%8D%EF%BC%9A"><span class="toc-text">Unet网络模型介绍：</span></a></li></ol></li><li class="toc-item toc-level-1"><a class="toc-link" href="#%E6%95%B0%E6%8D%AE%E9%9B%86%E5%88%92%E5%88%86"><span class="toc-text">数据集划分</span></a></li><li class="toc-item toc-level-1"><a class="toc-link" href="#%E9%81%93%E8%B7%AF%E5%88%86%E5%89%B2%E5%AE%9E%E9%AA%8C%EF%BC%9A"><span class="toc-text">道路分割实验：</span></a><ol class="toc-child"><li class="toc-item toc-level-2"><a class="toc-link" href="#1%E3%80%81%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86"><span class="toc-text">1、数据处理</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#2%E3%80%81%E6%8A%BD%E6%A0%B7%E6%A3%80%E6%9F%A5"><span class="toc-text">2、抽样检查</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#3%E3%80%81%E6%9E%84%E5%BB%BAUnet%E6%A8%A1%E5%9E%8B%E7%BD%91%E7%BB%9C-%E7%BC%96%E7%A0%81%E5%99%A8"><span class="toc-text">3、构建Unet模型网络-编码器</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#4%E3%80%81%E6%9E%84%E5%BB%BAUnet%E6%A8%A1%E5%9E%8B%E7%BD%91%E7%BB%9C-%E8%A7%A3%E7%A0%81%E5%99%A8"><span class="toc-text">4、构建Unet模型网络-解码器</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#6%E3%80%81%E6%9E%84%E5%BB%BAUnet%E6%A8%A1%E5%9E%8B%E7%BD%91%E7%BB%9C"><span class="toc-text">6、构建Unet模型网络</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#7%E3%80%81%E8%AE%AD%E7%BB%83%E9%9B%86%E8%AF%BB%E5%8F%96%E5%99%A8"><span class="toc-text">7、训练集读取器</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#9%E3%80%81%E8%AE%AD%E7%BB%83"><span class="toc-text">9、训练</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#10%E3%80%81%E6%8E%A8%E7%90%86"><span class="toc-text">10、推理</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#11%E3%80%81%E6%8E%A8%E7%90%86%E7%BB%93%E6%9E%9C%E5%8F%AF%E8%A7%86%E5%8C%96"><span class="toc-text">11、推理结果可视化</span></a></li><li class="toc-item toc-level-2"><a class="toc-link" href="#12%E3%80%81%E6%A8%A1%E5%9E%8B%E8%AF%84%E4%BC%B0%EF%BC%88%E5%8F%82%E8%80%83%EF%BC%89"><span class="toc-text">12、模型评估（参考）</span></a></li></ol></li></ol>
      
    </div>
  </div>

  
<script src="/js/catalog.js"></script>


                                        <div class="comments-container">
                                          

                                        </div>
                                        
                                  </div>
                                  

          <div id="blockchain"></div>
          <style>
            #hq {
              margin-top: 10px;
              margin-bottom: 10px;
              font-size: 18px;
            }

            #blockchain {
              margin: 0 auto;
              display: none;
              width: 590px;
              flex-direction: column;
              align-items: center;
              background: #ffffffa3;
              border-radius: 5px;
              padding: 5px 10px 10px 10px;
              margin-top: 20px;
            }

            #blockchain .htitle {
              display: flex;
              flex-direction: row;
              align-items: center;
              cursor: pointer;
            }

            #blockchain .hsubtitle {
              color: #555;
              transform: scale(0.8); /* 然后缩小至80% */
              transform-origin: 5px 12px; /* 可能需要指定缩放原点以确保准确缩放 */
            }

            #blockchain .himg {
              width: 25px;
              height: 25px;
              margin-right: 5px;
            }

            #blockchain tr, th {
              font-size: 1.7rem;
              font-weight: normal;
            }

            #blockchain tr, td {
              font-size: 1.6rem;
            }

            #blockchain tr, th, td {
              border: 1px solid #c7c7c7;
              padding: 3px 7px;
            }

            #blockchain table {
              border-collapse: collapse;
              width: 100%;
              font-size: 16px;
              font-family: arial;
            }

            @media (max-width: 800px) {
              #blockchain {
                margin: 0 auto;
                margin-top: 20px;
                display: none;
                /* justify-content: flex-start; */
                padding: 20px 10px;
                width: calc(100% - 40px);
                flex-direction: column;
                align-items: center;
              }
            }
          </style>

          
<script src="/js/axios.min.js"></script>

          <script>
            let ctoname = [
              "BTC",
              "ETH",
              "USDT",
              "BNB",
              "SOL",
              "USDC",
              "XRP",
              "DOGE",
              "ADA",
              "SHIB",
              "AVAX",
              "TRX",
              "DOT",
              "WBTC",
              "BCH",
              "LINK",
              "NEAR",
              "MATIC",
              "ICP",
              "LTC",
              "DAI",
              "UNI",
              "HBAR",
              "ETC",
              "APT",
              "FDUSD",
              "RNDR",
              "ATOM",
              "PEPE",
              "FIL"
            ];

            let ctoname2 = [
                "比特币",
                "以太坊",
                "泰达币",
                "币安币",
                "索拉纳",
                "美元硬币",
                "瑞波币",
                "狗狗币",
                "卡尔达诺",
                "柴犬币",
                "雪崩协议",
                "波场",
                "波卡",
                "包装比特币",
                "比特币现金",
                "链环",
                "近协议",
                "多边形",
                "互联网计算机",
                "莱特币",
                "戴",
                "Uniswap",
                "以太坊经典",
                "赫德拉哈希图",
                "阿普托斯",
                "第一数字美元",
                "渲染令牌",
                "佩佩",
                "宇宙",
                "文件币"
            ];

            let ctoname3 = [
                "Bitcoin",
                "Ethereum",
                "TetherUS",
                "BNB",
                "Solana",
                "USD Coin",
                "Ripple",
                "Dogecoin",
                "Cardano",
                "SHIBA INU",
                "Avalanche",
                "TRON",
                "Polkadot",
                "Wrapped Bitcoin",
                "Bitcoin Cash",
                "ChainLink",
                "NEAR Protocol",
                "Polygon",
                "Internet Computer",
                "Litecoin",
                "Dai",
                "Uniswap",
                "Ethereum Classic",
                "Hedera Hashgraph",
                "Aptos",
                "First Digital USD",
                "Render Token",
                "Pepe",
                "Cosmos",
                "Filecoin"
            ]

            let ctoname4 = [
                "比特币是一种去中心化的数字货币，它允许点对点交易，创建于2009年。",
                "以太坊是一个开源的区块链平台，支持智能合约和去中心化应用，推出于2015年。",
                "泰达币是一种与美元挂钩的稳定币，旨在保持1:1的美元价值。",
                "币安币是币安交易所发行的加密货币，用于支付交易费用和其他服务。",
                "索拉纳是一个高性能区块链平台，旨在提供快速、安全和可扩展的去中心化应用。",
                "USD Coin是一种与美元挂钩的稳定币，由Circle和Coinbase合作推出。",
                "瑞波币是一种由Ripple公司创建的加密货币，旨在促进银行间快速、低成本的跨境支付。",
                "狗狗币是一种基于模因的加密货币，起初作为玩笑创建，但后来因社区支持而流行。",
                "卡尔达诺是一个第三代区块链平台，致力于提供可持续和可扩展的去中心化应用。",
                "柴犬币是一种模仿狗狗币的加密货币，以其社区驱动的发展模式和广泛的在线社区而闻名。",
                "雪崩币是Avalanche区块链平台的原生代币，支持去中心化应用和金融资产。",
                "波场币是波场区块链的原生代币，旨在为数字娱乐产业提供去中心化的内容分享平台。",
                "波卡币是一个多链区块链平台，旨在实现不同区块链之间的互操作性。",
                "包装比特币是比特币在以太坊区块链上的代币化版本，使其能够用于DeFi应用。",
                "比特币现金是比特币的一个分叉，旨在通过增加区块大小来实现更快的交易速度。",
                "Chainlink是一个去中心化的预言机网络，旨在连接智能合约和现实世界的数据。",
                "近邻协议是一个高性能区块链，致力于提供去中心化应用的理想开发平台。",
                "Polygon是一个以太坊扩展解决方案，旨在提供快速、低成本的交易。",
                "Internet Computer是一个去中心化的区块链网络，旨在扩展互联网功能。",
                "莱特币是一种基于比特币协议的加密货币，具有更快的区块生成时间。",
                "Dai是一种由MakerDAO创建的去中心化稳定币，与美元挂钩。",
                "Uniswap是一个基于以太坊的去中心化交易所，允许用户进行代币交换。",
                "Hedera是一个去中心化的公有账本，使用哈希图共识算法。",
                "以太经典是以太坊的一个分叉，保持了原始以太坊链的历史记录。",
                "Aptos是一个新兴的区块链平台，旨在提供高效、安全的去中心化应用。",
                "First Digital USD是一种与美元挂钩的稳定币，旨在提供数字美元的替代方案。",
                "Render Token是一个分布式的GPU渲染网络，旨在提供高效的渲染服务。",
                "宇宙链是一个区块链网络，旨在实现不同区块链之间的互操作性。",
                "Pepe是一种模仿柴犬币的加密货币，以其社区驱动的发展模式而著名。",
                "文件币是一个去中心化的存储网络，旨在利用区块链技术提供安全的数据存储。"
            ];

            async function requestBlockChain() {
              const instance = axios.get("/blockchain")
              let jsonData = (await instance).data

              let table = `<h2 id='hq'>虚拟货币行情</h2>
                <div style="font-size: 1.5rem; font-weight: normal; padding: 0px 0px 10px 0px;">(美元对人民币汇率：${jsonData['exchange']})</div>
                <table border='1'>
                  <tr>
                    <th width="40%">虚拟货币</th>
                    <th width="30%">价格(人民币)</th>
                    <th width="30%">价格(美元)</th>
                  </tr>`;
              
              for (let i = 0; i <= 20; i++) {
                if (!jsonData['list'][ctoname[i]]) {
                  continue;
                }

                let rmb = Math.round(jsonData['list'][ctoname[i]] * jsonData['exchange'] * 100000) / 100000;
                let usd = jsonData['list'][ctoname[i]]

                table += `
                <tr>
                  <td>
                    <div class="htitle" title="${ctoname4[i]}">
                      <img class="himg" src="/images/BlockChain/${ctoname[i]}.jpg" />
                      ${ctoname[i]}
                      <span class="hsubtitle">
                        (${ctoname2[i]})
                      </span>
                    </div>
                  </td>
                  <td>${rmb}</td>
                  <td>${usd}</td>
                </tr>`;
              }

              // for (let currency in jsonData) {
              //   table += `<tr><td>${ctoname[currency].name}</td><td>${jsonData[currency]}</td></tr>`;
              // }
              table += "</table>";

              document.getElementById("blockchain").innerHTML = table;
              document.getElementById("blockchain").style.display = "flex"
            }

            requestBlockChain()
          </script>

          
<div class="footer">
  <div class="social">
    <ul>
      
        <li>
          <a title="github" href="">
            <i class="iconfont icon-"></i>
          </a>
        </li>
      
        <li>
          <a title="wechat" href="">
            <i class="iconfont icon-wechat"></i>
          </a>
        </li>
      
    </ul>
  </div>
  
    
    <div class="footer-more">
      
        <a target="_blank" rel="noopener" href="https://github.com/zchengsite/hexo-theme-oranges">Copyright © 2024 lijunjie</a>
        
    </div>
  
    
    <div class="footer-more">
      
        <a href="https://hahaha.love">Theme by Oranges | Powered by Lijunjie</a>
        
    </div>
  
  
</div>


<script async src="/plugins/consolevideo.js"></script>
        </div>

        <div class="tools-bar">
          <div class="back-to-top tools-bar-item hidden">
  <a href="javascript: void(0)">
    <i class="iconfont icon-chevronup"></i>
  </a>
</div>


<script src="/js/backtotop.js"></script>


  <div class="search-icon tools-bar-item" id="search-icon">
    <a href="javascript: void(0)">
      <i class="iconfont icon-search"></i>
    </a>
  </div>

  <div class="search-overlay hidden">
    <div class="search-content" tabindex="0">
      <div class="search-title">
        <span class="search-icon-input">
          <a href="javascript: void(0)">
            <i class="iconfont icon-search"></i>
          </a>
        </span>
        
          <input type="text" class="search-input" id="search-input" placeholder="搜索...">
        
        <span class="search-close-icon" id="search-close-icon">
          <a href="javascript: void(0)">
            <i class="iconfont icon-close"></i>
          </a>
        </span>
      </div>
      <div class="search-result" id="search-result"></div>
    </div>
  </div>

  <script type="text/javascript">
    var inputArea = document.querySelector("#search-input")
    var searchOverlayArea = document.querySelector(".search-overlay")

    inputArea.onclick = function() {
      getSearchFile()
      this.onclick = null
    }

    inputArea.onkeydown = function() {
      if(event.keyCode == 13)
        return false
    }

    function openOrHideSearchContent() {
      let isHidden = searchOverlayArea.classList.contains('hidden')
      if (isHidden) {
        searchOverlayArea.classList.remove('hidden')
        document.body.classList.add('hidden')
        // inputArea.focus()
      } else {
        searchOverlayArea.classList.add('hidden')
        document.body.classList.remove('hidden')
      }
    }

    function blurSearchContent(e) {
      if (e.target === searchOverlayArea) {
        openOrHideSearchContent()
      }
    }

    document.querySelector("#search-icon").addEventListener("click", openOrHideSearchContent, false)
    document.querySelector("#search-close-icon").addEventListener("click", openOrHideSearchContent, false)
    searchOverlayArea.addEventListener("click", blurSearchContent, false)

    var searchFunc = function (path, search_id, content_id) {
      'use strict';
      var $input = document.getElementById(search_id);
      var $resultContent = document.getElementById(content_id);
      $resultContent.innerHTML = "<ul><span class='local-search-empty'>首次搜索，正在载入索引文件，请稍后……<span></ul>";
      $.ajax({
        // 0x01. load xml file
        url: path,
        dataType: "xml",
        success: function (xmlResponse) {
          // 0x02. parse xml file
          var datas = $("entry", xmlResponse).map(function () {
            return {
              title: $("title", this).text(),
              content: $("content", this).text(),
              url: $("url", this).text()
            };
          }).get();
          $resultContent.innerHTML = "";

          $input.addEventListener('input', function () {
            // 0x03. parse query to keywords list
            var str = '<ul class=\"search-result-list\">';
            var keywords = this.value.trim().toLowerCase().split(/[\s\-]+/);
            $resultContent.innerHTML = "";
            if (this.value.trim().length <= 0) {
              return;
            }
            // 0x04. perform local searching
            datas.forEach(function (data) {
              var isMatch = true;
              var content_index = [];
              if (!data.title || data.title.trim() === '') {
                data.title = "Untitled";
              }
              var orig_data_title = data.title.trim();
              var data_title = orig_data_title.toLowerCase();
              var orig_data_content = data.content.trim().replace(/<[^>]+>/g, "");
              var data_content = orig_data_content.toLowerCase();
              var data_url = data.url;
              var index_title = -1;
              var index_content = -1;
              var first_occur = -1;
              // only match artiles with not empty contents
              if (data_content !== '') {
                keywords.forEach(function (keyword, i) {
                  index_title = data_title.indexOf(keyword);
                  index_content = data_content.indexOf(keyword);

                  if (index_title < 0 && index_content < 0) {
                    isMatch = false;
                  } else {
                    if (index_content < 0) {
                      index_content = 0;
                    }
                    if (i == 0) {
                      first_occur = index_content;
                    }
                    // content_index.push({index_content:index_content, keyword_len:keyword_len});
                  }
                });
              } else {
                isMatch = false;
              }
              // 0x05. show search results
              if (isMatch) {
                str += "<li><a href='" + data_url + "' class='search-result-title'>" + orig_data_title + "</a>";
                var content = orig_data_content;
                if (first_occur >= 0) {
                  // cut out 100 characters
                  var start = first_occur - 20;
                  var end = first_occur + 80;

                  if (start < 0) {
                    start = 0;
                  }

                  if (start == 0) {
                    end = 100;
                  }

                  if (end > content.length) {
                    end = content.length;
                  }

                  var match_content = content.substr(start, end);

                  // highlight all keywords
                  keywords.forEach(function (keyword) {
                    var regS = new RegExp(keyword, "gi");
                    match_content = match_content.replace(regS, "<span class=\"search-keyword\">" + keyword + "</span>");
                  });

                  str += "<p class=\"search-result-abstract\">" + match_content + "...</p>"
                }
                str += "</li>";
              }
            });
            str += "</ul>";
            if (str.indexOf('<li>') === -1) {
              return $resultContent.innerHTML = "<ul><span class='local-search-empty'>没有找到内容，请尝试更换检索词。<span></ul>";
            }
            $resultContent.innerHTML = str;
          });
        },
        error: function(xhr, status, error) {
          $resultContent.innerHTML = ""
          if (xhr.status === 404) {
            $resultContent.innerHTML = "<ul><span class='local-search-empty'>未找到search.xml文件，具体请参考：<a href='https://github.com/zchengsite/hexo-theme-oranges#configuration' target='_black'>configuration</a><span></ul>";
          } else {
            $resultContent.innerHTML = "<ul><span class='local-search-empty'>请求失败，尝试重新刷新页面或稍后重试。<span></ul>";
          }
        }
      });
      $(document).on('click', '#search-close-icon', function() {
        $('#search-input').val('');
        $('#search-result').html('');
      });
    }

    var getSearchFile = function() {
        var path = "/search.xml";
        searchFunc(path, 'search-input', 'search-result');
    }
  </script>


        </div>
    </div>

  </body>

</html>