<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Geospatial Information Technology</title>
<title_fa>مهندسی فناوری اطلاعات مکانی</title_fa>
<short_title>jgit</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jgit.kntu.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2008-9635</journal_id_issn>
<journal_id_issn_online></journal_id_issn_online>
<journal_id_pii>8</journal_id_pii>
<journal_id_doi>10.61882/jgit</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>14</journal_id_sid>
<journal_id_nlai>٢۵٣٨-۴١٨X</journal_id_nlai>
<journal_id_science>13</journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1398</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2019</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<volume>7</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تلفیق الگوریتم‌های یادگیری عمیق و فیلترهای دوطرفه با هدف استخراج ساختمان از تک‌تصویر نوری هوایی</title_fa>
	<title>Integration of Deep Learning Algorithms and Bilateral Filters with the Purpose of Building Extraction from Mono Optical Aerial Imagery</title>
	<subject_fa>سنجش از دور</subject_fa>
	<subject>RS</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;span style=&quot;font-family:b nazanin;&quot;&gt;مسئله استخراج ساختمان از تک&#8204;تصویر نوری هوایی با قدرت تفکیک مکانی بالا، همواره به&#8204;عنوان یکی از چالش&#8204;های مهم در تهیه نقشه به&#8204;شمار می&#8204;آید. هدف از پژوهش حاضر، بهره&#8204;گیری از قطعه&#8204;بندی معنایی تک&#8204;تصویر نوری هوایی بر پایه تلفیق شبکه&#8204;های عصبی کانوولوشنی عمیق و فیلترهای دوطرفه جهت استخراج ساختمان می&#8204;باشد. به&#8204;همین&#8204;منظور&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;،&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt; پس از انتخاب یک مجموعه داده مناسب از تصاویر نوری سه&#8204;باندی، با در نظر گرفتن این&#8204;که برای آموزش شبکه&#8204;های عصبی عمیق نیاز است تا داده&#8204;های آموزشی با تعداد زیاد انتخاب شوند و باتوجه به محدودیت&#8204;های سخت&#8204;افزاری در این پژوهش، پس از چندین بار آزمایش، حداقل داده&#8204;ای که بالاترین نرخ دقت آموزش را به دست می&#8204;دهد انتخاب گردید؛ تا نتایج به&#8204;دست آمده، از کمبود داده&#8204;های آموزشی تأثیر منفی نپذیرد. در این پژوهش، با بهینه&#8204;سازی شبکه عصبی عمیق سِگنت که از نوع شبکه&#8204;های کدگذار-کدگشا می&#8204;باشد، با استفاده از تابع بهینه&#8204;سازی برآورد لحظه تطبیقی و به&#8204;کارگیری فیلترهای دوطرفه با کرنل گوسین، فرآیند پردازش و استخراج ساختمان از تصاویر نوری صورت گرفته است. نتایج تحقیق بر روی مجموعه داده مربوط به تصاویر نوری هوایی از مناطق شهری واقع در شهر پوتسدام آلمان از مجموعه داده&#8204;های دو بعدی برچسب&#8204;دار انجمن بین&#8204;المللی فتوگرامتری و سنجش&#8204;ازدور نشان داد؛&lt;/span&gt; &lt;span style=&quot;font-family:b nazanin;&quot;&gt;به&#8204;کارگیری تلفیقی شبکه عصبی عمیق بهینه&#8204;سازی شده سِگنت و فیلترهای دو طرفه با کرنل گوسین قابلیت&#8204;های بسیار مناسبی از نظر بهبود شناسایی مرز ساختمان در مقایسه با روش&#8204;های مشابه از تصاویر نوری با قدرت تفکیک مکانی بالا دارد. همچنین نتایج حاصل از روش پیشنهادی تحقیق با معیارهای تمامیّت و صحّت برای سه منطقه تست به ترتیب 14&lt;sub&gt;/&lt;/sub&gt;95 و 37&lt;sub&gt;/&lt;/sub&gt;92&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt; درصد&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt; برای منطقه تست شماره یک، 67&lt;sub&gt;/&lt;/sub&gt;91 و 20&lt;sub&gt;/&lt;/sub&gt;90 برای منطقه تست شماره دو، 14&lt;sub&gt;/&lt;/sub&gt;96 و 98&lt;sub&gt;/&lt;/sub&gt;93 برای منطقه تست شماره سه می&#8204;باشد.&lt;/span&gt;&lt;span style=&quot;font-family:b nazanin;&quot;&gt;&lt;/span&gt;</abstract_fa>
	<abstract>The problem of extracting the building from mono optical aerial imagery with high spatial resolution is always considered as an important challenge to prepare the maps. The goal of the current research is to take advantage of the semantic segmentation of mono optical aerial imagery to extract the building which is realized based on the combination of deep convolutional neural networks (DCNN) and bilateral filters (BF). For this purpose, considering the hardware limitations of the current research and the fact that it is necessary to select a large number of training data to train deep convolutional neural networks, after selecting an appropriate dataset from three-band optical images, the minimum data that obtains the highest training accuracy was selected to avoid getting weak results due to the lack of training data. In this research, by optimizing the SegNet deep neural network which is an encoder-decoder network, the processing task and therefore extracting the building from optical images are done using the &lt;a name=&quot;OLE_LINK9&quot;&gt;adaptive moment estimation (ADAM) optimization &lt;/a&gt;and BF with a Gaussian kernel. This method is implemented on a dataset related to the mono optical aerial imagery of urban regions located in Potsdam, Germany, the two-dimensional tagged datasets of international society for photogrammetry and remote sensing (ISPRS). The results show that compared to similar methods, the &lt;a name=&quot;OLE_LINK15&quot;&gt;&lt;/a&gt;&lt;a name=&quot;OLE_LINK14&quot;&gt;combinational&lt;/a&gt; use of the SegNet optimized deep neural network and BF with a Gaussian kernel provides very appropriate capabilities to improve the detection of building boundary in the optical images with high spatial resolution. Also, the results of the proposed method show that the values of the integrity and validity criteria are 95.14 and 92.37 respectively for the test area 1, 91.67 and 90.2 respectively for the test area 2, and 96.14 and 93.98 respectively for the test area 3.&amp;nbsp; &lt;span dir=&quot;RTL&quot;&gt;&lt;/span&gt;</abstract>
	<keyword_fa>استخراج ساختمان, تک‌تصویر نوری هوایی , قطعه‌بندی معنایی, شبکه‌های عصبی کانوولوشنی عمیق, فیلترهای دوطرفه</keyword_fa>
	<keyword>building extraction, mono optical aerial imagery, semantic segmentation, deep convolutional neural networks, bilateral filters</keyword>
	<start_page>241</start_page>
	<end_page>263</end_page>
	<web_url>http://jgit.kntu.ac.ir/browse.php?a_code=A-11-124-5&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Mahdi </first_name>
	<middle_name></middle_name>
	<last_name>Khoshboresh Masouleh </last_name>
	<suffix></suffix>
	<first_name_fa>مهدی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>خوش برش ماسوله</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846007500</code>
	<orcid>10031947532846007500</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>University of Tehran</affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


	<author>
	<first_name>Reza</first_name>
	<middle_name></middle_name>
	<last_name>Shah-Hosseini </last_name>
	<suffix></suffix>
	<first_name_fa>رضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>شاه حسینی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846007501</code>
	<orcid>10031947532846007501</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>University of Tehran</affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


	<author>
	<first_name>Abdol Reza</first_name>
	<middle_name></middle_name>
	<last_name>Safari</last_name>
	<suffix></suffix>
	<first_name_fa>عبدالرضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>صفری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846007502</code>
	<orcid>10031947532846007502</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>University of Tehran</affiliation>
	<affiliation_fa>دانشگاه تهران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
