امروزه پیشبینی مسیر حرکت عابر پیاده، یکی از چالشهای مهم در حوزه ماشینبینایی بوده و توجه پژوهشگران زیادی را به خود جلب نموده است. برای پیشبینی مسیر حرکت عوارض متحرک مثل عابرین پیاده یا خودرو بهتر است از شبکههای بازگشتی که قابلیت حفظ اطلاعات لازم از مسیر گذشته را دارند، استفاده نمود. شبکههای حافظه کوتاه و بلندمدت (Long Short Term Memory-LSTM) که نوعی از شبکههای بازگشتی است، توانایی حفظ اطلاعات برای مدت طولانی را دارد. بنابراین برای پیشبینی موقعیت عابر پیاده از روی دادههای تصویری (شامل سه باند سبز – قرمز – آبی)، بعد از نرمالسازی شبکه LSTM مورد استفاده قرار می گیرد. از آنجاییکه دادههای تصویری در فضای دو بعدی و پیکسل مبنا هستند، لذا شبکههای پیشنهادی LSTM برای پیشبینی در فضای دو بعدی میباشند. ولی با توجه به اینکه دنیای واقعی سهبعدی است و یکی از مهمترین عوامل در رفتار عابر پیاده فاصله مابین انسان و دیگر عوارض، بویژه عوارض متحرک میباشد، لذا برای پیشبینی بهتر وضعیت عابر پیاده لازم است مدل پیشنهادی به دنیای واقعی نزدیکتر بوده و پیشبینی وضعیت عابر پیاده در فضای سهبعدی انجام گیرد. بنابراین در این تحقیق، از دادههای RGB-D تهیه شده در دانشگاه پلی تکنیک لوزان سوئیس(EPFL) برای پیشبینی موقعیت عابر پیاده استفاده شده و شبکه 3D-LSTM برای پیشبینی موقعیت عابر پیاده در فضای سهبعدی متریک پیشنهاد شده است. مهمترین ویژگی این شبکه، پیشبینی بعد سوم میباشد که تاثیر زیادی در تصمیمگیری رباتها و مسیر حرکتی آنها دارد. نتایج بدستآمده نشان میدهد که دقت پیشبینی موقعیت سهبعدی عابر پیاده تقریباً برابر با حالت دوبعدی است و اطلاعات بعد سوم را نیز پیشبینی میکند.