FPGA المنحى متفرق فورييه بالتوازي الخوارزمي

يانغ تشاو تشيان هوى

(مدرسة جامعة فوتشو الفيزياء وهندسة المعلومات، وفوتشو 350108، الصين)

: A متناثر تحويل فورييه (SFT) لتحقيق البحث الأمثل للتصميم مواز. أولا، إشارة الدخل موازية إلى مجموعات N، كل تحويل فورييه السريع (وهي الاتحاد الفرنسي للتنس)، نفذت تردد مودولو معالجة الإشارات المكونة والفرز والحصول عليها عن طريق البحث. المصادق عليها، مقارنة FFTW، عندما تكون إشارة أكبر من طول 524288، ووقت التنفيذ سوف يكون الأداء أفضل، بالمقارنة مع غيرها من SFT متعامد مطابقة خوارزمية وتعقيد تنفيذ FPGA مما يقلل النظام.

: متناثر تحويل فورييه، إطار مواز، الميدان برمجة بوابة صفيف

: كود TN911.7 الوثيقة: ADOI: 10.19358 / j.issn.1674-7720.2017.10.020

شكل إشارة : تشاو يانغ، وهوى FPGA المال الموجهة بالتوازي متفرق فورييه الخوارزمية [J] ITS APPLICATIONS، 2017،36 (10): 70-73.

0 مقدمة

متفرق تحويل فورييه (متفرق تحويل فورييه، SFT) هو إطار خوارزمية جديدة، وتمتد أيضا بسرعة تحويل فورييه (تحويل فورييه السريع، الاتحاد الفرنسي للتنس) على إشارات الطيف متفرق. في عام 2003 ايدينر أ أ وآخرون المقترحة لإشارة التردد نطاق متفرق تحويل فورييه الفكرة الأساسية [1]. للحصول على إشارات التردد نطاق متفرق، وطيف من الأطياف يمكن الحصول عليها عن طريق متعددة المراحل فرعية منها. بعد، IWEN M A إلهام وآخرون من الاستشعار مضغوط، وأخذ العينات تقدير تردد، وبسرعة تحويل فورييه ودمجها في الإطار التقليدي SFT المقترحة [2]. بعد SFT تستخدم على نطاق واسع الطيف إشارة متفرق (مثل إشارة صوتية والطبية إشارة الصورة) وتجهيز والطيف مجال الاستشعار [3]. وقد اقترحت SFT عدد كبير من الخوارزميات، التي تستخدم التردد المتعدد الكلاسيكية تقدير خوارزمية فرعية من دون نيكويست أخذ العينات النقاط عن طريق تحويل فورييه إعادة الإعمار تردد متفرق [4]. ومع ذلك، يتم الحصول عليها نتيجة لفرعية نيكويست-معدل العينة SFT الكلاسيكية عن طريق اخذ عينات متعددة، وبالتالي، فإنه لا يمكن أن تحل محل الكلاسيكية SFT الاتحاد الفرنسي للتنس للتعامل مع إشارات في الوقت الحقيقي، مثل إشارات الرادار.

منذ عام 2010، وقد تم SFT خوارزمية لهياكل موازية قلقا واسع النطاق [5]. SFT مواز من قبل أخذ العينات بالتوازي الأولى، في كل وقت الحصول على البيانات نطاق المطلوب للحساب، ثم من خلال الاتحاد الفرنسي للتنس، والتردد والسعة للإشارة تم الحصول عليها متفرق خلال alkylene الخطية طريقة التقدير الطيفي. لأن مثل طريقة تكرارية للحصول على كافة المعلومات بالتوازي تبديل الطيفية تقدير المطلوبة معالجة في الوقت الحقيقي يمكن أن يكون التردد نطاق إشارة متفرق، بحيث SFT الكلاسيكية تحسينها. وبناء على هذا، إشارة [6] إلى [8] تناقش تنفيذ متفرق تحويل فورييه على GPU وحدة المعالجة المركزية متعددة النوى. وتشير هذه الدراسات والحلول تسارع GPU لتحقيق أعلى بكثير من سرعة التشغيل من وحدة المعالجة المركزية على أساس التنفيذ. GPU مشكلة التفاعل ومع ذلك، تستند تطبيقات هناك اتصال مع GPU منطقة تخزين الذاكرة الرئيسية، وبالتالي ليس التدفق الطبيعي للبيانات بين الترويج أفضل.

لمعالجة أوجه القصور في الخوارزميات المتوازية GPU المعالجة المتوازية للبيانات، فإن هذه الورقة SFT وتفعيله على FPGA، في حين تطبق المبادئ الأساسية الباقي الصينية نظرية (CRT) لإعادة الإعمار إشارة. مقارنة SFT التقليدية، وصفت وسائل هنا يمكن أن يقلل كثيرا من تعقيد النظام، والحد من النفقات العامة الأجهزة. هذا المقال الأول يدخل في إطار مواز SFT، ومن ثم مناقشة SFT على بنية FPGA، وتحقيق أخيرا جانبان لتقييم نتائج النظام من المحاكاة والأجهزة.

1SFT خوارزمية موازية

SFT الخوارزمية أساسا موازية من جانب تقدير تردد أخذ العينات، واتساع قدر من ثلاثة أجزاء. عملية الاختزال، وينقسم إشارة الدخل إلى مجموعات N، وكانت كل مجموعة أخذ العينات العوامل 1، 2، ...، N. باستخدام نظرية الباقي الصينية (الصينية بقايا نظرية، CRT) وتقدير السعة من تردد، يتم تعيين عامل أخذ العينات لكل زوجيا مجموعة رئيس نسبيا.

موازية عينات خوارزمية SFT L من نقاط العينة التي أعيد بناؤها 2 المعلمات K المحسوبة، بما في ذلك المعلمة K تأخير والمعلمات K السعة. خطوات حساب طريقة إعادة الإعمار هي كما يلي: أولا، تعيين عدد من القنوات أخذ العينات هو N، عدد العينات لكل قناة لتشي، ط = 1،2، ...، N. الحوسبة X ~ = M * X، حيث M هو مصفوفة الاختزال، X هو عينة عينة. بعد ذلك، X ~ ينفذ DFT تحويل، X ^ = DFT (X ~). من خلال خفض ترتيب ناقلات قيمة السعة X ^، وتحسب هونج كونج:

هونج كونج = kthMAX | X ^ ي |، k [0، K] (1)

حيث K هو المعلمة التي يحددها إشارة أعيد بناؤها. بعد يمكن الحصول عليها عن طريق هونج كونج معامل باقي القسمة للحصول على المعلومات تبقى R1، khk موقف modq1. البحث عن الحل الأمثل للفترة المتبقية عن طريق الاستعلام متوازي:

tminmint [0، QJ] | هونج كونج-X ^ ر * Q1 + R1، ك |، j [2، N] (2)

RJ، ك = R1، ك + tmin * q1modqj، j [2، N] (3)

A CRT التي كتبها R1، ب، ...، RN، ب المعلمة k تأخير إعادة الإعمار، المعلمة تقدير السعة من المعادلة (4) و (5) الغلة:

س = الحقيقي (هونج كونج) | k

ذ = ايماج (هونج كونج) | k (4)

حزب العدالة والتنمية = | س + IY | (5)

الجزء الرئيسي من 2SFT FPGA لتحقيق

وتعتبر هذه الورقة استخدام الأدوات اللازمة لبناء أبنية تنفيذ خوارزمية FPGA SFT MATLABSimulink أخذ العينات. ويبين الشكل 1 قناة عند عدد العينات N = SFT عندما هيكل مواز 3، والذي يتضمن تقدير تردد أخذ العينات، واتساع قدر من ثلاثة أجزاء.

كما هو مبين، واتساع التقدير تردد يقدر 1 حصة نفس الأجهزة شاردة، بعد أخذ العينات إشارة بعد إشارة خرج حصلت عليها عملية الاتحاد الفرنسي للتنس معقدة، لفرز إشارة المعقدة، ومعقدة الإجلاء إشارة مودولو شبكة الفرز، لأن كل قناة الفرز في نقاط مختلفة من الشبكة، فإن بنية الشبكة أن يكون نوع مختلف قليلا. قبل استخدام السعة إشارة المقدرة وتردد CRT، فمن الضروري لتقييم إشارة I، فإن الحل الأمثل التشغيلي. حيث العملية الأساسية هي الحل الأمثل فرز الشبكة، والحصول على الحد الأقصى لقيمة إشارة الدخل عن طريق التفكير شبكة الفرز والحصول على إعادة ترتيب إشارة موقف في إشارة الدخل الاصل، وCRT من قبل عدد من وحدات تتألف من الأفاعي ومضاعفات.

إشارة المدخلات من خلال المضاعف للحصول على إشارة عينات، حتى أن الجزء الرئيسي من تردد أخذ العينات والتقديرات مقدر إشارة السعة، والحل الأمثل ويضم وحدة تقدير تردد، وCRT وحدة إعادة الإعمار. وعلاوة على ذلك، تكوين الأجهزة يضم القطاع الذاكرة وحدة تحكم أخرى، عدد العينات عامل QL كل قناة، ور المعلمة والفرز موقف المعلومات المخزنة في وحدة تخزين وهلم جرا، وحدة التحكم يولد قيمة عنوان لتنفيذ عمليات القراءة والكتابة من الذاكرة، وإخراج اللازمة حساب إشارة التحكم لتهيئة وحدة.

في هذا التصميم، وطول إشارة إعداد N = 223، وعدد من المعلمات K، وعدد من القنوات أخذ العينات M = 3، حيث نقاط أخذ العينات من القنوات منها هي على التوالي Q1، Q2، Q3، Q1، Q2، Q3 و زوجيا كتلة المنتج هو أكبر من طول إشارة N، وبالتالي، استحوذت قد نقاط Q1 + Q2 + أخذ العينات Q3 جميع المعلومات الواردة في إشارة الأصلية نظرية الباقي الصينية، وانخفاض في السعة وعدد العينات المطلوبة لتقدير تردد. وتتمثل المهمة الرئيسية للتصميم التالية من كل وحدة مقدمة.

تقدير 2.1 التردد

2.1.1 وحدات لتحقيق العمارة الحل الأمثل

وحدة تقدير التردد للحصول على جزء أساسي من الحل الأمثل، والحل الأمثل لتحقيق العمارة هو مبين في الشكل 2. يتم الحصول على FIG X ^ ر * Q1 + R1، عينات ك يمكن أخذ عينات من خلال المضاعف MUX، اعتمادا على ويمكن الحصول على قيمة ر تعدد القيم عينة من نقطة أخذ العينات. عندما يكون الترتيب لتكوين شبكة ثلاثية المدخلات، k1،1 R1، ممثل ك للهندسة الشبكات نوع من FIG. حصلت على 2 وحدة وحدة شبكة الأمثل، k1،2، ويأخذ البيانات k1،3 قيمة المقابلة موقف المعلومات التي تم الحصول عليها لQ1 الباقي. T هو في حدود 0 ~ QJ، ي = 2،3، حيث، عندما ي = 2، Q2 = 4، وبالمثل، هناك Q3 = 5؛ ر مجرد تغيير القيمة في كلتا الحالتين تؤدي إلى نقطة العينة عينة تغيير في القيمة، وحدات الهندسة المعمارية المقابلة هي نفسها، لذلك هنا فقط هو الحال عندما ي = 2 لتحليلها.

هيكل أمر من الشبكة، وإدخال البيانات المطلوبة هي مجموعتين من البيانات ليتم فرزها، من أجل الحصول على قيمة الحد الأدنى، مقارنة مع مجموعة أخرى من البيانات المقابلة لر معلومات الموقع. فرز الشبكة بحيث بعد الحصول على قيمة الحد الأدنى للر يمكن الحصول على القيم المناظرة مباشرة دون الحاجة إلى عملية حسابية إضافية. لهذا السبب، والحاجة لفرز واجهة إدخال البيانات بالتوازي بيانات الاستيراد فرز الشبكة، هو عرض معلومات الموقع المقابل لقيمة ر أيضا بالتوازي فرز المعلومات موقف شبكة من واجهة.

كما هو مبين في الشكل (3)، وإشارات رقم 3 الإدخال الأصلي 1،2،3. هذه الوحدة تنفذ هذه الإشارات الثلاث للالهابطة النوع، وإشارات الحصول عليها الفرز SN في تسلسل الأصلي، أي، لتأخذ مكان. ويبين الشكل 3 هيكل المدخلات فرز FIG. 3، ونفس المبدأ أكثر المدخلات 4 مدخلات التكوين الرسم البياني للمقارنة خرج، محطة FIG اختيار قانون حالة الطوارئ مدخلات معدد، والأجهزة الدائرة مقارنة باستخدام ومحدد المضاعف فرز إتصال تحقيق خيار أكثر منطقية. k1،1، k1،2، k1،33 مرتبة إشارة المدخلات إشارة خرج من الشبكة، وهناك k1،1 > k1،2 > k1،3. k1،1_loc، سجلت k1،2_loc، k1،3_loc k1،1، k1،2، k1،3 موقعها الأصلي في التسلسل. في حين أن معلومات الموقع المخزنة في ذاكرة معلومات الموقع.

2.1.2CRT حدات الهندسة المعمارية

وحدة المثلى إخراج مجموعة من مجموعة من المعلومات الباقي من الباقي الصينية نظرية يمكن بسهولة الحصول على مجموعة تردد من خلال تجميع مجموعة من الجمع، وكذلك يمكن الحصول على k المعلمة تأخير. من قبل ما تبقى الصينية نظرية يمكن الحصول على المعادلات التالية:

xr1 (modq1)

xr2 (modq2)

xrn (modqn) (6)

أين ري (ط = 1،2، ...، ن) هو مجموعة من الترددات، تشي (ط = 1،2، ...، ن) هو مجموعة من النقاط أخذ العينات. ومن المفترض Q Q1 إلى QN للمنتج، وقدمت تشى = Q / تشي، i {1،2، ...، ن}، منظمة الشفافية الدولية على المعاملة بالمثل من وضع تشى عدد تشي، هناك:

س = = ni 1ritiQi (7)

يبين الشكل (4) وحدات الهندسة المعمارية من CRT إعادة بنائها صناديق تردد.

تقدير حجم 2.2

السعة تقدير، حصلت على وحدة إعادة الإعمار CRT مجموعة من الترددات W1، W2، على التوالي L1، L2 كعملية الباقي، وحصل HK كأساس، باستخدام الصيغة السابقة (4) و (5) يمكن الحصول على النسخة الأصلية اتساع التقدير إشارة. حيث مجموعة من الترددات W1، W2 يتم الحصول عليها عن طريق وحدة نمطية CRT، ما تبقى من عمل FIG. 5 هو عبارة عن مجموعة من الترددات W1، W2 على التوالي نقاط L1، L2 أخذ العينات لتشغيل الباقي. يتم تخزين XL تسلسل المدخلات، وقيمة تبعثر، وعدد من القنوات أخذ العينات، وأخذ العينات نقاط لكل قناة في الدعوة مضاعف السجل. يتم تحديد شبكات فرز باستخدام قيمة الحد الأقصى من إشارة الدخل من الجزء الحقيقي والوهمي، وبعد ذلك قدرت يتم الحصول مودولو السعة القيمة. نموذج تقدير السعة هو مبين في الشكل (5)، وفيه بنية إدخال شبكة فرز 4.

النتائج تحليل وتقييم الأداء 3

لتقييم فعالية خوارزمية الإطار، والتي لا مقارنة مع FFTW، FFTW المكتبة حساب سريع لتحويل فورييه المنفصل، يمكن تشغيل المكتبة على وحدة المعالجة المركزية متعددة النوى وGPU. تعتبر ك تبعثر على حدة هو تغيير ثابت في إشارة 1000 عندما تأثير طول وقت التنفيذ، وإشارة من تغيير ثابت طول N تأثير 223 تبعثر في وقت التنفيذ، ونتائج المقارنة هو مبين في الشكل 6.

متفرق تحويل فورييه نوقشت هنا ويعرف عينة إطار خوارزمية إطار المرصد المغربي للسجون للمقارنة في الأداء، وتنفيذ طول إشارة N = 32، K = 2 عدد المعلمات وعدد إطار العينة من نقاط أخذ العينات. حيث، كتلة ذاكرة RAM كل هذا مع ناقل أو مصفوفة ثابتة. المرصد المغربي للسجون العمارة [9] وSFT العمارة [10] من أجل تحقيق مقارنة مع الخوارزمية في نفس العمارة منصة، في النتائج التي تظهر في الجدول 1.

بالمقارنة مع الهندسة المعمارية المرصد المغربي للسجون، وهذا يعرض ورقة الهندسة المعمارية وكثيرا يقلل من عدد السجلات DSP48E المطلوبة. بالمقارنة مع الأدب [10] اقترح SFT الهندسة المعمارية، وهذه العمارة لا يزال لديهم أداء جيد.

4 خاتمة

في هذه الورقة، وSFT مواز خطة تنفيذ تنفيذ FPGA بناء FPGA الإطار مع أدوات تطوير SIMULINK XSG. معالجة وظيفة وقت التنفيذ كتلة موازية مستقلة يمكن أن تخفض إلى حد كبير. بعد الأجهزة على تنفيذ FPGA تم تقييمها فيما يتعلق بتنفيذ FFTW، عندما يكون عدد ترتيب نقاط أخذ العينات هو كبير بما فيه الكفاية، لتحسين سرعة التشغيل، والحد من الوقت اللازم لحساب، نسبة إلى خوارزميات أخرى مثل FPGA المرصد المغربي للسجون تنفيذ برامج للحد من استهلاك الموارد ويقلل من تعقيد النظام.

مراجع

[1] ايدينر A A، C WENG C، كلمات J، وآخرون A متفرق البيانات بسرعة تحويل فورييه (SDFFT) [J] المعاملات IEEE على الهوائيات والدعوة، 2003، 51 (11): .. 3161-3170.

[2] IWEN M A. A الوقت sublinear القطعية متفرق فورييه الخوارزمية عبر nonadaptive مضغوط الاستشعار عن طرق [C] وقائع الندوة التاسعة عشر ACMSIAM سنوية عن المتقطعة الخوارزميات، 2008 :. 2029.

. [3] جميلة، تشو تشي قانغ، لى بى بى انخفاض معدل أخذ العينات على أساس متفرق تحويل فورييه النطاق العريض الاستشعار الطيف [J] تطبيق تقنيات الالكترونية، عام 2015، 41 (11): 85-88.

. [4] GILBERT A C، شتراوس M J، J TROPP A. وهناك أمثلة توضيحية على أخذ العينات فورييه السريع [J] الإشارة مجلة IEEE معالجة، 2008، 25 (2): 57-66.

. [5] وانغ تشنغ، ARAYAPOLO M، S تشاندراسكاران، وآخرون الموازي الاتحاد الفرنسي للتنس متفرق [C] .Proceedings ورشة العمل 3 للتطبيقات غير النظامية :. البنى والخوارزميات ACM، 2013: 10: 1-10: 8.

[6] هو جيا شي وانغ Zhaosen، تشيو تشى يوان، وآخرون. متناثر تحويل فورييه السريع على وحدات معالجة الرسومات وmulticore وحدات المعالجة المركزية [C] .2012 IEEE 24 الندوة الدولية حول العمارة الحاسوب والحوسبة عالية الأداء (SBACPAD)، IEEE، 2012: 83-91.

[7] BRAUN T R. تقييم لتسريع GPU لإعادة الإعمار متفرق [J]. قائع الجمعية SPIEThe الدولي للهندسة الضوئية، 2010، 7697.

[8] وانغ تشنغ، تشاندراسكاران S، CHAPMAN B. cusFFT: أ highperformance متفرق بسرعة تحويل فورييه الخوارزمية على وحدات معالجة الرسومات [C] .Proceedings من بالتوازي 30 IEEE الدولية والندوة وزعت تجهيز (IPDPS)، 2016: 936-972.

. [9] RABAH H، AMIRA A، B موهانتي K، وآخرون FPGA تنفيذ السعي مطابقة متعامد لإعادة الإعمار الاستشعار عن الضغط [J] المعاملات IEEE على أنظمة كبيرة جدا مقياس التكامل، 2015، 23 (10) :. 2209-2220.

[10] AGARWAL A، HASSANIEH H، O ABARI، وآخرون Highthroughput تنفيذ millionpoint متفرق تحويل فورييه [C] المؤتمر .IEEE على حقل للبرمجة المنطق والتطبيقات (قوات التحرير الشعبية)، 2014 :. 1-6.

احتفال يوم الطفل، لشراء بعض الأيدي كبيرة للقيام بذلك، وهذا النوع من سوبر فعالة من حيث التكلفة

MIMO أداء الشبكة تتابع TAS / MRC تلف الأجهزة تحت ظروف

تشونغتشينغ لها لحماية الحياة البرية في أفريقيا، والاستماع إلى هدير الصوت النوم شو أفريقيا الشواء ذلك لفصل الشتاء الرعي في تشونغتشينغ ذلك سعيدة

"X-الرجال: متحولات جديدة" يتعرض أول مقطورة الطيار الصيني الكون X-الرجال حقن الشاشة دموية جديدة

المقارنة بين الإشارات المختلفة DOA خوارزمية تقدير

الأعمال التجارية للمرأة يشتبه في أنه كان الوشق 2 إلى 1 التعادل، وزيادة كبيرة في سعر Jingdong، Jingdong استجابة صعبة

"مدينة الجريمة النفسية الخفيفة" اللقطات التعرض دينغ تشاو قوات الشرطة التدريب على القتال تجربة الحياة شي شي

"مصير / EXTELLA LINK" والنسخة الصينية سيكون على بيع 13 سبتمبر

الفيلم الصيني لا يمكن أن تصمد أمام مثل هذه الهزيمة

الرجال لا العمل في أول فتاة البصر الانتظار لمدة 50 يوما تقريبا تسعة أصدقاء لا يريدون للمساعدة في العثور

المديرين التنفيذيين إكس بوكس: "حملة 3" لا يزال في التنمية

كوك: AR يجعلني أريد أن تصرخ مع الإثارة، وليس للابتكار والقلق