• +66 (0) 76 670 195
  • +66636502456
  • This email address is being protected from spambots. You need JavaScript enabled to view it.
  • Mon-Fri 8:00-17:30

วิธีเพิ่มความเร็วคอมพิวเตอร์ของคุณสำหรับการจำลอง CFD

อย่างที่คุณคาดหวังผู้ผลิต CPU ไม่ยอมแพ้ให้แก่ GPU และมีแอพพลิเคชั่นมากมายที่มีแนวโน้มมากที่สุดไม่ควรลืมว่า GPU ไม่ได้มีไว้เพื่อประสิทธิภาพด้านกราฟิกเท่านั้นแต่ยังมีแนวโน้มที่จะมีความสามารถเพิ่มขึ้นเพื่อใช้งานทั่วไปปัจจุบัน GPUs ยังคงพัฒนาอยู่แต่สิ่งสำคัญคือต้องจำไว้ว่ามันไม่ได้ออกแบบมาเพื่อประสิทธิภาพกราฟิกเพียงอย่างเดียว

บทนำอย่างที่คุณคาดหวังผู้ขาย CPU ไม่ยอมแพ้ GPU และมีแอพพลิเคชั่นมากมายที่มีแนวโน้มมากที่สุดไม่ควรลืมว่า GPU ไม่ได้มีไว้เพื่อประสิทธิภาพด้านกราฟิกเท่านั้นแต่ยังมีแนวโน้มที่จะเพิ่มขึ้นเพื่อใช้งานทั่วไป GPUs ยังคงพัฒนาอยู่แต่สิ่งสำคัญคือต้องจำไว้ว่ามันไม่ได้ออกแบบมาเพื่อประสิทธิภาพกราฟิกตัวอย่างเช่น Intel ได้เปิดตัว Intel Integrated Graphics Integrated Core (IGC) และ Intel Open Compute Engine (FINE) ซึ่งสามารถรวมหลายคอร์กับเครื่องมือและวิธีการโปรแกรมทั่วไปเพื่อให้บรรลุผลดังกล่าว Fine Open ใช้ GPU NVIDIA K20 หลายร้อยตัวที่รวมกันในขั้นตอนเดียวซึ่งหมายความว่ามีเพียงไม่กี่วันที่สั้นลงเมื่อเทียบกับวิธีการก่อนหน้าซึ่งอาจใช้เวลาถึงหนึ่งสัปดาห์ในการคำนวณที่คล้ายกันเราใช้ CPU Booster ซึ่งช่วยให้การบรรจบกันอย่างรวดเร็วและเราใช้ขั้นตอน 2,000 ครั้งต่อ GPU หรือ 1.5 เท่าของจำนวนแกนประมวลผลแต่ละขั้นตอนสามารถเสร็จสิ้นในเวลาน้อยกว่าหนึ่งวันรวมถึงตัวอักษรโซลูชันซึ่งหมายความว่าเราสามารถลดการไหลของมวลจากจุดการออกแบบไปสู่สถานะที่มั่นคงในเวลาน้อยกว่าสองชั่วโมงส่งผลให้ชุดข้อมูลทั้งหมดมีขนาด 20 เทราไบต์ AmgX - การทำงานร่วมกันของ NVIDIA กับ ANSYS การเพิ่มประสิทธิภาพนั้นเกิดจากตัวเร่งความเร็วของ GPU ที่พัฒนาโดย NVIDIA ร่วมกับ ANSYS ภายใต้ชื่อ AmgX GV100 ผสานประสิทธิภาพที่มีความแม่นยำสองเท่าอย่างที่ไม่เคยมีมาก่อนเพื่อให้ผู้ใช้สามารถเรียกใช้การจำลองตลอดกระบวนการออกแบบและสร้างการจำลองหลายฟิสิกส์ที่สมจริงได้เร็วขึ้นกว่าที่เคยเป็นมา ANsYS (r) Fluent (r) ให้การสนับสนุนหลาย GPU สำหรับการเพิ่มผลผลิตในการจำลอง CFD ในบริบทนี้วิวัฒนาการของเทคโนโลยีโปรเซสเซอร์ Intel (r) ได้เพิ่มประสิทธิภาพโปรเซสเซอร์ในแอปพลิเคชัน CFD ในขณะที่ปัญหาประสิทธิภาพการทำงานของแต่ละกระบวนการได้รับการกล่าวถึงบางส่วนในระดับแอปพลิเคชันด้วยอัลกอริธึมที่เป็นระเบียบเช่น Cuthill และ McKee แต่ก็ลำบากที่จะใช้ประโยชน์จากประสิทธิภาพของกระบวนการอย่างเต็มที่เนื่องจากจำนวนการคำนวณที่เกี่ยวข้องกับตัวคำนวณ CFD การใช้งาน Fluent สามารถเร่งอัตราการไหลของการจำลอง CFD ได้มากถึง 50% และในบางกรณีสูงถึง 100% การไหลแบบคู่ที่อิงกับความดันเช่น scFLOW และ AmgX ของ NVIDIA RAM (การใช้หน่วยความจำ) มีบทบาทอย่างไรในการจำลอง CFD หากคุณมี RAM เพียงพอคุณอาจมีหน่วยความจำไม่เพียงพอในระหว่างการศึกษาที่ซับซ้อนและจบลงด้วยการไม่มีตัวแก้ปัญหาโปรเซสเซอร์ Xeon (r) มอบคอร์หน่วยความจำและพื้นที่เก็บข้อมูลจำนวนมากขึ้นเรื่อยๆหน่วยความจำเพิ่มเติมสามารถเพิ่มความเร็วในการศึกษาของคุณในขณะที่มั่นใจได้ว่าความเร็วหน่วยความจำตรงกับที่ของ CPU ผลกระทบของความเร็วแรมนั้นยากที่จะวัดได้อย่างมีประสิทธิภาพทำให้ราคาและประสิทธิภาพนั้นยากต่อการพิจารณา RAM ที่เร็วกว่าสามารถปรับปรุงประสิทธิภาพได้แต่ RAM ขนาดใหญ่ที่ทำงานเร็วมากอาจมีราคาแพงเราขอแนะนำให้เลือก RAM ที่เร็วที่สุดที่เหมาะสมกับงบประมาณของคุณและในกรณีที่มีข้อสงสัยให้เลือก RAM ที่แพงที่สุดตรวจสอบว่ามีวิธีการใช้ RAM บนบอร์ดหรือไม่เช่นด้วยฮาร์ดไดรฟ์หรือไดรฟ์ภายนอกณจุดนี้ควรสังเกตว่าประสิทธิภาพการทำงานแบบขนานที่ปรับปรุงแล้วภายในโหนดนำไปสู่การเพิ่มขึ้นอย่างมีนัยสำคัญในจำนวนของแกนประมวลผลต่อหน่วยเก็บข้อมูล (MPP) ของจำนวนที่กำหนดโปรเซสเซอร์ที่ปรับขนาดได้ Intel Xeon มี MP P ต่ำกว่าเมื่อเทียบกับโปรเซสเซอร์ Xeon ของพวกเขาดังที่แสดงให้เห็นอย่างชัดเจนโดยความแตกต่างด้านประสิทธิภาพระหว่างโปรเซสเซอร์ Xeon Scalable และโปรเซสเซอร์ Xeon E5 - 2650 HiFUN solver ในการศึกษานี้การปรับปรุงการใช้แคชที่ตัวแก้ปัญหา HiFUN ใช้ประโยชน์ซึ่งนำไปสู่ประสิทธิภาพการทำงานแบบเส้นตรงสามารถนำมาประกอบกับ Intel (r) MPI ไลบรารี่ที่เหมาะสำหรับการจัดการหน่วยความจำอันทรงพลังและการใช้แคช GPU ความหนาแน่นแกนกลางที่สูงขึ้นของตัวแก้ปัญหา HiFUN ที่ใช้โปรเซสเซอร์ Intel Xeon ที่ปรับขนาดได้นั้นเป็นผลมาจากไลบรารี MPI ของ Intel (r) ซึ่งเหมาะสำหรับการจัดการหน่วยความจำที่ทรงพลังและการใช้แคชแคช GPU ความหนาแน่นแกนกลางที่สูงขึ้นจะปรับปรุงประสิทธิภาพการทำงานแบบขนานภายในโหนดและควรอนุญาตให้ผู้ใช้สร้างคลัสเตอร์ขนาดกะทัดรัดมากขึ้นด้วยจำนวนแกนประมวลผลที่เฉพาะเจาะจงโดยสรุปเราได้แสดงวิธีการปรับปรุงประสิทธิภาพของโหนดเดี่ยวของตัวแก้ปัญหา Hi-FUND โดยการเพิ่มจำนวนหากแรมที่มีอยู่ต่ำกว่าความต้องการของรูปแบบตัวแก้ปัญหาต้องทำการแลกเปลี่ยนไฟล์ซึ่งจะทำให้การวิเคราะห์ช้าลงอย่างมากเราติดตั้งเครื่องจักรของเราด้วย 64 GB และใช้ Flex Cloud Solving สำหรับรุ่นที่มีขนาดใหญ่ขึ้นเนื่องจากมีความจุ 120 GB SSDs, ปรับปรุงประสิทธิภาพของดิสก์ไดรฟ์เวิร์คสเตชั่ส่วนใหญ่ได้รับการออกแบบมาเพื่อความสมดุลของความจุเทียบกับประสิทธิภาพ - อย่างน้อยเมื่อมันเกี่ยวข้องกับการจัดเก็บดิสก์ไดรฟ์เนื่องจากไฟล์วิศวกรรมและเวิร์กโหลดอาจมีขนาดไฟล์ใหญ่เวิร์คสเตชั่นจึงมีฮาร์ดไดรฟ์ความจุสูงซึ่งโดยทั่วไปอาจมีประสิทธิภาพน้อยกว่าฮาร์ดไดรฟ์ที่มีความจุน้อยการปรับปรุงล่าสุดของเทคโนโลยีไดรฟ์ซึ่งอยู่ในประเภทของไดรฟ์โซลิดสเตต (SSD) มีการขจัดมิติเทียบกับอุปสรรคด้านประสิทธิภาพ SSD มีความจุขนาดใหญ่และให้ประโยชน์มากมายกับฮาร์ดไดรฟ์แบบแกนหมุนทั่วไป SSD สามารถกำจัดปัญหาคอขวดที่สร้างขึ้นจากไดรฟ์ที่ใช้แผ่นแบบดั้งเดิมและเพิ่มประสิทธิภาพของระบบอย่างทั่วถึงเวิร์คสเตชั่ประสิทธิภาพสูงโดยเฉพาะที่ใช้สำหรับ CAD, การจำลองหรือการออกแบบกราฟิกมักติดตั้ง CPU ประสิทธิภาพสูงที่สร้างความรู้สึกเทียบกับงบประมาณอย่างไรก็ตามประสิทธิภาพของดิสก์ IO มักมีความสำคัญในการใช้งานเป็นประจำทุกวันเพื่อลดปริมาณเวลาที่คุณต้องใช้ในการทำงานให้เสร็จเนื่องจากเวลาเป็นเงินสำหรับผู้ใช้เวิร์กสเตชันจำนวนมากการทำให้งานปัจจุบันเสร็จสิ้นและบทความต่อไปของแรงงานเป็นสิ่งสำคัญเดิมเวิร์คสเตชั่ประสิทธิภาพใช้ไดรฟ์อินเทอร์เฟซระบบประมวลผลขนาดเล็ก (SCSI) ที่มีความเร็วในการหมุนสูงมาก (15,000 รอบต่อนาที) เพื่อเอาชนะความยากของ IO ในดิสก์การรวมไดรฟ์ที่มีประสิทธิภาพดีที่สุดในระหว่างดิสก์สำรองที่ซ้ำซ้อน (RAID) 1 - หรือเพื่อประสิทธิภาพที่มากขึ้น RAID 0 Stripe - สร้างโซลูชันที่มีประสิทธิภาพแม้ว่าจะมีราคาแพงต่อความท้าทายด้านประสิทธิภาพด้วยไดรฟ์กลแบบดั้งเดิม SSD ไม่ได้รับผลกระทบจากความล่าช้าทางกลไกทำให้เป็นเกณฑ์มาตรฐานที่ไม่เกี่ยวข้องเพื่อชี้ให้เห็นถึงความแตกต่างด้านประสิทธิภาพระหว่าง SSD และไดรฟ์ดั้งเดิมประสิทธิภาพดีที่สุดในการตัดสินด้วย IOs ต่อวินาทีและ SSD ไดรฟ์ที่มีอยู่จริงในหมวดนั้นข้อได้เปรียบด้านประสิทธิภาพนั้นจะเพิ่มขึ้นอีกเมื่อมีการใช้งาน SSD ในระหว่างการโจมตีโดยทั่วไป RAID 1 หรือ 0 เป็นบรรทัดฐานสำหรับการใช้งานเวิร์กสเตชันแม้ว่าในบางกรณี RAID 5 หรือการกำหนดค่าอื่นๆก็สามารถรับประกันได้เช่นกัน SSD ที่เพิ่มความจุผ่าน RAID ไม่ได้เพิ่มความล่าช้าหากมีสิ่งใดประสิทธิภาพจะได้รับการปรับปรุงเมื่อมีการเพิ่มไดรฟ์มากขึ้นด้วยเทคโนโลยีการสตริปและการทำมิรเรอร์ซึ่งโดยปกติแล้วจะมีการขับเคลื่อนด้วยฟิสิคัลไดรฟ์ซึ่งไม่ประสบปัญหาความล่าช้าทางกลเนื่องจาก SSD ยังมีราคาตกเทคโนโลยีจึงเหมาะสมสำหรับผู้ที่ต้องการเพิ่มประสิทธิภาพการจำลองซึ่งการเขียนและอ่านดิสก์ขนาดใหญ่เป็นบรรทัดฐานวิธีการที่ GPU ก้าวเข้ามาใน CAE Simulation ไม่มีอะไรส่งผลกระทบต่อประสิทธิภาพการมองเห็นของการจำลองค่อนข้างกราฟิกการ์ดในขณะที่การคำนวณจำนวนมากและการเคลื่อนไหวของข้อมูลดำเนินต่อไปหลังฉากระหว่างการจำลองแต่เป็นการแสดงด้วยภาพของการจำลองที่มีผลกระทบยาวนานต่อผู้สังเกตการณ์ไม่ว่าจะเป็นการจำลองการไหลของมุมมองหรือจุดเน้นความเครียดไม่ใช่ส่วนสำคัญจริงๆที่นี่ทุกอย่างมาถึงความรวดเร็วในการแสดงเหตุการณ์จำลองที่รวดเร็วราบรื่นและแม่นยำการ์ดกราฟิกของเวิร์คสเตชั่นไม่ถูกและโน้มน้าวใจว่าเป็นการลงทุนครั้งใหญ่เมื่ออัพเกรดเวิร์คสเตชั่นอย่างไรก็ตามการทำความเข้าใจกับมูลค่าของการลงทุนนั้นอาจจะซับซ้อนกว่านี้เล็กน้อยซึ่งเป็นไปได้ที่จะลงทุนเทคโนโลยีกราฟิกการ์ดมากเกินไปเคล็ดลับคือการเชื่อมโยงประสิทธิภาพที่ต้องการกับความสามารถกราฟิกการ์ดโดยรวมซึ่งอาจพิจารณาได้จากความช่วยเหลือของผู้จำหน่ายซอฟต์แวร์จำลองผู้จำหน่ายซอฟต์แวร์จำลองสถานการณ์ส่วนใหญ่เสนอคำแนะนำเกี่ยวกับฮาร์ดแวร์กราฟิกและทำงานได้ดีพอสมควรในด้านประสิทธิภาพของการจำลองความสัมพันธ์กับแพลตฟอร์มฮาร์ดแวร์ที่กำหนดดังกล่าวด้วยการทดลองและความเข้าใจเชิงลึกเกี่ยวกับกราฟิกการ์ดหรือ GPU ผู้ใช้อาจพร้อมที่จะเลือกผลิตภัณฑ์ที่มีประสิทธิภาพดีกว่าที่ผู้ขายแนะนำทุกสิ่งมาถึงสิ่งที่ดูเหมือนจะเป็นระหว่างกราฟิกการ์ดอีกครั้งซอฟต์แวร์จำลองที่ใช้กำหนดตัวเลือกที่ง่ายที่สุดตัวอย่างเช่นซอฟต์แวร์ที่ขึ้นอยู่กับความสามารถของ 3D หรือความต้องการเกี่ยวกับการถ่ายภาพขั้นสูงอื่นๆอาจเป็นตัวกำหนดประเภทของการ์ดโชคดีที่ตลาดมีระเบียบพูดง่ายๆก็คือ GPU จะจัดการกระบวนการเอฟเฟกต์พิเศษและการแสดงผลของคุณเนื่องจากการประมวลผลหลายตัวโดยทั่วไปจะมีประสิทธิภาพมากกว่า CPU ในซอฟต์แวร์ที่ออกแบบมาเพื่อต้องการความได้เปรียบ GPU ที่ได้รับการปรับให้เหมาะสมที่สุดสำหรับแอพพลิเคชั่นที่เน้นกราฟิกระดับมืออาชีพเช่นการสร้างภาพข้อมูลและการวิเคราะห์นั้นพบได้ใน AMD FirePro และเวิร์คสเตชั่นกราฟิกการ์ดของ NVIDIA การ์ด 2D ระดับมืออาชีพสามารถจัดการการประมวลผล 3D บางอย่างแต่ไม่เหมาะสำหรับแอปพลิเคชัน 3D ปกติโดยทั่วไปแล้วพวกเขาไม่สามารถทำงานร่วมกับวิศวกรรมได้สำหรับการจำลองสถานการณ์ระดับมืออาชีพการ์ดเสริม Quadro หรือ FirePro 3D อาจเป็นข้อกำหนดแต่ละสายผลิตภัณฑ์นั้นมีโมเดลประมาณครึ่งโหลซึ่งอยู่ภายใต้หมวดหมู่ผลิตภัณฑ์สี่ประเภทเช่นระดับเริ่มต้นระดับกลางระดับไฮเอนด์และระดับไฮเอนด์พิเศษ (วิศวกรรมเดสก์ท็อปจะตรวจสอบการ์ดกราฟิกที่หลากหลายในปัญหาที่จะเกิดขึ้น) มีข้อยกเว้นอยู่เสมอแต่ผู้ซื้อส่วนใหญ่จะต้องการจับคู่ประสิทธิภาพและความสามารถของ GPU กับส่วนที่เหลือของระบบ - นั่นคือการ์ดรายการขนาดสำหรับเวิร์คสเตชั่นรายการขนาดเส้นผ่าศูนย์กลางการบรรลุความสมดุลที่ดีซึ่งส่วนประกอบแต่ละชิ้นมีระดับประสิทธิภาพที่รองรับโดยส่วนที่เหลือของระบบคือขอบคุณที่ดีที่สุดในการเพิ่ม ROI ให้สูงสุดสำหรับการซื้อเวิร์กสเตชันของคุณและเพิ่มประสิทธิภาพการทำงานของคุณอ้างอิงจาก References https://www.nvidia.com/en-us/data-center/gpu-accelerated-applications/ansys/ 0 https://www.engineering.com/DesignSoftware/DesignSoftwareArticles/ArticleID/18406/NUMECA-Brings-Massive-Boosts-to-CFD-Simulation-Speeds.aspx 1 https://knowledge.autodesk.com/support/cfd/learn-explore/caas/sfdcarticles/sfdcarticles/Hardware-recommendation-for-Simulation-CFD-2016.html 2 https://www.flow3d.com/hardware-selection-for-flow-3d-products/ 3 https://www.digitalengineering247.com/article/optimize-workstations-for-faster-simulations/ 4 https://www.javelin-tech.com/blog/2016/09/solidworks-simulation-hardware-recommendations/ 5 https://techdecoded.intel.io/resources/parallel-cfd-with-the-hifun-solver-on-the-intel-xeon-scalable-processor/ 6


Please publish modules in offcanvas position.