• +66 (0) 76 670 195
  • +6663-650-2456
  • This email address is being protected from spambots. You need JavaScript enabled to view it.

วิธีเพิ่มความเร็วคอมพิวเตอร์ของคุณสำหรับการจำลอง CFD

อย่างที่คุณคาดหวังผู้ผลิต CPU ไม่ยอมแพ้ให้แก่ GPU และมีแอพพลิเคชั่นมากมายที่มีแนวโน้มมากที่สุด ไม่ควรลืมว่า GPU ไม่ได้มีไว้เพื่อประสิทธิภาพด้านกราฟิกเท่านั้น แต่ยังมีแนวโน้มที่จะมีความสามารถเพิ่มขึ้นเพื่อใช้งานทั่วไป ปัจจุบัน GPUs ยังคงพัฒนาอยู่ แต่สิ่งสำคัญคือต้องจำไว้ว่ามันไม่ได้ออกแบบมาเพื่อประสิทธิภาพกราฟิกเพียงอย่างเดียว

บทนำ อย่างที่คุณคาดหวังผู้ขาย CPU ไม่ยอมแพ้ GPU และมีแอพพลิเคชั่นมากมายที่มีแนวโน้มมากที่สุด ไม่ควรลืมว่า GPU ไม่ได้มีไว้เพื่อประสิทธิภาพด้านกราฟิกเท่านั้น แต่ยังมีแนวโน้มที่จะเพิ่มขึ้นเพื่อใช้งานทั่วไป GPUs ยังคงพัฒนาอยู่ แต่สิ่งสำคัญคือต้องจำไว้ว่ามันไม่ได้ออกแบบมาเพื่อประสิทธิภาพกราฟิก ตัวอย่างเช่น Intel ได้เปิดตัว Intel Integrated Graphics Integrated Core (IGC) และ Intel Open Compute Engine (FINE) ซึ่งสามารถรวมหลายคอร์กับเครื่องมือและวิธีการโปรแกรมทั่วไป เพื่อให้บรรลุผลดังกล่าว Fine Open ใช้ GPU NVIDIA K20 หลายร้อยตัวที่รวมกันในขั้นตอนเดียว ซึ่งหมายความว่ามีเพียงไม่กี่วันที่สั้นลงเมื่อเทียบกับวิธีการก่อนหน้าซึ่งอาจใช้เวลาถึงหนึ่งสัปดาห์ในการคำนวณที่คล้ายกัน เราใช้ CPU Booster ซึ่งช่วยให้การบรรจบกันอย่างรวดเร็วและเราใช้ขั้นตอน 2,000 ครั้งต่อ GPU หรือ 1.5 เท่าของจำนวนแกนประมวลผล แต่ละขั้นตอนสามารถเสร็จสิ้นในเวลาน้อยกว่าหนึ่งวันรวมถึงตัวอักษรโซลูชันซึ่งหมายความว่าเราสามารถลดการไหลของมวลจากจุดการออกแบบไปสู่สถานะที่มั่นคงในเวลาน้อยกว่าสองชั่วโมงส่งผลให้ชุดข้อมูลทั้งหมดมีขนาด 20 เทราไบต์ AmgX - การทำงานร่วมกันของ NVIDIA กับ ANSYS การเพิ่มประสิทธิภาพนั้นเกิดจากตัวเร่งความเร็วของ GPU ที่พัฒนาโดย NVIDIA ร่วมกับ ANSYS ภายใต้ชื่อ AmgX GV100 ผสานประสิทธิภาพที่มีความแม่นยำสองเท่าอย่างที่ไม่เคยมีมาก่อนเพื่อให้ผู้ใช้สามารถเรียกใช้การจำลองตลอดกระบวนการออกแบบและสร้างการจำลองหลายฟิสิกส์ที่สมจริงได้เร็วขึ้นกว่าที่เคยเป็นมา ANsYS (r) Fluent (r) ให้การสนับสนุนหลาย GPU สำหรับการเพิ่มผลผลิตในการจำลอง CFD ในบริบทนี้วิวัฒนาการของเทคโนโลยีโปรเซสเซอร์ Intel (r) ได้เพิ่มประสิทธิภาพโปรเซสเซอร์ในแอปพลิเคชัน CFD ในขณะที่ปัญหาประสิทธิภาพการทำงานของแต่ละกระบวนการได้รับการกล่าวถึงบางส่วนในระดับแอปพลิเคชันด้วยอัลกอริธึมที่เป็นระเบียบเช่น Cuthill และ McKee แต่ก็ลำบากที่จะใช้ประโยชน์จากประสิทธิภาพของกระบวนการอย่างเต็มที่เนื่องจากจำนวนการคำนวณที่เกี่ยวข้องกับตัวคำนวณ CFD การใช้งาน Fluent สามารถเร่งอัตราการไหลของการจำลอง CFD ได้มากถึง 50% และในบางกรณีสูงถึง 100% การไหลแบบคู่ที่อิงกับความดันเช่น scFLOW และ AmgX ของ NVIDIA RAM (การใช้หน่วยความจำ) มีบทบาทอย่างไรในการจำลอง CFD หากคุณมี RAM เพียงพอคุณอาจมีหน่วยความจำไม่เพียงพอในระหว่างการศึกษาที่ซับซ้อนและจบลงด้วยการไม่มีตัวแก้ปัญหา โปรเซสเซอร์ Xeon (r) มอบคอร์หน่วยความจำและพื้นที่เก็บข้อมูลจำนวนมากขึ้นเรื่อย ๆ หน่วยความจำเพิ่มเติมสามารถเพิ่มความเร็วในการศึกษาของคุณในขณะที่มั่นใจได้ว่าความเร็วหน่วยความจำตรงกับที่ของ CPU ผลกระทบของความเร็วแรมนั้นยากที่จะวัดได้อย่างมีประสิทธิภาพทำให้ราคาและประสิทธิภาพนั้นยากต่อการพิจารณา RAM ที่เร็วกว่าสามารถปรับปรุงประสิทธิภาพได้ แต่ RAM ขนาดใหญ่ที่ทำงานเร็วมากอาจมีราคาแพง เราขอแนะนำให้เลือก RAM ที่เร็วที่สุดที่เหมาะสมกับงบประมาณของคุณและในกรณีที่มีข้อสงสัยให้เลือก RAM ที่แพงที่สุด ตรวจสอบว่ามีวิธีการใช้ RAM บนบอร์ดหรือไม่เช่น ด้วยฮาร์ดไดรฟ์หรือไดรฟ์ภายนอก ณ จุดนี้ควรสังเกตว่าประสิทธิภาพการทำงานแบบขนานที่ปรับปรุงแล้วภายในโหนดนำไปสู่การเพิ่มขึ้นอย่างมีนัยสำคัญในจำนวนของแกนประมวลผลต่อหน่วยเก็บข้อมูล (MPP) ของจำนวนที่กำหนด โปรเซสเซอร์ที่ปรับขนาดได้ Intel Xeon มี MP P ต่ำกว่าเมื่อเทียบกับโปรเซสเซอร์ Xeon ของพวกเขาดังที่แสดงให้เห็นอย่างชัดเจนโดยความแตกต่างด้านประสิทธิภาพระหว่างโปรเซสเซอร์ Xeon Scalable และโปรเซสเซอร์ Xeon E5 - 2650 HiFUN solver ในการศึกษานี้การปรับปรุงการใช้แคชที่ตัวแก้ปัญหา HiFUN ใช้ประโยชน์ซึ่งนำไปสู่ประสิทธิภาพการทำงานแบบเส้นตรงสามารถนำมาประกอบกับ Intel (r) MPI ไลบรารี่ที่เหมาะสำหรับการจัดการหน่วยความจำอันทรงพลังและการใช้แคช GPU ความหนาแน่นแกนกลางที่สูงขึ้นของตัวแก้ปัญหา HiFUN ที่ใช้โปรเซสเซอร์ Intel Xeon ที่ปรับขนาดได้นั้นเป็นผลมาจากไลบรารี MPI ของ Intel (r) ซึ่งเหมาะสำหรับการจัดการหน่วยความจำที่ทรงพลังและการใช้แคชแคช GPU ความหนาแน่นแกนกลางที่สูงขึ้นจะปรับปรุงประสิทธิภาพการทำงานแบบขนานภายในโหนดและควรอนุญาตให้ผู้ใช้สร้างคลัสเตอร์ขนาดกะทัดรัดมากขึ้นด้วยจำนวนแกนประมวลผลที่เฉพาะเจาะจง โดยสรุปเราได้แสดงวิธีการปรับปรุงประสิทธิภาพของโหนดเดี่ยวของตัวแก้ปัญหา Hi-FUND โดยการเพิ่มจำนวน หากแรมที่มีอยู่ต่ำกว่าความต้องการของรูปแบบตัวแก้ปัญหาต้องทำการแลกเปลี่ยนไฟล์ซึ่งจะทำให้การวิเคราะห์ช้าลงอย่างมาก เราติดตั้งเครื่องจักรของเราด้วย 64 GB และใช้ Flex Cloud Solving สำหรับรุ่นที่มีขนาดใหญ่ขึ้นเนื่องจากมีความจุ 120 GB SSDs, ปรับปรุงประสิทธิภาพของดิสก์ไดรฟ์ เวิร์คสเตชั่ส่วนใหญ่ได้รับการออกแบบมาเพื่อความสมดุลของความจุเทียบกับประสิทธิภาพ - อย่างน้อยเมื่อมันเกี่ยวข้องกับการจัดเก็บดิสก์ไดรฟ์ เนื่องจากไฟล์วิศวกรรมและเวิร์กโหลดอาจมีขนาดไฟล์ใหญ่เวิร์คสเตชั่นจึงมีฮาร์ดไดรฟ์ความจุสูงซึ่งโดยทั่วไปอาจมีประสิทธิภาพน้อยกว่าฮาร์ดไดรฟ์ที่มีความจุน้อย การปรับปรุงล่าสุดของเทคโนโลยีไดรฟ์ซึ่งอยู่ในประเภทของไดรฟ์โซลิดสเตต (SSD) มีการขจัดมิติเทียบกับอุปสรรคด้านประสิทธิภาพ SSD มีความจุขนาดใหญ่และให้ประโยชน์มากมายกับฮาร์ดไดรฟ์แบบแกนหมุนทั่วไป SSD สามารถกำจัดปัญหาคอขวดที่สร้างขึ้นจากไดรฟ์ที่ใช้แผ่นแบบดั้งเดิมและเพิ่มประสิทธิภาพของระบบอย่างทั่วถึง เวิร์คสเตชั่ประสิทธิภาพสูงโดยเฉพาะที่ใช้สำหรับ CAD, การจำลองหรือการออกแบบกราฟิกมักติดตั้ง CPU ประสิทธิภาพสูงที่สร้างความรู้สึกเทียบกับงบประมาณ อย่างไรก็ตามประสิทธิภาพของดิสก์ IO มักมีความสำคัญในการใช้งานเป็นประจำทุกวันเพื่อลดปริมาณเวลาที่คุณต้องใช้ในการทำงานให้เสร็จ เนื่องจากเวลาเป็นเงินสำหรับผู้ใช้เวิร์กสเตชันจำนวนมากการทำให้งานปัจจุบันเสร็จสิ้นและบทความต่อไปของแรงงานเป็นสิ่งสำคัญ เดิมเวิร์คสเตชั่ประสิทธิภาพใช้ไดรฟ์อินเทอร์เฟซระบบประมวลผลขนาดเล็ก (SCSI) ที่มีความเร็วในการหมุนสูงมาก (15,000 รอบต่อนาที) เพื่อเอาชนะความยากของ IO ในดิสก์ การรวมไดรฟ์ที่มีประสิทธิภาพดีที่สุดในระหว่างดิสก์สำรองที่ซ้ำซ้อน (RAID) 1 - หรือเพื่อประสิทธิภาพที่มากขึ้น RAID 0 Stripe - สร้างโซลูชันที่มีประสิทธิภาพแม้ว่าจะมีราคาแพงต่อความท้าทายด้านประสิทธิภาพด้วยไดรฟ์กลแบบดั้งเดิม SSD ไม่ได้รับผลกระทบจากความล่าช้าทางกลไกทำให้เป็นเกณฑ์มาตรฐานที่ไม่เกี่ยวข้องเพื่อชี้ให้เห็นถึงความแตกต่างด้านประสิทธิภาพระหว่าง SSD และไดรฟ์ดั้งเดิม ประสิทธิภาพดีที่สุดในการตัดสินด้วย IOs ต่อวินาทีและ SSD ไดรฟ์ที่มีอยู่จริงในหมวดนั้น ข้อได้เปรียบด้านประสิทธิภาพนั้นจะเพิ่มขึ้นอีกเมื่อมีการใช้งาน SSD ในระหว่างการโจมตี โดยทั่วไป RAID 1 หรือ 0 เป็นบรรทัดฐานสำหรับการใช้งานเวิร์กสเตชันแม้ว่าในบางกรณี RAID 5 หรือการกำหนดค่าอื่น ๆ ก็สามารถรับประกันได้เช่นกัน SSD ที่เพิ่มความจุผ่าน RAID ไม่ได้เพิ่มความล่าช้า หากมีสิ่งใดประสิทธิภาพจะได้รับการปรับปรุงเมื่อมีการเพิ่มไดรฟ์มากขึ้นด้วยเทคโนโลยีการสตริปและการทำมิรเรอร์ซึ่งโดยปกติแล้วจะมีการขับเคลื่อนด้วยฟิสิคัลไดรฟ์ซึ่งไม่ประสบปัญหาความล่าช้าทางกล เนื่องจาก SSD ยังมีราคาตกเทคโนโลยีจึงเหมาะสมสำหรับผู้ที่ต้องการเพิ่มประสิทธิภาพการจำลองซึ่งการเขียนและอ่านดิสก์ขนาดใหญ่เป็นบรรทัดฐาน วิธีการที่ GPU ก้าวเข้ามาใน CAE Simulation ไม่มีอะไรส่งผลกระทบต่อประสิทธิภาพการมองเห็นของการจำลองค่อนข้างกราฟิกการ์ด ในขณะที่การคำนวณจำนวนมากและการเคลื่อนไหวของข้อมูลดำเนินต่อไปหลังฉากระหว่างการจำลอง แต่เป็นการแสดงด้วยภาพของการจำลองที่มีผลกระทบยาวนานต่อผู้สังเกตการณ์ ไม่ว่าจะเป็นการจำลองการไหลของมุมมองหรือจุดเน้นความเครียดไม่ใช่ส่วนสำคัญจริงๆที่นี่ ทุกอย่างมาถึงความรวดเร็วในการแสดงเหตุการณ์จำลองที่รวดเร็วราบรื่นและแม่นยำ การ์ดกราฟิกของเวิร์คสเตชั่นไม่ถูกและโน้มน้าวใจว่าเป็นการลงทุนครั้งใหญ่เมื่ออัพเกรดเวิร์คสเตชั่น อย่างไรก็ตามการทำความเข้าใจกับมูลค่าของการลงทุนนั้นอาจจะซับซ้อนกว่านี้เล็กน้อยซึ่งเป็นไปได้ที่จะลงทุนเทคโนโลยีกราฟิกการ์ดมากเกินไป เคล็ดลับคือการเชื่อมโยงประสิทธิภาพที่ต้องการกับความสามารถกราฟิกการ์ดโดยรวมซึ่งอาจพิจารณาได้จากความช่วยเหลือของผู้จำหน่ายซอฟต์แวร์จำลอง ผู้จำหน่ายซอฟต์แวร์จำลองสถานการณ์ส่วนใหญ่เสนอคำแนะนำเกี่ยวกับฮาร์ดแวร์กราฟิกและทำงานได้ดีพอสมควรในด้านประสิทธิภาพของการจำลองความสัมพันธ์กับแพลตฟอร์มฮาร์ดแวร์ที่กำหนด ดังกล่าวด้วยการทดลองและความเข้าใจเชิงลึกเกี่ยวกับกราฟิกการ์ดหรือ GPU ผู้ใช้อาจพร้อมที่จะเลือกผลิตภัณฑ์ที่มีประสิทธิภาพดีกว่าที่ผู้ขายแนะนำ ทุกสิ่งมาถึงสิ่งที่ดูเหมือนจะเป็นระหว่างกราฟิกการ์ด อีกครั้งซอฟต์แวร์จำลองที่ใช้กำหนดตัวเลือกที่ง่ายที่สุด ตัวอย่างเช่นซอฟต์แวร์ที่ขึ้นอยู่กับความสามารถของ 3D หรือความต้องการเกี่ยวกับการถ่ายภาพขั้นสูงอื่น ๆ อาจเป็นตัวกำหนดประเภทของการ์ด โชคดีที่ตลาดมีระเบียบ พูดง่ายๆก็คือ GPU จะจัดการกระบวนการเอฟเฟกต์พิเศษและการแสดงผลของคุณ เนื่องจากการประมวลผลหลายตัวโดยทั่วไปจะมีประสิทธิภาพมากกว่า CPU ในซอฟต์แวร์ที่ออกแบบมาเพื่อต้องการความได้เปรียบ GPU ที่ได้รับการปรับให้เหมาะสมที่สุดสำหรับแอพพลิเคชั่นที่เน้นกราฟิกระดับมืออาชีพเช่นการสร้างภาพข้อมูลและการวิเคราะห์นั้นพบได้ใน AMD FirePro และเวิร์คสเตชั่นกราฟิกการ์ดของ NVIDIA การ์ด 2D ระดับมืออาชีพสามารถจัดการการประมวลผล 3D บางอย่าง แต่ไม่เหมาะสำหรับแอปพลิเคชัน 3D ปกติ โดยทั่วไปแล้วพวกเขาไม่สามารถทำงานร่วมกับวิศวกรรมได้ สำหรับการจำลองสถานการณ์ระดับมืออาชีพการ์ดเสริม Quadro หรือ FirePro 3D อาจเป็นข้อกำหนด แต่ละสายผลิตภัณฑ์นั้นมีโมเดลประมาณครึ่งโหลซึ่งอยู่ภายใต้หมวดหมู่ผลิตภัณฑ์สี่ประเภทเช่นระดับเริ่มต้นระดับกลางระดับไฮเอนด์และระดับไฮเอนด์พิเศษ (วิศวกรรมเดสก์ท็อปจะตรวจสอบการ์ดกราฟิกที่หลากหลายในปัญหาที่จะเกิดขึ้น) มีข้อยกเว้นอยู่เสมอ แต่ผู้ซื้อส่วนใหญ่จะต้องการจับคู่ประสิทธิภาพและความสามารถของ GPU กับส่วนที่เหลือของระบบ - นั่นคือการ์ดรายการขนาดสำหรับเวิร์คสเตชั่นรายการขนาดเส้นผ่าศูนย์กลาง การบรรลุความสมดุลที่ดีซึ่งส่วนประกอบแต่ละชิ้นมีระดับประสิทธิภาพที่รองรับโดยส่วนที่เหลือของระบบคือขอบคุณที่ดีที่สุดในการเพิ่ม ROI ให้สูงสุดสำหรับการซื้อเวิร์กสเตชันของคุณและเพิ่มประสิทธิภาพการทำงานของคุณ อ้างอิงจาก References https://www.nvidia.com/en-us/data-center/gpu-accelerated-applications/ansys/ 0 https://www.engineering.com/DesignSoftware/DesignSoftwareArticles/ArticleID/18406/NUMECA-Brings-Massive-Boosts-to-CFD-Simulation-Speeds.aspx 1 https://knowledge.autodesk.com/support/cfd/learn-explore/caas/sfdcarticles/sfdcarticles/Hardware-recommendation-for-Simulation-CFD-2016.html 2 https://www.flow3d.com/hardware-selection-for-flow-3d-products/ 3 https://www.digitalengineering247.com/article/optimize-workstations-for-faster-simulations/ 4 https://www.javelin-tech.com/blog/2016/09/solidworks-simulation-hardware-recommendations/ 5 https://techdecoded.intel.io/resources/parallel-cfd-with-the-hifun-solver-on-the-intel-xeon-scalable-processor/ 6