เรื่องนี้เป็นความสงสัยส่วนตัวที่มีมานานพอสมควรเกี่ยวกับเทคโนโลยีของ nVidia ที่ชื่อ Turbocache สาเหตุก็เพราะวันนี้ผมอัพเกรดแรมในเครื่องจาก DDR512 ไปเป็น DDR1024 ความรู้สึกโดยทั่วไปก็ไม่มีอะไรเปลี่ยน แต่ที่สังเกตได้คือ เมื่อลองดู RAM ของ VGA card แล้วพบว่ามีขนาดเพิ่มขึ้น จาก 256MB ไปเป็น 512 MB
แล้วผมก็นึกถึง Turbocache ที่เขียนติดกล่อง vga card ขึ้นมาทันที แล้วก็เกิดสงสัยขึ้นมาว่า มันจะดึงแรมจากระบบไปหรือเปล่า เพราะอยู่ดีๆขนากมันก็ขึ้นไปถึง 512 (กลัวแรมในระบบจะหายไป) จากนั้นก็เข้าไปหาข้อมูลดูในอินเตอร์เน็ตว่า turbocache คืออะไร มีประโยชน์อะไร จากนั้นก็สรุปได้ตามนี้ครับ
ข้อมูลอ้างอิง :
TurboCache.doc
http://www.beartai.com/webboard/index.php?action=printpage;topic=5119.0
เทคโนโลยี turbocache นั้นจะเป็นการดึงแรมของระบบรวมมาใช้เมื่อการ์ดจอต้องการใช้แรมที่มากขึ้นในการแสดงผล ซึ่งจะดึงแรมของระบบมาเมื่อต้องการใช้งานเท่านั้น และเมื่อใช้งานเสร็จแล้ว ก็จะคืนแรมของระบบที่ยืมมานั้นให้กับระบบไป ทำให้ไม่ส่งผลรวมกับระบบ ซึ่งตรงนี้จะต่างกับกราฟฟิกแบบออนบอร์ด ซึ่งแบบออนบอร์ดนั้น จะเป็นการดึงแรมของระบบไปแบบถาวร ตัวอย่างของกราฟฟิกแบบออนบอร์ดนี้ก็คือ Intel Graphic Extreme เวอร์ชั่น 1 และ 2
เทคโนโลยี turbocache นั้นเป็นกระบวนการจัดการบริหารเมมโมรีของกราฟฟิกการ์ดเอง โดยนำเมมโมรีของระบบมาเป็นบัฟเฟอร์ใช้เก็บเท็กซ์เจอร์ ซึ่งใช้ในการประมวลผลภาพนั่นเอง ดังนั้นเมมโมรีที่ติดอยู่กับการ์ดจึงไม่จำเป็นต้องมีจำนวนมากนัก ซึ่งกระบวนการนี้จะแตกต่างกันกับกราฟฟิกการ์ดแบบออนบอร์ดอยู่เหมือนกัน เนื่องจากการส่งผ่านข้อมูลของระบบบัส PCI Express นั้น จะให้ความรวดเร็วโดยไม่เกิดค่าหน่วงเวลามากนัก
การทำงานของเทคโนโลยี NVIDIA® TurboCache™
เทคโนโลยี TurboCache จาก NVIDIA จะช่วยเพิ่มช่วงกว้างแบนด์วิทในการรับส่งข้อมูลแบบ PCI Express ที่ให้ความสามารถในการประมวลผลกราฟฟิกในระดับสูงและช่วยในการจัดการหน่วยความจำของการ์ดแสดงผล โดยการจัดการและจัดสรรหน่วยความจำเพื่อประสิทธิภาพของตัวการ์ดในการประมวลผลภาพ สำหรับการจัดการใช้หน่วยประมวลผลของการ์ดแสดงผล graphics processing unit (GPU) ในการแชร์หน่วยความจำและแบนด์วิทของหน่วยความจำ video memory กับหน่วยความจำของระบบ ด้วยคุณสมบัติ TurboCache turbocharges ทำให้การ์ดแสดงผลสามารถแสดงพลังและประสิทธิภาพในการแสดงผลกราฟฟิกที่ดีเยี่ยมออกมาได้อย่างสวยงาม
สถาปัตยกรรมของ TurboCache
คุณสมบัติของสถาปัตยกรรม TurboCache
· ช่วยจัดการการประมวลผลจากฮาร์ดแวร์และซอฟต์แวร์โดยใช้เทคโนโลยีในการเรนเดอร์จากหน่วยความจำของระบบโดยตรง
· ด้วยคุณสมบัติจาก TurboCache Manager (TCM) ที่จัดสรรและแบ่งหน่วยความจำสำหรับจัดการประมวลผลภาพ เพื่อประสิทธิภาพในการทำงานของระบบสูงสุด จะช่วยในการคำนวณ โดยการดึงข้อมูลเข้าและออกจากบัส PCI-E จากการทำงานประสานกันอย่างลงตัว ก็จะทำให้ประสิทธิภาพที่ได้รับนั้น เพิ่มขึ้นมากกว่ากราฟฟิกการ์ดที่ไม่มีเทคโนโลยี TurboCache
· ซอฟต์แวร์อัจฉริยะที่ตอบสนองทุกความต้องการได้อย่างมีประสิทธิภาพ
· ช่วงในการรับส่งข้อมูลของแบนด์วิทเพิ่มเป็น 2 ช่องทาง กับการเชื่อมต่อแบบ PCI Express ผสานกับสถาปัตยกรรม TurboCache ซึ่งเพิ่มประสิทธิภาพในการแสดงผลกราฟฟิก
การเปรียบเทียบ WinFast PX 6200 TD (Non TC) และ WinFast PX 6200 TC TDH (With TC)
ทั้งสองรุ่นใช้ชิปกราฟฟิกรหัสเดียวกัน คือ NV43 และผลิตด้วยกระบวนการผลิต 0.11 ไมครอนทั้งคู่ โดยเทคโนโลยีพื้นฐานแล้วจะเหมือนๆ กัน ทั้งเทคโนโลยีการผลิต และชุดคำสั่งที่สนับสนุน แต่จะมีส่วนที่แตกต่างกันทั้งแบบเล็กน้อย และแบบเห็นได้ชัด ส่วนที่แตกต่างกันเล็กน้อยก็คือ สัญญาณนาฬิกาของ GeForce 6200 TC จะมากกว่า 50MHz และส่วนที่แตกต่างกันอย่างชัดเจนก็คือ อินเทอร์เฟซของเมมโมรี ที่รุ่น TC จะใช้เมมโมรี 64 บิต ซึ่งลดลงแบบครึ่งต่อครึ่ง และอีกอย่างหนึ่งก็คือ กระบวนการเรียกใช้เมมโมรี ซึ่งรุ่น Non-TC จะเรียกใช้เมมโมรีบนตัวการ์ดเองทั้งหมด 128MB แต่ในรุ่น TC จะเรียกใช้เมมโมรีได้ทั้งหมด 256MB รวมกันทั้งเมมโมรีบนการ์ดและเมมโมรีระบบ
GPU | GeForce 6200 | GeForce 6200 TD |
Memory size | 128MB DDR | Supporting 256MB* |
Memory Interface | 128-bit | 64-bit |
Graphics Bus | PCI Express | PCI Express |
GPU/Memory clock | 300/275MHz | 350/275MHz |
Fill Rate(billion texels/sec) | 1.2 | 1.4 |
Vertices/sec(million) | 225 | 263 |
Pixels per clock(peak) | 4 | 4 |
RANDACs(MHz) | 400 | 400 |
Process | 0.11 micron | 0.11 micron |
*System memory must be 512MB or higher.
จากรูปด้านบน เป็นกราฟฟิกการ์ดที่ใช้ชิป GeForce 6200 เหมือนกัน แต่รูปแบบทางกายภาพไม่เหมือนกันเลย เริ่มกันตั้งแต่ PCB ที่รุ่น Non-TC จะยาวกว่าเล็กน้อย ฮีทซิงค์ที่ใช้ก็แตกต่างกันโดยสิ้นเชิง เพราะรุ่น Non-TC จะมีพัดลมมาให้ด้วย แต่รุ่น TC จะเป็นฮีทซิงค์สีดำขนาดใหญ่พอสมควร แม้แต่การวางตำแหน่งคาพาซิสเตอร์ก็ไม่เหมือนกัน แต่จุดทีเห็นได้ชัดเจนที่สุดก็คือเรื่องของแรมนั่นเอง สำหรับรุ่น Non-TC จะใช้แรมของ Hynix ความเร็ว 3.6ns ตัวละ 16MBจำนวน 8 ตัว วางอยู่ทางด้านหน้าการ์ดทั้งหมด แต่สำหรับรุ่น TC จะใช้แรมของ Samsung ความเร็ว 3.6ns ตัวละ 16MB เท่ากัน วางอยู่ด้านหน้าและด้านหลังการ์ดอย่างละ 2 ตัวเท่านั้น (รวมกันเป็น 64MB) สิ่งที่ดูจะเหมือนกันที่สุดก็เห็นจะเป็นสีเขียวของ PCB จุดที่เห็นได้ชัดจากตารางสเปกการทำงานอีกอย่างหนึ่งก็คือ อินเทอร์เฟซของเมมโมรีนั่นเอง ซึ่ง GeForce 6200 TC นั้นจะใช้เมมโมรีอินเทอร์เฟซ 64 บิตเท่านั้น ซึ่งน้อยกว่ารุ่นปกติแบบครึ่งต่อครึ่ง เพราะ เทคโนโลยี TC มุ่งเน้นการใช้งานเมมโมรีจากระบบมากกว่าเมมโมรีบบนตัวการ์ดเอง ซึ่ง NVIDIA ก็คงจะคำนวณมาแล้วว่า อินเทอร์เฟซทั้งสองแบบให้ผลแตกต่างกันน้อยมาก และการใช้เมมโมรี 64 บิตก็จะช่วยลดต้นทุนการผลิตได้อีกมากพอสมควร
การทดสอบTC ที่ความเร็วและโปรแกรมต่างๆ
3Dmark03 With 512MB System Memory 3Dmark03 With 1GB System Memory
3DMark05 With 512MB System Memory 3DMark05 With 1GB System Memory
FarCry With 512MB System Memory FarCry With 1GB System Memory
Doom3 With 512MB System Memory Doom3 With 1GB System Memory
ผลจากการใช้เมมโมรีของระบบที่แตกต่างกัน ซึ่งเป็นจุดที่น่าพิจารณาที่สุด สำหรับโปรแกรมเบนช์มาร์กอย่าง 3DMark03 และ 3DMark05 นั้น ไม่พบความแตกต่างทางด้านประสิทธิภาพของเมมโมรีระบบ ทั้ง 512MB และ 1024MB แต่อย่างใด ทั้งในรุ่น TC และ Non-TC แต่ในการใช้งานจริงกับเกม ทั้งเกม Far Cry และ Doom3 นั้นพบว่า เมมโมรีที่เพิ่มขึ้นมาอีก 512MB นั้น ช่วยดึงประสิทธิภาพของ GeFocre 6200 TC ออกมาได้อีกมากพอสมควร (เกือบ 5 เฟรมสำหรับ Far Cry และ 3 เฟรมสำหรับ Doom3) ถึงจะเป็นค่าที่ไม่มากนัก แต่ก็เป็นสัดส่วนที่ถือได้ว่า เป็นความแตกต่างแบบมีนัยสำคัญ เนื่องจากทั้ง Doom3 และ Far Cry นั้น เรียกใช้เมมโมรีของระบบค่อนข้างมากอยู่แล้ว หากนำไปแบ่งให้กับกระบวนการ TC อีก เมมโมรีที่เหลือก็จะน้อยลง จนทำให้ประสิทธิภาพโดยรวมลดลงกว่าที่ควรจะเป็น แม้เมมโมรีขั้นต่ำที่แนะนำสำหรับการใช้ TC คือ 512MB แต่เราคิดว่า เพิ่มเมมโมรีให้กับระบบไว้ยิ่งมากก็จะยิ่งดี แต่สำหรับรุ่น Non-TC นั้น ความแตกต่างของเมมโมรีระหว่าง 256MB และ 1024MB นั้น แตกต่างกันน้อยมากในจะทดสอบกับ Far Cry และ Doom3 เช่นเดียวกับ 3DMark ทั้งสองเวอร์ชัน แม้ผลการทดสอบกับเมมโมรีระบบ 1024MB จะดีกว่า 512MB อยู่บ้าง แต่ก็ถือว่าน้อยจนแทบจะไม่มีผลเลย
สรุป
Turbocache คือเทคโนโลยี ที่อาศัยความกว้างของ Bandwidth ในการส่งข้อมูลที่มากมหาศาลของ PCI-express มาใช้งาน โดยอาศัย Bandwidth ที่กว้างนี้เองเป็นตัวขนถ่ายข้อมูลและหน่วยความจำจากระบบหลักมาใช้งาน ทำให้ตัวการ์ดจอเองไม่จำเป็นต้องมีหน่วยความจำติดตัวมากเหมือนในอดีต……..
รูปแบบมันก็คือๆกับการ์ดจอ onboard นั่นแหล่ะที่ดึงแรมจากระบบมา แต่ Turbocache พิเศษกว่าตรงที่มันจะดึงมาเมื่อมีการใช้งานเท่านั้น ทำให้แรมในระบบไม่สูญเสียไปถาวรเหมือนกันการ์ดจอ onboard (ที่ทำให้หลายๆท่านแปลกใจกันว่า ทำไมเครื่องเราแรมตอนแรกมันเขียนไว้ 128 แต่เอาจริงๆมันเหลือ 96 หว่า….)
Know2Pro สรุปว่า turbocache มีแล้วทำให้ตัวการ์ดราคาถูกลง ประสิทธิภาพดีขึ้น(บ้าง) แรมที่ดึงมาจากระบบจะใช้เมื่อจำเป็นเท่านั้น (เครื่องผมคงเล่นเกมไม่ค่อยไหวแล้ว)
No comments: