การรวบรวมข้อมูลบ่อยครั้งโดยโปรแกรมรวบรวมข้อมูล OpenAI ทำให้เว็บไซต์โมเดล 3 มิติของร่างกายมนุษย์ขัดข้อง - บทความ AI

ล่าสุด Trilegangers ซึ่งเป็นเว็บไซต์ของยูเครนที่เน้นไปที่โมเดล 3 มิติของร่างกายมนุษย์ ประสบกับการโจมตีทางจราจรที่ไม่เคยเกิดขึ้นมาก่อน ทำให้เซิร์ฟเวอร์ล่ม เว็บไซต์นี้มีไว้เพื่อให้ข้อมูลโมเดล 3 มิติของมนุษย์จำนวนมากแก่ศิลปิน 3 มิติและนักพัฒนาเกม อย่างไรก็ตาม เว็บไซต์นี้ประสบปัญหาเนื่องจากการรวบรวมข้อมูลโดย GPTBot ของ OpenAI บ่อยครั้ง

ตามที่เจ้าหน้าที่ของ Trilegangers ระบุ แม้ว่าข้อตกลงการใช้งานของเว็บไซต์จะห้ามไม่ให้มีการรวบรวมข้อมูลและใช้งานโดยไม่ได้รับอนุญาตอย่างชัดเจน แต่ไฟล์ robots.txt ไม่ได้รับการตั้งค่าอย่างเหมาะสมเพื่อป้องกันการเข้าถึงของโปรแกรมรวบรวมข้อมูล ซึ่งท้ายที่สุดส่งผลให้เซิร์ฟเวอร์มีการใช้งานมากเกินไป ตามบันทึกของเซิร์ฟเวอร์ โปรแกรมรวบรวมข้อมูล GPTBot ของ OpenAI ได้เริ่มต้นคำขอนับหมื่นครั้งผ่านที่อยู่ IP ที่แตกต่างกันมากกว่า 600 รายการ ส่งผลให้เว็บไซต์ทำงานไม่ถูกต้อง คล้ายกับการโจมตีแบบปฏิเสธการให้บริการแบบกระจาย (DDoS)

image.png

OpenAI กล่าวถึงในคำอธิบายของโปรแกรมรวบรวมข้อมูลว่าหากเว็บไซต์ไม่ต้องการให้ GPTBot รวบรวมข้อมูลเนื้อหา จะต้องตั้งค่าไว้ในไฟล์ robots.txt อย่างไรก็ตาม Trilegangers ไม่ได้ตระหนักถึงสิ่งนี้ ซึ่งนำไปสู่สถานการณ์ปัจจุบันของพวกเขา แม้ว่าไฟล์ robots.txt จะไม่ใช่ข้อกำหนดทางกฎหมาย แต่หากเว็บไซต์ระบุว่าห้ามการใช้งานโดยไม่ได้รับอนุญาต พฤติกรรมการรวบรวมข้อมูลของ GPTBot อาจยังคงละเมิดกฎระเบียบที่เกี่ยวข้อง

นอกจากนี้ เนื่องจากการใช้เซิร์ฟเวอร์ Amazon AWS ปริมาณการใช้แบนด์วิดท์และการรับส่งข้อมูลของ Trilegangers จึงเพิ่มขึ้นอย่างรวดเร็วเช่นกัน ซึ่งทำให้เกิดแรงกดดันด้านต้นทุนเพิ่มเติม เพื่อตอบสนองต่อเหตุฉุกเฉินนี้ Trilegangers ได้ใช้มาตรการเพื่อตั้งค่าไฟล์ robots.txt ที่ถูกต้องและบล็อกการเข้าถึงของโปรแกรมรวบรวมข้อมูลต่างๆ รวมถึง GPTBot ผ่าน Cloudflare คาดว่าจะช่วยบรรเทาภาระบนเซิร์ฟเวอร์และปกป้องเว็บไซต์ได้ตามปกติ การดำเนินการ.

เหตุการณ์นี้ดึงดูดความสนใจไปที่พฤติกรรมของโปรแกรมรวบรวมข้อมูลเว็บ โดยเฉพาะอย่างยิ่งในบริบทของการพัฒนาเทคโนโลยี AI ที่เพิ่มขึ้น วิธีสร้างสมดุลระหว่างการประยุกต์ใช้เทคโนโลยีและการคุ้มครองลิขสิทธิ์กลายเป็นหัวข้อที่ควรค่าแก่การไตร่ตรอง