มีข้อมูลอยู่บนเวปที่ไม่เป็นตาราง (เป็นตารางก็ได้นะ) ที่ต้องเข้าไปดูบ่อยๆ ไม่ต้องคอย Copy ให้เสียเวลามาใช้เครื่องมือ Web Scraper เข้าไปดูดข้อมูลเวป จัดรูปแบบลงตาราง Excel ให้ และนำมาให้ AI วิเคราะห์ต่อให้ใน 3 ขั้นตอนกัน! ทำตามได้เลย
เนื้อหาในบทเรียนนี้
ตัวอย่างการเก็บข้อมูลจากช่อง Ultimate Python
จากเวปไซต์ที่มีข้อมูลที่ต้องการ แต่ไม่อยู่ในรูปแบบตาราง (หรือเป็นตารางอยู่แล้วก็ได้) เก็บรวบรวมลงไฟล์ Excel ในรูปแบบที่นำไปวิเคราะห์ต่อได้ และนำมาให้ AI จัดการข้อมูล เตรียมข้อมูล ทำความสะอาดข้อมูล และวิเคราะห์ให้ ให้คุณเปลี่ยนการดึงข้อมูลหน้าเวปไซต์ที่เสียเวลาดึง เสียเวลาเตรียม ให้เป็นกระบวนการง่ายๆ ที่ช่วยให้คุณสร้างประโยชน์จากข้อมูลได้มากกว่า
กระบวนการดั้งเดิม vs. กระบวนการใหม่วันนี้
โดยปกติกระบวนการเก็บข้อมูลจากเวปไซต์ด้วยการเขียนโค้ดอย่าง Python จะเริ่มจากการเข้าไปวิเคราะห์หน้าเวป ดูโค้ดของเวปจากนั้นเขียนโค้ดดึงข้อมูล ทำลูปให้ครบทั้งเวป จากนั้นเรียงข้อมูลลงตารางข้อมูล ทำความสะอาดเตรียมข้อมูล และดึงมาวิเคราะห์สร้างกราฟ หรือคำนวณข้อมูลที่ต้องการ นี่ยังไม่รวมขั้นตอนการแก้บัคอีกด้วยนะ!
แต่วันนี้เรามี Tools อย่าง Webscraper.io ที่สามารถใช้การคลิกๆ เลือกข้อมูลที่ต้องการ และใช้บอทสำเร็จรูปเข้าไปดูเวป ดึงข้อมูลที่คลิกเลือก ได้ข้อมูลเป็นตารางข้อมูล จากนั้น ส่งให้ ChatGPT เตรียมข้อมูล วิเคราะห์ สร้างกราฟให้เสร็จ ง่ายกว่าเดิมมาก!
วันนี้มาลองทำตามตัวอย่างการเก็บข้อมูลจากช่อง Tiktok @UltimatePython ได้เลย!
ติดตั้ง Webscraper.io โปรแกรม No Code ดูดข้อมูลหน้าเวป
โปรแกรมตัวนี้สามารถดาวน์โหลด และติดตั้งเป็นลักษณะของ Chrome Extension และเข้าใช้ผ่านบราวเซอร์ Chrome ได้เลย ให้ทุกคนเปิดเวปไซต์ webscraper.io ที่ Chrome ทำการติดตั้งให้เรียบร้อย
วิธีเปิดใช้งาน Webscraper.io
วิธีการเข้าใช้งานคือเราจะทำการไปที่เวปไซต์ที่ต้องการเก็บข้อมูลเช่น หน้าช่อง @UltimatePython ด้วย Chrome จากนั้นกด F12 เพื่อเปิด Dev Tool ตัวนี้จะเป็นเครื่องมือสำหรับ Browser ที่ใช้ทำงานกับส่วนต่างๆ ของ Browser โดยตรง
โดยการใช้งาน Webscraper จะต้องปรับให้ Dev Tool แสดงผลที่ด้านล่างของหน้าจอให้มีความกว้างมากพอ และไม่กินพื้นที่จอด้านข้าง เนื่องจากเวปไซต์ หากมีการใช้ Dev Tool กินพื้นที่หน้าเวปด้านข้าง อาจทำให้การตั้งค่าบอทที่จะไปเปิดเวป และดึงข้อมูลออกมา มีการตั้งค่าจากหน้าเวปที่ไม่มีการกินพื้นที่ด้านข้าง (สังเกตว่าถ้าเราย่อหน้าจอให้แคบลง หรือกว้างขึ้น หน้าเวปเค้าจะแสดงผลคนละแบบ)
Webscraper จะปรากฏให้เราสามารถคลิกเลือกเพื่อใช้ได้ดังภาพ
เริ่มสร้าง Sitemap แผนที่ให้บอทเข้าไปเก็บข้อมูล
Sitemap เหมือนตามชื่อจะเป็นแผนที่ที่ใช้บอกตัวบอทว่าจุดที่จะให้บอทเริ่มต้น เริ่มที่เวปไหน และวิ่งไปยังจุดไหนบ้างเพื่อดึงข้อมูลออกมาใส่เป็นตารางให้เราอีกที เราจะทำการตั้งชื่อ และระบุ url ของหน้าเวปแรกที่จะให้บอทเปิด นั่นคือหน้าช่องนั่นเอง
เพิ่ม Selector ระบุตำแหน่งข้อมูลให้บอทเข้าไปดึงข้อมูล
Selector คือส่วนที่เราสร้างเพื่อใช้บอกบอทว่าจะให้บอทวิ่งเข้าไปที่จุดไหน เพื่อดึงข้อมูลออกมาให้เรา วิธีการใช้งานมีหลักการง่ายๆ คือ เมื่อเพิ่ม Selector webscraper จะมีเครื่องมือสำหรับการทำ Select ที่เมื่อใช้แล้ว เค้าจะให้เรานำเมาส์ไปคลิกในจุดข้อมูลที่ต้องการ โดยวิธีการ คือ เราจะเลือกเก็บทีละข้อมูล เช่นเริ่มต้นที่จำนวน view หน้าช่อง แต่การกด คือต้องกดให้ครบทุก view ที่ต้องการ เมื่อคลิกเรียบร้อยกด Done selecting จากนั้นหากต้องการดึงข้อมูลหลายตัวให้ติ๊ก Multiple
สำหรับกำหนดประเภทข้อมูลที่ดึงจะมีอย่าง เช่น text คือ ข้อความจากหน้าเวป, table คือ ตาราง, link คือ การกดเข้าลิ้งค์ไป! ใครชอบอย่าลืมติดตามเรียนบทเรียนดีๆ แบบนี้ และชวนเพื่อนมาเรียนด้วยกันนะ
ตัวอย่างของเราจะทำ 2 รอบ รอบแรกสำหรับข้อมูลจำนวน view, อีกครั้ง คือ ชื่อคลิป ซึ่งจะสังเกตว่าถ้าข้อมูลทั้งคู่ของเราจะเป็น Multiple หรือดึงข้อมูลหลายรายการทั้งคู่ สิ่งที่จะเกิดขึ้นถ้ายังไม่ทำอะไรเพิ่ม คือ เค้าจะทำการดึงข้อมูลชุดแรก จากนั้นดึงข้อมูลชุดที่สอง มาต่อเป็นแถวถัดไป ซึ่งสิ่งที่เราต้องการไม่ใช่แบบนั้น
เราต้องการให้ข้อมูล view โชว์คู่กับข้อมูลชื่อคลิป ไม่ได้อยู่แยกแถวกัน เค้าจะให้เราเลือกเป็นการทำ group ขึ้นมา ซึ่งจะจัดการตรงนี้ให้เราอัตโนมัติ ง่ายสุด
ระหว่างการทำสามารถกด Data Preview ดูตัวอย่างข้อมูลที่จะเก็บได้ เพื่อตรวจสอบได้ตลอด
สั่ง Scrape ดึงข้อมูลลงตาราง และ Export เป็นไฟล์ Excel
เมื่อได้ข้อมูลที่ต้องการ เราสามารถเลือก sitemap ที่ต้องการ และสั่งการทำ Scrape เพื่อให้ webscraper ทำการนำบอทที่เราตั้งค่าไว้ ไปเปิดเวปที่เราตั้งไว้ และดึงข้อมูล หรือเข้าลิ้งค์ที่ต้องการ จากนั้นจัดรูปแบบข้อมูลให้อยู่ในตารางที่นำมาใช้งานต่อได้เลย แบบง่ายๆ
จากนั้นเราจะสามรถ Export ข้อมูลตารางที่ได้มาออกมาเป็นไฟล์ .xlsx (ปัญหาเรื่องภาษาไทยน้อยกว่า) เพื่อนำไปใช้งานต่อได้เลย!
ChatGPT จัดการ วิเคราะห์ต่อให้แบบจบๆ
ตอนนี้ ChatGPT เวอร์ชั่นฟรี ก็ใช้ฟีเจอร์วิเคราะห์ ไฟล์ Excel ได้แล้ว! แนบไฟล์เข้าไป แล้วให้ ChatGPT จัดการข้อมูลต่อ
ถ้าเป็นแต่ก่อนนะ ข้อมูลที่เราจะเก็บจากเวปไซต์เค้าจะใช้ต่อได้ไม่ทันที ไม่ว่าจะต้องเตรียม Format ข้อมูล เปลี่ยนประเภทข้อมูล ทำการเตรียมเพื่อใช้วิเคราะห์ หรือแม้กระทั่งจับกลุ่มข้อมูลเดียวกันให้อยู่ในกราฟเดียวกัน!! แต่... ChatGPT รับจบแค่ใส่ Prompt ให้จัดการ เตรียม ทำความสะอาด และวิเคราะห์ให้จบๆ!
โดยใช้ความแข็งแกร่งของ ChatGPT ที่สามารถทำความเข้าใจข้อความได้เบื้องต้น เราจะใช้ ChatGPT ทำสิ่งเหล่านี้ 1) ทำความเข้าใจ view ที่ยังไม่เป็นตัวเลข และแปลงให้เป็นตัวเลข 2) ทำความเข้าใจชื่อคลิป และกำหนด category ของคลิปขึ้นมา และให้ ChatGPT ดูว่าคลิปไหนควรจะอยู่เป็นกลุ่มเดียวกัน หรือ category เดียวกัน โดยเขียนอธิบายไว้ เช่นตัวอย่าง Prompt นี้
ก่อนจะตอบอะไรให้เข้าไปดูหัวข้อของคลิป จากนั้นให้แบ่งคลิปออกเป็น category ต่างๆ โดยมี category และสิ่งที่เกี่ยวข้องดังนี้
-AppSheet เกี่ยวกับ App, ระบบข้อมูล
-Looker Studio เกี่ยวกับการทำกราฟ dashboard
-AI เกี่ยวกับ ChatGPT การใช้งาน AI
-Python เกี่ยวกับการเขียนโค้ด Python
พยายามหาความเชื่อมโยงกับ category ให้ได้มากที่สุด หากไม่ได้จริงๆ ให้สร้าง category ใหม่ขึ้นมา ทำการแปลงจำนวนให้เป็นตัวเลขที่สามารถหาผลรวม เปรียบเทียบได้ จากนั้นสร้างกราฟแสดงจำนวนผลรวมแยกตาม category โดยเขียนสรุป และอธิบายเป็นภาษาไทยทั้งหมด
ช่วยเราสร้างบทความที่ดีขึ้น
ผ่านการให้ข้อมูล และฟีดแบคเกี่ยวกับบทความนี้!
ให้คะแนนบทเรียนเท่าไร?
5 - คะแนนเต็ม พร้อมนำไปใช้จริง
4 - ดีมาก ได้ไอเดียพร้อมลุย
3 - โอเค พอเห็นภาพ
2 – ไม่โอเค ขาดบางอย่าง
ผู้สอนของคุณในบทเรียนนี้
สวัสดีครับผมซิปป้า แอดมินของเพจ Ultimate Python ครับ นอกจาก Content ดีๆ แบบนี้ ผมทำธุรกิจทางด้านการจัดเทรนนิ่งให้กับองค์กร, เป็นที่ปรึกษาสำหรับบริษัท SME ที่ต้องการสร้างระบบข้อมูล และการทำ Automation หากมีท่านใดที่มีเพื่อน หรือกำลังต้องการบริการเหล่านี้ สามารถแนะนำผมได้เลยนะครับ
คอร์สสร้างแอปแรกด้วย AppSheet | วางระบบจัดการข้อมูลธุรกิจของคุณเปลี่ยนจาก Excel เป็น App แบบ No Code
นอกจากนี้ผมยังมีแพ็คเก็จคอร์สเรียนวิดีโอ CDB | Citizen Developer Bootcamp สำหรับการเรียนรู้ด้วยตนเองที่ผมจะนำความรู้ทั้งหมดที่ทุกท่านสนใจ ที่ออกเป็นคอนเทนต์ต่างๆ สร้างเป็นคอร์สเรียนให้ทุกท่านได้เรียน ได้ลองทำ และมีผลงานจริง ที่สมัครครั้งเดียวรับอัพเทคอร์สได้ตลอดอายุคอร์ส
หากต้องการติดต่อผม เพื่อจัดอบรม ปรึกษาการทำโปรเจคขององค์กร
สามารถโทร 09-626262-40 (ติดต่อคุณแพรว) ได้เลยนะครับ
Kommentare