Semalt: คำแนะนำขั้นสูงในการบล็อกสแปมผู้อ้างอิงใน Google Analytics ของคุณ

Nik Chaykovskiy ผู้เชี่ยวชาญจาก Semalt ยืนยันว่าสแปมอ้างอิงเป็นหนึ่งในปัญหาที่ผู้ดูแลเว็บประสบอยู่ในปัจจุบัน สถานการณ์เลวร้ายลงเรื่อย ๆ ในช่วงหลายปีที่ผ่านมาซึ่งหมายความว่ามีคนทำเงินจากการสร้างสแปมอ้างอิง

ผีและสแปมอ้างอิง

ตอนนี้สแปมได้ดำเนินการไปยังรายงานของ Google Analytics แล้ว ผู้ส่งอีเมลขยะค้นหาช่องโหว่ในระบบเพื่อให้สามารถปรากฏในรายงานข้อมูลของเว็บไซต์ พวกเขาทำสิ่งนี้ด้วยความหวังว่าพวกเขาจุดประกายความอยากรู้อยากเห็นจนถึงจุดที่เว็บมาสเตอร์เยี่ยมชมเว็บไซต์ของพวกเขาเพื่อดูว่าทำไมพวกเขาถึงอยู่ในรายงาน ปัญหาคือพวกเขาไม่เพิ่มปริมาณการใช้งาน พวกเขาไม่ได้ทำเพราะมันเป็นบอท พวกเขาใช้รหัสติดตาม JavaScrip ที่ใช้โดย Google Analytics เพื่อสร้างการแจ้งเตือนว่ามีการเข้าชม พวกเขาจบการบิดเบือนสถิติที่สำคัญเช่นอัตราตีกลับและองค์ประกอบอื่น ๆ ที่ใช้ในการวิเคราะห์การมีส่วนร่วม มีความจำเป็นในการบล็อกสแปมอ้างอิงถ้าต้องการข้อมูลที่ถูกต้องโดยเฉพาะหากพวกเขาพึ่งพามันเพื่อทำการตัดสินใจทางการตลาด

มันยากที่จะบล็อกสแปมอ้างอิงโดยเฉพาะอย่างยิ่งเนื่องจากผู้ส่งอีเมลขยะทำงานได้เร็วมากเพิ่มอัตราการพบสแปมและแหล่งที่มา หมายความว่าผู้ดูแลเว็บต้องปรับปรุงความพยายามในการกำจัดและบัญชีดำแหล่งข้อมูลเหล่านี้ เป็นปัญหาโดยเฉพาะอย่างยิ่งกับผู้ที่มีเว็บไซต์ใหม่ที่ไม่ได้รับปริมาณการเข้าชมที่ถูกกฎหมายมาก การเพิ่มขึ้นของอัตราสแปมในเว็บไซต์ดังกล่าวจะทำให้เกิดความเบ้มากขึ้นซึ่งอาจมากกว่าความนิยมประจำวันที่ได้รับ

มันง่ายแค่ไหน?

บันทึกการโหลดหนึ่งหน้าเป็นการเข้าชมครั้งเดียว ผู้ส่งอีเมลขยะผีใช้รหัสติดตามของ Google Analytics และส่งข้อมูลปริมาณการใช้งานไปยังรายงานโดยตรงซึ่งจะเป็นการเยี่ยมชม อาจใช้เวลา 0.001 วินาทีในการโหลดหน้าเดียวบนเซิร์ฟเวอร์บางแห่ง อย่างไรก็ตามพวกเขาอาจบังคับให้ผู้เยี่ยมชมปลอมแปลงกว่า 100 คนเข้าสู่บัญชี Google ของเว็บไซต์อื่น ๆ อีกมากมาย มันค่อนข้างง่ายที่จะซื้อโฮสต์เดียว ตราบใดที่ผู้ส่งอีเมลขยะมั่นใจใน ROI ก็มีความเสียหายมากมายที่พวกเขาสามารถทำได้

วิธีแก้ปัญหาที่สั้น ๆ

เทคนิคบางครั้งมีความก้าวหน้าสูงจนโซลูชั่นที่ใช้ในการบล็อกสแปมอ้างอิงไม่ทำงาน หนึ่งในนั้นคือบริการออนไลน์ลึกลับที่เรียกว่า Darodar วิธีการต่อไปนี้ไม่ได้ล้างออกจาก GA

  • ไฟล์. htaccess ไม่ทำงานเนื่องจากสแปมผีไม่ได้แตะไซต์
  • รายการยกเว้นการอ้างอิง มันขาดการอัพเดต
  • ตัวกรองการยกเว้น มันเป็นวิธีการที่ล้าสมัยเพราะมันจะมุ่งเน้นไปที่สแปมในอนาคตและไม่ย้อนหลังสำหรับฐานข้อมูลสแปมที่ผ่านมา

ตัวกรองการยกเว้นเข้ามาใกล้เพื่อกำจัดสแปมอ้างอิงของ Darodar ข้อ จำกัด เพียงอย่างเดียวคือไม่มีรายการอ้างอิงผู้ส่งสแปมอย่างต่อเนื่องและสม่ำเสมอ

ชิ้นส่วนปริศนาที่ขาดหายไป

โซลูชันที่สามารถดำเนินการได้เพื่อระบุและบล็อกข้อมูลอ้างอิงและ ghost ควรได้รับการอัปเดตมากมาจากฐานข้อมูลที่กว้างขึ้นและย้อนหลังเป็นข้อมูลในอดีต ขึ้นอยู่กับองค์ประกอบทั้งสามเพื่อการแก้ปัญหาที่ดีที่สุดนี่คือสิ่งที่ใช้งานได้

ขั้นตอนที่ 1: การใช้กลุ่มเพื่อแยกสแปม

เป็นการดีกว่าที่จะใช้เซกเมนต์เนื่องจากพวกเขาจะไม่เปลี่ยนแปลงข้อมูลอย่างถาวร หากมีใครกรองผู้อ้างอิงจริงออกมาโดยบังเอิญขณะที่ใช้ตัวกรองจะไม่มีทางกลับคืนมาได้อีก เป็นไปได้ที่จะสร้างข้อมูลเก่าโดยใช้กลุ่มแม้ว่ามันจะอยู่ที่นั่นนานเท่าไหร่ ท่านสามารถใช้พวกเขาย้อนหลัง

ขั้นตอนที่ 2: การปรับปรุงรายการยกเว้น

Slack เป็นเครื่องมือที่เว็บมาสเตอร์สามารถใช้ในการตรวจสอบแหล่งอ้างอิง มันแจ้งให้ผู้ใช้เกี่ยวกับการอ้างอิงใหม่ใด ๆ และให้พวกเขาพร้อมท์: ไม่ว่าจะรายการที่ปลอดภัยหรือบัญชีดำแหล่งอ้างอิงที่น่าสงสัย

1. Slack ได้รับการอ้างอิงทั้งหมดและ

2. ใช้ PHP เพื่อเรียงลำดับผลลัพธ์ทั้งหมดตามลำดับการนับจากนั้นวนรายการสุดท้ายไปยังเว็บมาสเตอร์เพื่อดูว่ามีลักษณะใดที่คุ้นเคย ถ้าไม่,

3. จะส่งต่อจดหมายขยะที่น่าสงสัยทั้งหมดไปยังช่องสัญญาณหย่อนซึ่งเสนอทางเลือกให้ผู้ใช้ระหว่างบัญชีปลอดภัยหรือบัญชีดำ ตัวเลือกใดที่พวกเขาเลือกจะนำไปสู่ขั้นตอนที่ 4

4. มันเปลี่ยนเส้นทางไปยังหน้าเว็บที่ยืนยันคำตัดสินว่าเป็นการยืนยันการเลือก

5. หย่อนแล้วจัดเก็บและล็อคผู้ส่งอีเมลขยะที่ระบุทั้งหมดในฐานข้อมูล

6. การแสดงผลขั้นสุดท้ายของข้อมูลที่สะอาดจะอยู่ในรูปแบบ regex คัดลอกและวางใน Google Analytics

Slack อนุญาตให้เว็บมาสเตอร์อัปเดตรายการยกเว้นอย่างน้อยห้าครั้งต่อวัน

ในความเป็นจริงการแก้ปัญหาหลายอย่างสามารถทำงานได้:

แม้จะเป็นวิธีการที่ได้รับการพิสูจน์แล้ว แต่มันจะทำงานได้ดียิ่งขึ้นถ้าเว็บมาสเตอร์ใช้เทคนิคอื่นเพิ่มเติมเพื่อให้แน่ใจว่าครอบคลุมทุกฐาน นอกจากการแก้ปัญหาดังกล่าว:

  • คลิกที่ช่องทำเครื่องหมายที่แจ้งให้ Google Analytics ยกเว้นบ็อตและสไปเดอร์ที่รู้จัก
  • ใช้ตัวกรอง "รวมชื่อโฮสต์"
  • ใช้คุกกี้

บางครั้งตัวกรองที่กล่าวถึงข้างต้นอาจมีประสิทธิภาพ แต่ไม่ใช่วิธีที่ดีที่สุดในระยะยาวเนื่องจาก:

  • การปลอมแปลงชื่อโฮสต์นั้นไม่ใช่เรื่องยากและผู้ส่งอีเมลขยะในการวิเคราะห์ก็กำลังใช้กันมากขึ้นเรื่อย ๆ
  • หากการตั้งค่าไม่ถูกต้องอาจเป็นการกรองผู้อ้างอิงที่แท้จริงออกไป