App-Market-Scraping

Extraktion und Analyse von App-Marktdaten, einschließlich benutzerdefinierter Suchparameter und Datenexport.

Lernziele

  • Installation des Google Play Scrapers
  • Einlesen einer CSV-Datei mit App-URLs
  • Abrufen von App-Informationen über einen Loop
  • Visualisierung der abgerufenen Daten

App Market Scraping

Um Apps zu sammeln, besuchen Sie die Google Play Search Anwendung. Diese Anwendung ermöglicht es Ihnen, nach Apps im Google Play Store zu suchen und die URLs der gefundenen Apps zu exportieren. Speichern Sie die exportierten URLs in einer CSV-Datei, die als Grundlage für die Auswertung dient.

1. Installation des Google Play Scrapers

In einem Colab Notebook, installiere die Google-Play-Scraper Bibliothek mit dem folgenden Befehl:

!pip install google-play-scraper

2. Einlesen einer CSV-Datei mit App-URLs

Eine CSV-Datei (app_urls.csv) erstellen, die eine Spalte url enthält, welche die URLs der Google Play Store Apps auflistet. Beispiel:

url
https://play.google.com/store/apps/details?id=com.example.app1
https://play.google.com/store/apps/details?id=com.example.app2

Die CSV-Datei in ein Pandas DataFrame einlesen:

import pandas as pd

# CSV-Datei einlesen
df = pd.read_csv('app_urls.csv')

3. Abrufen von App-Informationen über einen Loop

Den Google Play Scraper verwenden, um Informationen über die Apps abzurufen:

from google_play_scraper import app

# Funktion zum Extrahieren der App-ID aus der URL
def extract_app_id(url):
    return url.split('id=')[-1]

# Liste zum Speichern der App-Informationen
app_info_list = []

# Loop über die URLs in der CSV-Datei
for url in df['url']:
    app_id = extract_app_id(url)
    app_info = app(app_id, lang='en', country='us')
    app_info_list.append(app_info)

# Erstellen eines DataFrames mit den App-Informationen
app_info_df = pd.DataFrame(app_info_list)

4. Visualisierung der abgerufenen Daten

Die abgerufenen Daten visualisieren, z. B. die Bewertungen der Apps:

import matplotlib.pyplot as plt

# Histogramm der App-Bewertungen
plt.figure(figsize=(10, 6))
plt.hist(app_info_df['score'], bins=20, color='skyblue', edgecolor='black')
plt.title('Verteilung der App-Bewertungen')
plt.xlabel('Bewertung')
plt.ylabel('Anzahl der Apps')
plt.show()

Fazit

Diese Schritte ermöglichen die Installation des Google Play Scrapers, das Einlesen einer CSV-Datei mit App-URLs, das Abrufen von App-Informationen und die Visualisierung der Daten.