App-Market-Scraping
Lernziele
- Installation des Google Play Scrapers
- Einlesen einer CSV-Datei mit App-URLs
- Abrufen von App-Informationen über einen Loop
- Visualisierung der abgerufenen Daten
App Market Scraping
Um Apps zu sammeln, besuchen Sie die Google Play Search Anwendung. Diese Anwendung ermöglicht es Ihnen, nach Apps im Google Play Store zu suchen und die URLs der gefundenen Apps zu exportieren. Speichern Sie die exportierten URLs in einer CSV-Datei, die als Grundlage für die Auswertung dient.
1. Installation des Google Play Scrapers
In einem Colab Notebook, installiere die Google-Play-Scraper Bibliothek mit dem folgenden Befehl:
!pip install google-play-scraper
2. Einlesen einer CSV-Datei mit App-URLs
Eine CSV-Datei (app_urls.csv
) erstellen, die eine Spalte url enthält, welche die URLs der Google Play Store Apps auflistet. Beispiel:
url//play.google.com/store/apps/details?id=com.example.app1
https://play.google.com/store/apps/details?id=com.example.app2 https:
Die CSV-Datei in ein Pandas DataFrame einlesen:
import pandas as pd
# CSV-Datei einlesen
= pd.read_csv('app_urls.csv') df
3. Abrufen von App-Informationen über einen Loop
Den Google Play Scraper verwenden, um Informationen über die Apps abzurufen:
from google_play_scraper import app
# Funktion zum Extrahieren der App-ID aus der URL
def extract_app_id(url):
return url.split('id=')[-1]
# Liste zum Speichern der App-Informationen
= []
app_info_list
# Loop über die URLs in der CSV-Datei
for url in df['url']:
= extract_app_id(url)
app_id = app(app_id, lang='en', country='us')
app_info
app_info_list.append(app_info)
# Erstellen eines DataFrames mit den App-Informationen
= pd.DataFrame(app_info_list) app_info_df
4. Visualisierung der abgerufenen Daten
Die abgerufenen Daten visualisieren, z. B. die Bewertungen der Apps:
import matplotlib.pyplot as plt
# Histogramm der App-Bewertungen
=(10, 6))
plt.figure(figsize'score'], bins=20, color='skyblue', edgecolor='black')
plt.hist(app_info_df['Verteilung der App-Bewertungen')
plt.title('Bewertung')
plt.xlabel('Anzahl der Apps')
plt.ylabel( plt.show()
Fazit
Diese Schritte ermöglichen die Installation des Google Play Scrapers, das Einlesen einer CSV-Datei mit App-URLs, das Abrufen von App-Informationen und die Visualisierung der Daten.