Hur ansluter jag Azure Data Factory till Wikipedia?
Utför följande steg för att ansluta Azure Data Factory till Wikipedia. Du behöver bara kunskap om Azure Data Factory och din egen verksamhet.
Wikipedia är en programvara för encyklopedisk kunskap på nätet. Wikipedia hanterar både insamling, delning och underhåll av stora volymer encyklopedisk kunskap på ett stort antal språk.
Det behövs inga tekniska kunskaper eller kunskaper om Wikipedia API:erna för att ansluta Wikipedia till Azure Data Factory. Den här steg-för-steg-planen berättar exakt vilka steg du måste gå igenom på Invantive Cloud för att skapa ditt eget Azure-datalagret med data från Wikipedia.
Stegen för att ansluta Azure Data Factory till Wikipedia är:
- Registrera ett Invantive Cloud-konto.
- Skapa en databas Wikipedia.
- Gör Wikipedia-databasen tillgänglig via Microsoft OData-kontakten.
- Anslut Azure Data Factory till Wikipedia genom kontakten.
- Ladda data från Wikipedia till Azure Data Factory datalager.
Invantive Cloud erbjuder en Wikipedia kontakt för att hämta data från Wikipedia till Azure Data Factory, men det finns över 75 andra kontakter tillgängliga även för SQL, Power BI Desktop, Power BI Service, Power Query och/eller Azure Data Factory.
Har du en stor miljö? För effektiva nedladdningar kan du naturligtvis också filtrera data med hjälp av filtersteget eller omvandlingsknappen i Azure Data Factory.
Om du har frågor kan du titta på forumet för Wikipedia.
Registrera ett konto på Invantive Cloud
Hoppa över det här steget om du redan har ett konto på Invantive Cloud. I annat fall utför du följande steg en gång för att registrera ett konto på Invantive Cloud:
-
Gå till Invantive Cloud startsida.
Välj knappen Log on (Logga in).
-
Välj knappen Nästa.
-
Välj knappen Nästa.
Ange ditt lösenord och upprepa lösenordet.
Du får en sexsiffrig verifieringskod via e-post inom två minuter.
-
Välj knappen Registrera dig.
-
Se till att du har en autentiseringsapp installerad på din telefon. Välj knappen Nästa.
-
Lägg till den visade QR-koden i autentiseringsappen, ange den aktuella verifieringskoden och välj "Slutför".
-
Invantive Cloud dashboard visas.
Du har nu en inloggningskod i Invantive Cloud med vilken du kan upprätta en anslutning till Wikipedia och många andra plattformar. Du kommer att använda samma Invantive-inloggningskod och arbetsflöde för alla andra plattformar.
Skapa Wikipedia databas
I det här steget konfigurerar vi en databas med data från Wikipedia. Databasen är "virtuell" eftersom den inte är en traditionell databas, utan matas i realtid från Wikipedia. Invantive Cloud förser Azure Data Factory med en realtidslänk till Wikipedia. Databasen kommer att användas för all din Wikipedia-rapportering med Azure Data Factory. Du behöver alltså bara utföra de här stegen en gång.
-
Klicka på knappen Add Database (Lägg till databas).
-
Fyll i formuläret med inloggningsuppgifter för Wikipedia.
Välj OK-knappen.
Grattis! Du kan nu bearbeta data från Wikipedia på webbplatsen Invantive Cloud. Du kan till exempel göra detta med den interaktiva SQL-redigeraren.
Bevilja anslutning från Azure Data Factory tillgång till Wikipedia
För att hämta data från Azure Data Factory skapar vi en länk via Invantive Bridge Online. Detta skapar en "bro" mellan Invantives moln och standard OData-kontakten som finns tillgänglig i alla versioner av Azure Data Factory. Du behöver inte installera något lokalt: ingen kontakt, ingen ado.NET-provider och inget Azure Data Factory-tillägg heller.
Utför följande steg för att säkert använda data från Wikipedia utanför Invantive Cloud:
Bredvid databasen finns en orange text där du uppmanas att tillåta åtkomst från din nuvarande plats (IP-adress). Välj den närliggande orange knappen.
Du måste helt inaktivera kontrollen av IP-adresser genom att ange en asterisk ("*") eftersom Microsoft Azure Data Factory består av hundratusentals servrar över hela världen.
Du är nu redo att importera Wikipedia-data till Azure Data Factory.
Konfigurera Azure Data Factory kontakt för Wikipedia
Du kommer nu att hämta Azure Data Factory data från Wikipedia genom den etablerade länken.
Observera återigen att Invantive Cloud under huven hanterar all komplexitet, t.ex. att ställa in autentiseringsuppgifter som en uppdateringstoken, förvärva en åtkomsttoken, optimera och parallellisera åtkomst, få tillgång till ett API inom hastighetsgränser, räckvidder och säkerhetsbegränsningar. Det finns inget behov av kunskap om komplexa tekniska ämnen som OAuth-åtkomsttoken eller API. Microsoft Azure Data Factory-steg, aktiviteter och pipelines kan konstrueras med hjälp av OData-flöde och grundläggande autentisering.
Utför följande steg:
-
Ange Bridge Online URL för databasen Azure Data Factory i fönstret. Denna URL med data finns i databasformuläret i Invantive Cloud. Välj autentiseringstyp "Basic authentication" (grundläggande autentisering). Ange Invantive Clouds användarnamn och lösenord.
-
Listan över tillgängliga Wikipedia-tabeller visas. Välj de önskade tabellerna och konstruera din pipeline i Microsoft Azure Data Factory.