Hur ansluter jag Azure Data Factory till Wikipedia på 5 minuter?
Utför följande steg för att ansluta Azure Data Factory till Wikipedia. Du behöver bara ha kunskap om Azure Data Factory, ditt eget företag och Wikipedia administrationen.
Wikipedia är en programvara för encyklopedisk kunskap på nätet. Wikipedia hanterar både insamling, delning och underhåll av stora volymer encyklopedisk kunskap på ett stort antal språk.
Det behövs inga tekniska kunskaper eller kunskaper om Wikipedia API:erna för att ansluta Wikipedia till Azure Data Factory. Den här steg-för-steg-planen berättar exakt vilka steg du måste gå igenom på Invantive Cloud för att skapa ditt eget Azure-datalagret med data från Wikipedia.
Stegen för att ansluta Azure Data Factory till Wikipedia är:
- Registrera ett Invantive Cloud-konto.
- Skapa en databas Wikipedia.
- Gör Wikipedia-databasen tillgänglig via Microsoft OData-kontakten.
- Anslut Azure Data Factory till Wikipedia genom kontakten.
- Ladda data från Wikipedia till Azure Data Factory datalager.
Invantive Cloud erbjuder en Wikipedia kontakt för att hämta data från Wikipedia till Azure Data Factory, men det finns över 75 andra kontakter tillgängliga även för SQL, Power BI Desktop, Power BI Service, Power Query och/eller Azure Data Factory.
Med Wikipedia-kontakten för Azure Data Factory hämtar du som standard data från alla anslutna Wikipedia-företag i din instrumentpanel. Du kan begränsa antalet Wikipedia företag som hämtas i Azure Data Factory genom databasinställningarna. Du kan t.ex. också begränsa connectorn för Azure Data Factory till data från exakt ett Wikipedia företag. Naturligtvis kan du också filtrera uppgifterna efter ett visst Wikipedia företag med hjälp av ett filtersteg i Azure Data Factory. Wikipedia-kontakten för Azure Data Factory har avancerade optimeringar för att ge bra prestanda i realtid med både ett enda Wikipedia-företag och hundratals Wikipedia-företag.
Om du har frågor kan du titta på forumet för Wikipedia.
Registrera ett konto på Invantive Cloud
Hoppa över det här steget om du redan har ett konto på Invantive Cloud. I annat fall utför du följande steg en gång för att registrera ett konto på Invantive Cloud:
-
Gå till Invantive Cloud startsida.
Välj knappen Log on (Logga in).
-
Välj knappen Nästa.
-
Välj knappen Nästa.
Ange ditt lösenord och upprepa lösenordet.
Du får en sexsiffrig verifieringskod via e-post inom två minuter.
-
Välj knappen Registrera dig.
-
Logga in nu. >
-
Se till att du har en autentiseringsapp installerad på din telefon. Välj knappen Nästa.
-
Lägg till den visade QR-koden i autentiseringsappen, ange den aktuella verifieringskoden och välj "Slutför".
-
Invantive Cloud dashboard visas.
Du har nu en inloggningskod i Invantive Cloud med vilken du kan upprätta en anslutning till Wikipedia och många andra plattformar. Du kommer att använda samma Invantive-inloggningskod och arbetsflöde för alla andra plattformar.
Skapa Wikipedia databas
I det här steget konfigurerar vi en databas med data från Wikipedia. Databasen är "virtuell" eftersom den inte är en traditionell databas, utan matas i realtid från Wikipedia. Invantive Cloud förser Azure Data Factory med en realtidslänk till Wikipedia. Databasen kommer att användas för all din Wikipedia-rapportering med Azure Data Factory. Du behöver alltså bara utföra de här stegen en gång.
-
Klicka på knappen Add Database (Lägg till databas).
-
Fyll i formuläret med inloggningsuppgifter för Wikipedia.
Välj OK-knappen.
Grattis! Du kan nu bearbeta data från Wikipedia på webbplatsen Invantive Cloud. Du kan till exempel göra detta med den interaktiva SQL-redigeraren.
Bevilja anslutning från Azure Data Factory tillgång till Wikipedia
För att hämta data från Azure Data Factory skapar vi en länk via Invantive Bridge Online. Detta skapar en "bro" mellan Invantives moln och standard OData-kontakten som finns tillgänglig i alla versioner av Azure Data Factory. Du behöver inte installera något lokalt: ingen kontakt, ingen ado.NET-provider och inget Azure Data Factory-tillägg heller.
Utför följande steg för att säkert använda data från Wikipedia utanför Invantive Cloud:
Bredvid databasen finns en orange text där du uppmanas att tillåta åtkomst från din nuvarande plats (IP-adress). Välj den närliggande orange knappen.
Du måste helt inaktivera kontrollen av IP-adresser genom att ange en asterisk ("*") eftersom Microsoft Azure Data Factory består av hundratusentals servrar över hela världen.
Du är nu redo att importera Wikipedia-data till Azure Data Factory.
Konfigurera Azure Data Factory kontakt för Wikipedia
Du kommer nu att hämta Azure Data Factory data från Wikipedia genom den etablerade länken.
Observera återigen att Invantive Cloud under huven hanterar all komplexitet, t.ex. att ställa in autentiseringsuppgifter som en uppdateringstoken, förvärva en åtkomsttoken, optimera och parallellisera åtkomst, få tillgång till ett API inom hastighetsgränser, räckvidder och säkerhetsbegränsningar. Det finns inget behov av kunskap om komplexa tekniska ämnen som OAuth-åtkomsttoken eller API. Microsoft Azure Data Factory-steg, aktiviteter och pipelines kan konstrueras med hjälp av OData-flöde och grundläggande autentisering.
Utför följande steg:
-
Ange Bridge Online URL för databasen Azure Data Factory i fönstret. Denna URL med data finns i databasformuläret i Invantive Cloud. Välj autentiseringstyp "Basic authentication" (grundläggande autentisering). Ange Invantive Clouds användarnamn och lösenord.
-
Listan över tillgängliga Wikipedia-tabeller visas. Välj de önskade tabellerna och konstruera din pipeline i Microsoft Azure Data Factory.