Für Azure Blob Storage steht ab sofort die Public Preview des Azure Search Indexer zur Verfügung. Diese erlaubt es, Text und Blob-Metadaten aus Dokumenten in den folgenden Formaten zu entnehmen:
- Microsoft Office: DOCX/DOC, XLSX/XLS, PPTX/PPT, MSG (Outlook-E-Mails)
- HTML, XML, ZIP, EML
- einfache Textdateien
Das Extrahieren von Blobs kann kompliziert sein. Formate wie PDF und DOC/XLS sind binär und schwer zu parsen. Inhaltserkennung und Metadaten-Extraktion können ebenfalls langwierige Prozesse sein. Aus diesem Grund hat das Azure-Team den Indexer entwickelt.
Weiterlesen...
Azure Search Indexer für Azure Blob Storage als Public Preview veröffentlicht
Aucun commentaire:
Enregistrer un commentaire