Erstellen Sie einen Content-Crawler, um Content aus externen Content-Repositorys in Ihr Portal zu importieren. Sie müssen einen dem Content-Crawler zugeordneten Job ausführen, um im externen Repository regelmäßig nach Content zu suchen und diesen Content zu importieren. Weitere Informationen zu Aufträgen finden Sie unter Info zu Aufträgen.
Hinweis: Content-Crawler sind von Datenquellen abhängig. Weitere Informationen zu Contentquellen finden Sie unter Info zu Contentquellen.
In diesem Thema werden die folgenden Bereiche behandelt:
Weitere Informationen zum Erstellen oder Bearbeiten von Administrationsobjekten (einschließlich Content-Crawler) finden Sie hier.
Webcontent-Crawler ermöglichen Benutzern das Importieren von Content aus dem Internet in das Portal.
Weitere Informationen zum Editor für Webcontent-Crawler finden Sie auf den folgenden Editorseiten:
Mit einem Remote-Content-Crawler lässt sich Content aus einem externen Content-Repository in das Portal importieren.
Einige Crawl-Provider werden direkt mit dem Portal installiert und stehen Portalbenutzern sofort zur Verfügung, andere müssen erst manuell installiert und eingerichtet werden. Die folgenden Crawl-Provider werden beispielsweise von Oracle bereitgestellt:
Hinweis: Informationen über den Bezug von Crawl-Providern finden Sie im Oracle Technology Network unter http://www.oracle.com/technology/index.html. Informationen zum Installieren von Crawl-Providern finden Sie im Installation Guide for Oracle WebCenter Interaction (verfügbar im Oracle Technology Network unter http://www.oracle.com/technology/documentation/bea.html), in der Dokumentation des Crawl-Providers oder direkt von Ihrem Portal-Administrator.
So erstellen Sie einen Remote-Content-Crawler:
Weitere Informationen zum Editor für Remote-Content-Crawler finden Sie auf den folgenden Editorseiten:
Folgende Crawl-Provider fügen dem Editor für den Remote-Content-Crawler zumindest eine zusätzliche Seite hinzu, wenn sie installiert werden:
Contentwebservices ermöglichen Ihnen das Festlegen von allgemeinen Einstellungen für Ihr Remote-Content-Repository. Die Einstellungen für Ziel und Sicherheit werden dann in der zugeordneten Remote-Contentquelle und im Remote-Content-Crawler eingerichtet. So können Sie mehrere Bereiche desselben Content-Repositorys durchsuchen, ohne die Einstellungen immer wieder neu angeben zu müssen.
Hinweis: Die von Ihnen erstellten Contentwebservices dienen als Grundlage für Ihre Remote-Contentquellen. Weitere Informationen zu Contentquellen finden Sie unter Info zu Contentquellen.
Weitere Informationen zum Editor für den Contentwebservice finden Sie auf den folgenden Editorseiten:
Benutzer können automatisch Zugriff auf den von bestimmten Remote-Content-Crawlern importierten Content erhalten. Die globale ACL Sync-Zuordnung zeigt diesen Content-Crawlern, wie Sicherheitseinstellungen von Quelldokumenten importiert werden sollen.
Ein Beispiel zum Importieren von Sicherheitseinstellungen finden Sie unter Beispiel für das Importieren von Sicherheitseinstellungen.
Sie sollten Folgendes überprüfen, wenn Ihr Content-Crawler nicht den gewünschten Content importiert:
Vergewissern Sie sich, dass die Filter in Ihren Ordnern richtig eingestellt sind. Informationen zum Testen Ihrer Filter finden Sie auf der Seite "Haupteinstellungen (Filter)" im Abschnitt Testen von Filtern.
Vergewissern Sie sich, dass der Content-Crawler keinen unerwünschten Content im Zielordner abgelegt hat. Werden Dokumente nicht in Unterordner gefiltert, legt der Content-Crawler sie möglicherweise im Zielordner ab. Dies wird durch eine Einstellung auf der Seite Haupteinstellungen im Ordnereditor festgelegt.
Vergewissern Sie sich, dass der Content-Crawler keinen unerwünschten Content im Ordner "Nicht klassifizierte Dokumente" abgelegt hat. Können Dokumente weder in den Ziel- noch in den Unterordnern abgelegt werden, verschiebt der Content-Crawler diese unter Umständen in den Ordner "Nicht klassifizierte Dokumente". Dies wird durch eine Einstellung auf der Seite Erweiterte Einstellungen im Content-Crawler-Editor festgelegt. Wenn Sie über die entsprechenden Berechtigungen verfügen, können Sie den Ordner "Nicht klassifizierte Dokumente" beim Bearbeiten des Verzeichnisses oder durch Klicken auf Administration | Utility auswählen | Auf nicht klassifizierte Dokumente zugreifen anzeigen.
Stellen Sie sicher, dass Sie mindestens über die Bearbeitungsberechtigung für den Zielordner verfügen.
Bei Webcontent-Crawlern müssen Sie auch darauf achten, dass keine automatischen Ausschlussprotokolle oder andere Ausschlüsse bzw. Aufnahmen den Content-Crawler am Importieren des erwarteten Contents hindern. Dies wird durch eine Einstellung auf der Seite Ausschluss von Webseiten im Content-Crawler-Editor festgelegt.
Außerdem müssen die in der zugeordneten Contentquelle angegebenen Authentifizierungsinformationen dem Portal einen Zugriff auf den Content ermöglichen.
In Jobhistorie finden Sie dazu weitere Informationen.