Direkt zum Hauptbereich

Sprechen Sie APEXisch? Kapitel "Sicherer Umgang mit Datenflut".

Seit knapp 1,5 Jahren beschäftige ich mich intenisv mit Salesforce. Die Robustheit des Systems im Umgang mit gigantischen Datenmengen fasziniert mich immer wieder. Als ehemaliger Lotus Notes Entwickler vergleiche ich zwangsweise unbewusst diverse Aktivitäten und die damit verbundenen Aufwände in Bezug auf die Datenintegration und -bearbeitung in den beiden Systemen miteinander. Es macht wenig Sinn, ein dokumentorientiertes Datenbanksystem mit einem Relationalen aus der technischen Perspektive zu vergleichen. Außerdem ist ein Vergleich nicht die primäre Intention dieses Beitrags. Viel mehr möchte ich meinen Gesamteindruck fokussiert auf einen Tagesausschnitt vermitteln, indem ich mich auf die Beschreibung eines technischen Problems und der Lösungssuche dazu beschränke.

Ausgangslage:
Beim Speichern eines Datensatzes startet der entsprechende Trigger und …
beendet seine Arbeit mit einer Fehlermeldung.

Fehlermeldung
System.QueryException: Non-selective query against large object type (more than 100000 rows)….

Analyse
Der Übeltäter ist schnell identifiziert. Die folgende Datenbankabfrage liefert insgesamt 200.000 Datensätze, trotz der gesetzten Limitierung auf 1.000. 
'SELECT id FROM myObject WHERE isInUse__c=true Limit 1000
Im 1. Schritt einer Datenbankabfrage werden alle Suchergebnisse unbeachtet der Limitierung zur Verfügung gestellt, und erst anschließend wird die Anzahl auf das Limit reduziert. 
Da die Anzahl der gefundenen Datensätze die von Salesforce definierte Obergrenze von 100.000 überschreitet, wird mein Trigger außer Gefecht gesetzt. 

Lösung
Salesforce bietet eine gigantische Auswahl an mächtigen Werkzeugen, wie Data Loader, Lexi Loader, Import Wizard, Dataloader.io (mehr dazu hat mein Kollege Tobias gepostet http://www.cloudblogger.de/2013/12/salesforce-integration-fuer-arme/). Diese Werkzeuge sind in der Lage, performant und zuverlässig mit großem Datenbestand umzugehen. Sie alle „jonglieren“ mit Leichtigkeit mit diversen Salesforce APIs wie z.B. REST, BULK, SOAP, deren Basis die APEX-Sprache bildet. 
Mein Trigger basiert ebenfalls auf APEX. Es muss also eine simple Lösung für mein Problem geben. Die unglaublich starke Salesforce Community bietet eine beeindruckende Unterstützung mit vielen Anleitungen, Tipps und gezielten Antworten. Die Suche nach einem Lösungsansatz dauert nicht lange. Zusätzlicher Blick in die Salesforce Hilfe kombiniert mit ein paar Tests sind vielversprechend.

Folgende Techniken kommen als mögliche Lösungen in Frage:
1) SOSL = Salesforce Object Search Language
Nutze SOSL, um Text-, Email-, Telefonfelder aller Objekte durchzusuchen. Mit dem Schlüsselwort RETURNING können anschließend nur bestimmte Objekte für die weitere Verarbeitung herangezogen werden.

Beispiel: 
List<List<SObject >>searchList = [FIND 'mein suchstring*'in ALL FIELDS RETURNING myObject (Id, Name, isInUse__c WHERE isInUse__c = false) Limit 200];
for(myObject v :((List<myObject>)searchList[0])){
    //… hier startet die Verarbeitung ...
}
Nachteil dieser Lösung:
- ich muss zusätzlich ein Textfeld mit einem bestimmten Wert implementieren.

2) SOQL = Salesforce Object Query Language
Nutze SOQL, um gezielt nach einem bestimmten Objekt zu suchen. Um große Datenbestände durchzusuchen, markiere das Feld aus dem WHERE Block als „External ID“. 
externalId

Beispiel:
for(myObject v : [SELECT id FROM myObject WHERE isActive__c=1 Limit 1000]){
    //… hier startet die Verarbeitung ...

}

Die 2. Option erfordert weniger Aufwand in Bezug auf die Implementierung und entspricht mehr dem aktuellen Einsatzzweck. Statt isInUse__c (Kontrollkästchen) setze ich ein neues Feld isActive__c (Zahl) ein. Dieses Feld fungiert als externe ID. Somit lässt sich die Datenbank auch mit 200.000 relevanten Ergebnissen erfolgreich und dank der Indizierung des neuen Feldes performant durchsuchen.


Hier die beiden Techniken ausführlich erklärt:
http://salesforce.stackexchange.com/questions/9028/soql-vs-sosl-which-one-to-use-and-when

Kommentare

Beliebte Posts aus diesem Blog

Community Builder funktioniert nicht

Nachdem ich eine in einer Sandbox konfigurierte und getestete Lightning Community per Changeset auf die Produktion übertrage und bereitgestellt hatte, stellte ich fest, dass sich die Community nicht konfigurieren lässt. Das Deployment lief fehlerfrei durch. Alle Komponenten der Lightning Community sind verfügbar. Jedoch erscheint die Fehlermeldung Cannot read property 'def' of undefined sobald ich auf den "Builder" - Link klicke. Folgendes Workaround löst das Problem: 1. Go to "All Communities" and click on "Workspaces" beside the problematic community. 2. Go to "Administration | Pages" and click on "Go to Site.com Studio". 3. Once site.com studio has finished loading, click on the "Site Actions" icon (small cog in top right of screen), and select "Export This Site". 4. When prompted, specify a local location to save the site export, and wait for the file download to complete. 5. After the d...

Salesforce Community URL Settings

Ich habe mich in den letzten Tagen etwas ausführlicher mit Salesforce Communities in Kombination mit der API beschäftigt. Ein Problem dabei war, den richtigen Endpoint zu berechnen, wie im letzten Beitrag beschrieben API im Salesforce Partner Portal. Um die Weichen im Code für Community Benutzer einzubauen, muss während der Laufzeit berechnet werden, in welchem Context sich der aktuell eingeloggte Benutzer befindet. Dabei muss man sich zwangsweise mit den Fragen folgender Art beschäftigen: ist der eingeloggte Benuter ein Community Benutzer? ob und welche Community ist gerade aktiv? wie sieht die definierte Community URL aus? Antwort auf die Frage 1: private Boolean isCommunityUser(){         Boolean bIsCommunityUser = false;         String sUserType = UserInfo.getUserType();         sUserType = sUserType.toUpperCase();         if(sUserTyp...

Crazy SOQL

Genauso habe ich heute geschaut, als ich den folgenden Code ausgeführt und das Ergebnis ausgewertet habe: CustomObj__c obj = [select LookupField__c from CustomObj__c where LookupField__c != NULL AND Id = 'hereisavalidid']; system.debug(' LookupField__c darf nicht NULL sein '); if(obj.LookupField__c == null){     system.debug(' Also doch NULL '); } Und was sehen meine müde Augen im Log... LookupField__c ist ein Lookup- und Pflichtfeld, somit darf eigentlich per Definition nicht NULL sein. Offensichtlich gibt es (alte) Daten im System mit dem  LookupField__c = NULL Habe erwartet, dass die SOQL Abfrage die NULL-Daten filtert.