Direkt zum Hauptbereich

Sprechen Sie APEXisch? Kapitel "Sicherer Umgang mit Datenflut".

Seit knapp 1,5 Jahren beschäftige ich mich intenisv mit Salesforce. Die Robustheit des Systems im Umgang mit gigantischen Datenmengen fasziniert mich immer wieder. Als ehemaliger Lotus Notes Entwickler vergleiche ich zwangsweise unbewusst diverse Aktivitäten und die damit verbundenen Aufwände in Bezug auf die Datenintegration und -bearbeitung in den beiden Systemen miteinander. Es macht wenig Sinn, ein dokumentorientiertes Datenbanksystem mit einem Relationalen aus der technischen Perspektive zu vergleichen. Außerdem ist ein Vergleich nicht die primäre Intention dieses Beitrags. Viel mehr möchte ich meinen Gesamteindruck fokussiert auf einen Tagesausschnitt vermitteln, indem ich mich auf die Beschreibung eines technischen Problems und der Lösungssuche dazu beschränke.

Ausgangslage:
Beim Speichern eines Datensatzes startet der entsprechende Trigger und …
beendet seine Arbeit mit einer Fehlermeldung.

Fehlermeldung
System.QueryException: Non-selective query against large object type (more than 100000 rows)….

Analyse
Der Übeltäter ist schnell identifiziert. Die folgende Datenbankabfrage liefert insgesamt 200.000 Datensätze, trotz der gesetzten Limitierung auf 1.000. 
'SELECT id FROM myObject WHERE isInUse__c=true Limit 1000
Im 1. Schritt einer Datenbankabfrage werden alle Suchergebnisse unbeachtet der Limitierung zur Verfügung gestellt, und erst anschließend wird die Anzahl auf das Limit reduziert. 
Da die Anzahl der gefundenen Datensätze die von Salesforce definierte Obergrenze von 100.000 überschreitet, wird mein Trigger außer Gefecht gesetzt. 

Lösung
Salesforce bietet eine gigantische Auswahl an mächtigen Werkzeugen, wie Data Loader, Lexi Loader, Import Wizard, Dataloader.io (mehr dazu hat mein Kollege Tobias gepostet http://www.cloudblogger.de/2013/12/salesforce-integration-fuer-arme/). Diese Werkzeuge sind in der Lage, performant und zuverlässig mit großem Datenbestand umzugehen. Sie alle „jonglieren“ mit Leichtigkeit mit diversen Salesforce APIs wie z.B. REST, BULK, SOAP, deren Basis die APEX-Sprache bildet. 
Mein Trigger basiert ebenfalls auf APEX. Es muss also eine simple Lösung für mein Problem geben. Die unglaublich starke Salesforce Community bietet eine beeindruckende Unterstützung mit vielen Anleitungen, Tipps und gezielten Antworten. Die Suche nach einem Lösungsansatz dauert nicht lange. Zusätzlicher Blick in die Salesforce Hilfe kombiniert mit ein paar Tests sind vielversprechend.

Folgende Techniken kommen als mögliche Lösungen in Frage:
1) SOSL = Salesforce Object Search Language
Nutze SOSL, um Text-, Email-, Telefonfelder aller Objekte durchzusuchen. Mit dem Schlüsselwort RETURNING können anschließend nur bestimmte Objekte für die weitere Verarbeitung herangezogen werden.

Beispiel: 
List<List<SObject >>searchList = [FIND 'mein suchstring*'in ALL FIELDS RETURNING myObject (Id, Name, isInUse__c WHERE isInUse__c = false) Limit 200];
for(myObject v :((List<myObject>)searchList[0])){
    //… hier startet die Verarbeitung ...
}
Nachteil dieser Lösung:
- ich muss zusätzlich ein Textfeld mit einem bestimmten Wert implementieren.

2) SOQL = Salesforce Object Query Language
Nutze SOQL, um gezielt nach einem bestimmten Objekt zu suchen. Um große Datenbestände durchzusuchen, markiere das Feld aus dem WHERE Block als „External ID“. 
externalId

Beispiel:
for(myObject v : [SELECT id FROM myObject WHERE isActive__c=1 Limit 1000]){
    //… hier startet die Verarbeitung ...

}

Die 2. Option erfordert weniger Aufwand in Bezug auf die Implementierung und entspricht mehr dem aktuellen Einsatzzweck. Statt isInUse__c (Kontrollkästchen) setze ich ein neues Feld isActive__c (Zahl) ein. Dieses Feld fungiert als externe ID. Somit lässt sich die Datenbank auch mit 200.000 relevanten Ergebnissen erfolgreich und dank der Indizierung des neuen Feldes performant durchsuchen.


Hier die beiden Techniken ausführlich erklärt:
http://salesforce.stackexchange.com/questions/9028/soql-vs-sosl-which-one-to-use-and-when

Kommentare

Beliebte Posts aus diesem Blog

Zeitgesteuerter Flow blockiert Custom Leadkonvertierung

Die programmierte Konvertierung eines Leads bricht mit der Fehlermeldung "Unable to convert lead that is in use by workflow" ab. Der Grund ist ein Prozess, der automatisiert und zeitgesteuert ausgeführt wird. Dieser Prozess ruft zu einem späteren Zeitpunkt einen Flow auf. Während der Speicherung eines Leads wird dabei automatisch ein Flow Interview erstellt. Dieser Datensatz vom Typ "FlowInterview" blockiert die Leadkonvertierung. Lösung: Unmittelbar vor der Leadkonvertierung eine Checkbox auf dem Lead auf TRUE setzen. Da dieselbe Checkbox in den Process Builder Kriterien eingebunden ist und der Prozess nur auf den FALSE Wert reagiert, löscht das System automatisch das entsprechende Flow Interview.

Bad value for restricted picklist field

Der Einsatz von "Restricted Picklists" bereitet spätestens im Deployment Kopfschmerzen. Basiert das Deployment auf Basis eines Drittanbietertools, dann sind die Kopfschmerzen noch intensiver. In meinem Fall habe ich versucht, ein neues Picklist-Feld mit Copado zu deployen. Während der Bereitstellung bekomme ich die folgende Fehlermeldung: System.DmlException: Insert failed. First exception on row 0; first error: INVALID_OR_NULL_FOR_RESTRICTED_PICKLIST, bad value for restricted picklist field: Z012: [CountryGroup__c] Das neue Picklist-Feld übernimmt alle Werte aus einem Global Value Set. Das bedeutet, die Option "Restrict to the values defined in the value set" ist automatisch aktiv und lässt sich nicht deaktivieren. Eine APEX-Testklasse beschreibt ebenfalls die neue Pickliste. Mit dem folgenden Workaround konnte ich das Deployment-Problem lösen: 1) Global Value Set samt Pickliste per Changeset in die Zielorg übertragen und bereitstellen ggf. Prof

Salesforce Community URL Settings

Ich habe mich in den letzten Tagen etwas ausführlicher mit Salesforce Communities in Kombination mit der API beschäftigt. Ein Problem dabei war, den richtigen Endpoint zu berechnen, wie im letzten Beitrag beschrieben API im Salesforce Partner Portal. Um die Weichen im Code für Community Benutzer einzubauen, muss während der Laufzeit berechnet werden, in welchem Context sich der aktuell eingeloggte Benutzer befindet. Dabei muss man sich zwangsweise mit den Fragen folgender Art beschäftigen: ist der eingeloggte Benuter ein Community Benutzer? ob und welche Community ist gerade aktiv? wie sieht die definierte Community URL aus? Antwort auf die Frage 1: private Boolean isCommunityUser(){         Boolean bIsCommunityUser = false;         String sUserType = UserInfo.getUserType();         sUserType = sUserType.toUpperCase();         if(sUserType == 'STANDARD')                 bIsCommunityUser = false;         if(sUserType == 'PARTNER')                  bIsCommunity