Pentaho PDI (Pentaho Data Integration) gikk opprinnelig under navnet Kettle. Det er en Eclipse-basert applikasjon for design og utføring av ETL-jobber (Extract, Transform, Load). Mao. et av de viktigste verktøyene for en vellykket Integrasjons- og BI-strategi.
Pentaho Data Integration kan kobles til et stort antall datakilder, inkludert alle vanlige, strukturerte, ustrukturerte og semi-strukturerte datakilder. Noen eksempler:
- Standard RDMS Databaser (f.eks. Oracle, DB2, MySQL, SQL Server.)
- Hadoop (f.eks. Apache Hadoop, Cloudera, HortonWorks, MapR.)
- NoSQL-databaser (f.eks. MongoDB, Cassandra, HBase.)
- Analytiske databases (f.eks. Vertica, Greenplum, Teradata.)
- Enterprise Applications (f.eks. SAP)
- Cloud-based og SaaS-applikasjoner (f.eks.Salesforce, Amazon Web Services)