Tác giả của cuốn sách là Matei Zaharia, người sáng lập Apache Spark và Bill Chambers, giám đốc sản phẩm của Databricks. Cả cuốn sách là một hướng dẫn hoàn chỉnh về cách triển khai, sử dụng và duy trì Apache Spark, công cụ nguồn mở phổ biến nhất. Ngoài những thông tin chi tiết về phát triển ứng dụng và giới thiệu về các giao diện lập trình ứng dụng cao cấp hơn, cuốn sách còn giải thích kĩ nhưng khái niệm chưa được bao phủ cụ thể như học máy và quản trị vận hành.