Architecture Deep Dive

For Technical Teams: This guide provides detailed technical documentation of DataBrain’s embedding architecture, including authentication flows, query execution paths, performance optimizations, and advanced deployment patterns.

Prerequisites:

Familiarity with REST APIs and authentication concepts
Understanding of database query execution
Basic knowledge of cloud infrastructure (for deployment sections)

Looking for conceptual overview? See Embedding Architecture Concepts for high-level understanding.

Authentication & Security Flow

Token Generation Process

The authentication flow ensures secure, multi-tenant access through stateless guest tokens:

Token Creation
Token Validation
Domain Whitelisting
RLS Application

Step 1: Your backend authenticates with DataBrain

const response = await fetch('https://api.usedatabrain.com/api/v2/guest-token/create', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${process.env.DATABRAIN_API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    clientId: user.tenantId,
    dataAppName: 'customer-portal',
    expiryTime: 3600000, // 1 hour
    rlsSettings: {
      orders: `SELECT * FROM orders WHERE customer_id = '${user.customerId}'`,
      customers: `SELECT * FROM customers WHERE id = '${user.customerId}'`
    }
  })
});

const { token } = await response.json();

Your API key should only be used server-side. Never expose it to the frontend.

Step 3: Configure allowed domainsIn DataBrain dashboard, whitelist domains that can embed your analytics:

https://app.yourcompany.com
https://dashboard.yourcompany.com
http://localhost:3000 (for development)

Requests from non-whitelisted domains are automatically blocked, even with valid tokens.

Step 4: Row-level security enforcementDataBrain automatically applies RLS rules to all queries:

-- Your RLS rule (defined in token)
SELECT * FROM customers WHERE tenant_id = '{clientId}'

-- When user queries "SELECT * FROM customers"
-- DataBrain wraps it:
WITH rls_customers AS (
  SELECT * FROM customers WHERE tenant_id = 'customer-123'
)
SELECT * FROM rls_customers

This ensures users only see their own data, automatically.

Security Best Practices

API Key Security

Store API keys in environment variables
Never expose API keys in frontend code
Rotate API keys periodically
Use separate keys for dev/staging/production

Token Configuration

Set reasonable expiration times (1-24 hours)
Refresh tokens before expiration
Generate new tokens on user session refresh
Shorter expiry = better security

Domain Whitelisting

Whitelist only necessary domains
Remove development domains in production
Use HTTPS in production (required)
Review whitelist regularly

Row-Level Security

Define RLS rules for all tables
Test RLS rules thoroughly
Use parameterized queries
Avoid SQL injection vulnerabilities

Data Flow Architecture

Query Execution Path

Understanding how queries flow through the system:

User Interaction

End user interacts with embedded dashboard:

Applies filters
Changes date ranges
Drills down into data
Refreshes metrics

Component Generates Request

Web component constructs authenticated API request with the guest token and sends it to DataBrain to fetch metric data with any applied filters.

DataBrain Validates & Processes

DataBrain processing pipeline:

Validate token: Check signature, expiration, permissions
Retrieve metric: Load metric configuration from metadata
Apply filters: Merge user filters with app filters
Generate SQL: Create optimized query
Apply RLS: Wrap query with row-level security
Check cache: Look for cached results (optional)

Database Execution

Query executes against your database:

-- Example generated query
WITH rls_orders AS (
  SELECT * FROM orders 
  WHERE customer_id = 'customer-123'
    AND created_at >= CURRENT_DATE - INTERVAL '30 days'
)
SELECT 
  DATE_TRUNC('day', created_at) as date,
  SUM(amount) as revenue
FROM rls_orders
GROUP BY date
ORDER BY date;

DataBrain generates optimized SQL with proper indexing hints and query planning.

Result Processing

DataBrain processes query results:

Format data for visualization
Apply number formatting
Calculate aggregations
Handle null values
Apply currency conversions (if configured)

Response & Rendering

Results streamed to frontend:

{
  "data": [
    { "date": "2024-01-01", "revenue": 125000 },
    { "date": "2024-01-02", "revenue": 132000 }
  ],
  "metadata": {
    "executionTime": 245,
    "cached": false
  }
}

Component renders interactive chart with your theme.

Performance Optimizations

Query Caching

Reduce database load with intelligent caching:

Time-based caching: Cache results for configurable duration
Invalidation: Automatic cache invalidation on data changes
Per-tenant caching: Separate cache per client
Smart refresh: Background refresh before expiration

Configure caching per dashboard:

{
  "cacheConfig": {
    "enabled": true,
    "ttl": 300, // 5 minutes
    "refreshInBackground": true
  }
}

Connection Pooling

Efficient database connection management:

Connection pool per datasource
Automatic connection recycling
Configurable pool size
Connection health checks
Query timeout management

Recommended pool configuration:

Workload	Min Connections	Max Connections
Light	2	10
Medium	5	25
Heavy	10	50

Query Optimization

Automatic query optimization:✅ Push-down filters to database
✅ Minimize data transfer
✅ Use appropriate indexes
✅ Parallel query execution
✅ Result streaming for large datasets
✅ Automatic query planning

Frontend Optimization

Fast-loading embedded components:

Lazy loading of visualizations
Progressive rendering
Debounced filter updates
Virtual scrolling for tables
Compressed data transfer
CDN delivery of assets

Advanced Architecture Patterns

Proxy Mode Architecture

For enhanced security, route all requests through your own proxy server: Benefits of proxy mode:

Guest tokens never exposed to frontend
Additional authentication layer
Request/response modification
Custom logging and monitoring
API rate limiting
Request validation

Learn More

Complete guide to implementing proxy authentication

Multi-Datasource Architecture

Support customers with data in different databases:

{
  "clientId": "enterprise-customer",
  "datasourceName": "customer-dedicated-db",
  "dataAppName": "analytics"
}

Use cases:

Dedicated database per enterprise customer
Multi-region data residency
Database sharding strategies
Read replica routing

Multi-Datasource Setup

Configure multi-datasource workspaces

High-Availability Architecture

Deploy DataBrain with redundancy and failover:

Load Balancing
Database Redundancy
Caching Layer

Horizontal scaling with load balancers:

[Load Balancer]
     |
┌────┼────┬────┐
│    │    │    │
App  App  App  App
│    │    │    │
└────┴────┴────┘
     |
[Database Pool]

Multiple application servers
Session affinity (sticky sessions)
Health check endpoints
Automatic failover

Deployment Considerations

Cloud vs Self-Hosted Comparison

Cloud Deployment
Self-Hosted

Best for:

Fast time-to-market
Minimal DevOps resources
Automatic updates and maintenance
Built-in scalability
Lower initial investment

Considerations:

Data passes through DataBrain infrastructure
Requires internet connectivity
Less customization options
Monthly/annual subscription pricing

Self-Hosted Deployment

Infrastructure Setup

Required components:

DataBrain Application Server (Node.js)
PostgreSQL Database (metadata storage)
Redis Cache (session & query caching)
Web UI (admin interface)

Deployment instructions and installation packages are provided in your self-hosted license package.

Database Configuration

Connect to your databases:

Private network connections within VPC
Connection pooling configuration
SSL/TLS certificate setup
Read replica configuration (optional)

Environment Variables

Configure required environment variables:

# Database
DB_HOST=your-postgres-host
DB_PORT=5432
DB_NAME=databrain
DB_USER=databrain_user
DB_PASSWORD=secure_password

# Redis
REDIS_HOST=your-redis-host
REDIS_PORT=6379

# Application
NODE_ENV=production
PORT=3000
API_BASE_URL=https://your-databrain.company.com

Configure SSL/TLS

Set up HTTPS for production:

Obtain SSL certificates
Configure reverse proxy (nginx/Apache)
Enable HTTPS enforcement
Set up certificate auto-renewal

Start Services

Launch DataBrain platform:Refer to your self-hosted package for specific deployment commands based on your infrastructure (Docker, Kubernetes, VMs).

Infrastructure Sizing Guide

Estimate your resource requirements:

Users (Concurrent)	CPU	Memory	Storage	Bandwidth
1-50	2 vCPU	4 GB	20 GB	100 Mbps
50-200	4 vCPU	8 GB	50 GB	500 Mbps
200-500	8 vCPU	16 GB	100 GB	1 Gbps
500-1000	16 vCPU	32 GB	200 GB	2 Gbps
1000+	Contact us for enterprise architecture

Sizing factors to consider:

Dashboard complexity (number of metrics)
Query complexity and execution time
Cache hit rate
Number of dashboards per user
Refresh rate requirements

Monitoring & Observability

Key Metrics to Monitor

Application Metrics

Request rate and latency
Error rates and types
Token validation success rate
API endpoint performance

Database Metrics

Query execution time
Connection pool utilization
Cache hit/miss ratio
Failed query rate

User Metrics

Concurrent users
Dashboard load times
User session duration
Feature usage patterns

Infrastructure Metrics

CPU and memory utilization
Network throughput
Disk I/O and space
Container/pod health

Health Check Endpoints

DataBrain provides health check endpoints for monitoring:

# Application health
GET /health
Response: { "status": "healthy", "uptime": 86400 }

# Database connectivity
GET /health/database
Response: { "status": "connected", "latency": 15 }

# Redis connectivity
GET /health/cache
Response: { "status": "connected", "hitRate": 0.85 }

Recommended Monitoring Stack

Application Monitoring
Database Monitoring
Infrastructure
Logging

Tools:

DataDog / New Relic: Full-stack APM
Prometheus + Grafana: Open-source metrics
CloudWatch: AWS native monitoring

Key dashboards:

API response times
Error rate tracking
Token generation rate
Active sessions

Troubleshooting & Debugging

Common Issues

Token Validation Failures

Symptoms:

“UNAUTHORIZED” errors
“TOKEN_EXPIRED” messages
“UNAUTHORIZED_ORIGIN” errors

Solutions:

Verify API key is correct and active
Check token expiration time
Ensure domain is whitelisted
Verify token is being sent correctly
Check for clock skew between systems

Slow Query Performance

Symptoms:

Dashboards loading slowly
Timeouts on complex queries
High database load

Solutions:

Enable query caching
Add database indexes
Optimize RLS rules
Increase connection pool size
Use read replicas for analytics
Review query execution plans

Connection Pool Exhaustion

Symptoms:

“Too many connections” errors
Intermittent connection failures
Slow response times

Solutions:

Increase max connections in pool config
Reduce connection idle timeout
Scale application horizontally
Optimize query execution time
Check for connection leaks

Cache Issues

Symptoms:

Stale data displayed
Inconsistent results
Memory warnings

Solutions:

Reduce cache TTL
Clear cache manually if needed
Increase Redis memory
Review cache invalidation logic
Check cache hit rate

Debug Mode

Enable debug logging for troubleshooting:

// Frontend debugging
window.dbn = {
  debug: true,
  logLevel: 'verbose'
};

This will log:

Component lifecycle events
API requests and responses
Token validation steps
Error details

Next Steps

Production Setup

Complete step-by-step production deployment guide

Security Guide

Comprehensive security and compliance documentation

Multi-Tenancy

Implement row-level security for multi-tenant apps

API Reference

Complete API documentation for token generation

Proxy Authentication

Advanced proxy mode implementation

Self-Hosted Config

Self-hosted deployment configuration

Additional Resources

Architecture FAQs

Q: How are queries optimized?
A: DataBrain applies push-down filters, uses connection pooling, generates indexed queries, and caches results based on your configuration.Q: What database permissions are required?
A: DataBrain only needs SELECT permissions on the tables you want to query. No write access is required.Q: How is high availability achieved?
A: Cloud deployments have built-in HA. Self-hosted can deploy with load balancers, multiple app servers, and database replicas.Q: Can I customize query generation?
A: While DataBrain optimizes queries automatically, you can control them through metric definitions and filter configurations.Q: What’s the token refresh strategy?
A: Generate new tokens before expiration (e.g., when token has 10% life remaining). Your backend should handle this automatically.

Performance Tuning Tips

Application Level:

Enable query caching with appropriate TTL
Use connection pooling (adjust based on load)
Implement CDN for static assets
Enable compression for API responses

Database Level:

Create indexes on filtered columns
Use read replicas for analytics workload
Optimize RLS queries for performance
Monitor slow query log

Infrastructure Level:

Scale horizontally with load balancing
Use Redis cluster for caching layer
Deploy close to your database (reduce latency)
Implement proper monitoring and alerting

Security Certifications

DataBrain maintains industry-leading security certifications:

SOC 2 Type II: Annual audits of security controls
ISO 27001: Information security management
GDPR: European data protection compliance
HIPAA: Healthcare data protection (self-hosted)
PCI DSS: Payment card data security

View Security Page →

Support Resources

Need technical support?

📚 Documentation: docs.usedatabrain.com
💬 Contact support through your DataBrain dashboard

Enterprise customers: Contact your dedicated solutions architect for architecture reviews and optimization guidance.

Embedding Setup

Framework Integration

Component Options

Authentication & Security

Filtering & Personalization

Customization

Events & Interactions

End-User Features

AI Chat Mode

Self-Hosted Deployment

Solution Patterns

Testing & Debugging

Migration & Legacy

Additional Resources

​Authentication & Security Flow

​Token Generation Process

​Security Best Practices

API Key Security

Token Configuration

Domain Whitelisting

Row-Level Security

​Data Flow Architecture

​Query Execution Path

​Performance Optimizations

​Advanced Architecture Patterns

​Proxy Mode Architecture

Learn More

​Multi-Datasource Architecture

Multi-Datasource Setup

​High-Availability Architecture

​Deployment Considerations

​Cloud vs Self-Hosted Comparison

​Self-Hosted Deployment

​Infrastructure Sizing Guide

​Monitoring & Observability

​Key Metrics to Monitor

Application Metrics

Database Metrics

User Metrics

Infrastructure Metrics

​Health Check Endpoints

​Recommended Monitoring Stack

​Troubleshooting & Debugging

​Common Issues

​Debug Mode

​Next Steps

Production Setup

Security Guide

Multi-Tenancy

API Reference

Proxy Authentication

Self-Hosted Config

​Additional Resources

Authentication & Security Flow

Token Generation Process

Security Best Practices

Data Flow Architecture

Query Execution Path

Performance Optimizations

Advanced Architecture Patterns

Proxy Mode Architecture

Multi-Datasource Architecture

High-Availability Architecture

Deployment Considerations

Cloud vs Self-Hosted Comparison

Self-Hosted Deployment

Infrastructure Sizing Guide

Monitoring & Observability

Key Metrics to Monitor

Health Check Endpoints

Recommended Monitoring Stack

Troubleshooting & Debugging

Common Issues

Debug Mode

Next Steps

Additional Resources