AI Technology Research

Emerging AI capabilities and training methods affecting copyright litigation

Updated Weekly

Latest Developments

New AI Capabilities

October 20, 2025

Multimodal AI Models: Copyright Implications

New multimodal models combine text, images, audio, and video in single systems. Legal teams should understand how training data cross-contamination creates broader infringement exposure.

Training Data Multimodal AI Copyright Risk

Read Analysis →

October 18, 2025

Long Context Windows: More Data Extraction

Models with 1M+ token context windows can now process entire books in single prompts. This raises new questions about reproduction rights and training data retention.

Context Windows LLM Technology

Read Analysis →

October 15, 2025

Code Generation Models: Source Code Copyright Issues

Analysis of GitHub Copilot and similar tools suggests extensive code copying from training data. This affects software companies and individual developers seeking compensation.

Code Copyright Developer Tools Open Source

Read Analysis →

October 12, 2025

Music Generation: Deepfake Audio Copyright Challenges

Voice cloning and music generation models create unprecedented copyright questions. Recent settlements (e.g., ElevenLabs) suggest liability frameworks emerging.

Music Copyright Voice Cloning Settlement Trend

Read Analysis →

October 10, 2025

Image-to-Video AI: Frame-by-Frame Infringement

New models convert static images into video sequences. Each frame may constitute separate copyright work, expanding potential damages calculations.

Visual Content Video Generation

Read Analysis →

October 8, 2025

Reasoning Models: Training Data Attribution

Advanced reasoning capabilities suggest AI systems "remember" specific training examples. This strengthens arguments for direct attribution and licensing requirements.

Reasoning Memorization Fair Use

Read Analysis →

Training Methods

How AI Companies Train Models

September 28, 2025

Web Scraping Methods and Scale

Analysis of Common Crawl, C4, and other datasets reveals petabytes of scraped content. Understanding data sources helps identify potential class members in litigation.

Data Collection Web Scraping Class Action

Read Analysis →

September 25, 2025

Instruction Tuning: Targeted Infringement

Instruction tuning with copyrighted materials creates direct exposure. Recent cases show courts distinguishing between pre-training and fine-tuning for liability assessment.

Fine-Tuning Instruction Tuning Liability

Read Analysis →

September 22, 2025

RLHF: Human Feedback with Copyrighted Content

Reinforcement Learning from Human Feedback exposes copyrighted content to human reviewers. This may create separate liability beyond training data use.

RLHF Human Reviewers

Read Analysis →