106 reads

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Training Process

February 23rd, 2024

Audio Presented by

← Previous

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Related Work

Up Next →

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings: Fine-Tuning for Embeddings

About Author

EScholar: Electronic Academic Papers for Scholars@escholar

We publish the best academic work (that's too often lost to peer reviews & the TA's desk) to the global tech community

Read my stories About @escholar

Comments

TOPICS

machine-learning #text-embedding-models #jina-embeddings-v2 #narrativeqa #text-embedding-ada-00 #text-embedding-token-limits #information-retrieval #machine-learning-research #text-re-ranking

THIS ARTICLE WAS FEATURED IN

15 Common Types of Unethical Behavior Found in Open-Source Projects

EScholar: Electronic Academic Papers for Scholars

Sep 22, 2025

#DATA

Measuring Information Retrieval Quality: Overview and Technical Metrics

Alexei Bochkarev

Nov 04, 2023

#WEB-DEVELOPMENT

The Science Behind Full-Text Search Engines

Raffaele Florio

Feb 09, 2023

#TEXT-EMBEDDING-MODELS

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Abstract & Intro

EScholar: Electronic Academic Papers for Scholars

Feb 23, 2024

#TEXT-EMBEDDING-MODELS

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Related Work

EScholar: Electronic Academic Papers for Scholars

Feb 23, 2024

#TEXT-EMBEDDING-MODELS

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings: Backbone Pre-training

EScholar: Electronic Academic Papers for Scholars

Feb 23, 2024

#OPEN-SOURCE-SOFTWARE-ETHICS

15 Common Types of Unethical Behavior Found in Open-Source Projects

EScholar: Electronic Academic Papers for Scholars

Sep 22, 2025

#DATA

Measuring Information Retrieval Quality: Overview and Technical Metrics

Alexei Bochkarev

Nov 04, 2023

#WEB-DEVELOPMENT

The Science Behind Full-Text Search Engines

Raffaele Florio

Feb 09, 2023

#TEXT-EMBEDDING-MODELS

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Abstract & Intro

EScholar: Electronic Academic Papers for Scholars

Feb 23, 2024

#TEXT-EMBEDDING-MODELS

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Related Work

EScholar: Electronic Academic Papers for Scholars

Feb 23, 2024

#TEXT-EMBEDDING-MODELS

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings: Backbone Pre-training

EScholar: Electronic Academic Papers for Scholars

Feb 23, 2024

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Training Process

About Author

Comments

TOPICS

THIS ARTICLE WAS FEATURED IN

Related Stories

15 Common Types of Unethical Behavior Found in Open-Source Projects

Measuring Information Retrieval Quality: Overview and Technical Metrics

The Science Behind Full-Text Search Engines

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Abstract & Intro

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Related Work

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings: Backbone Pre-training

15 Common Types of Unethical Behavior Found in Open-Source Projects

Measuring Information Retrieval Quality: Overview and Technical Metrics

The Science Behind Full-Text Search Engines

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Abstract & Intro

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings for Long Documents: Related Work

JINA EMBEDDINGS 2: 8192-Token General-Purpose Text Embeddings: Backbone Pre-training

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps