Remote Job Listings

AI Safety Experts — English & Marathi

Mercor

Red Team / Safety Evaluator Contractor Short-term ↻ Reposted

Data Annotation Technical Writing Cybersecurity +12

Remote (Global)
$20 – $22/hr
Jun 11, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Marathi to perform red teaming and adversarial testing on AI systems, identifying vulnerabilities and generating safety data to improve AI robustness. This remote contract role involves structured evaluation, documentation, and collaboration with leading AI researchers.

View Details Apply Now

Dutch Audio Generalist Evaluator Expert

Mercor

Bilingual LLM Evaluator Contractor Short-term

Proofreading Fact-Checking Research +12

United Kingdom, United States, Singapore
$50 – $50/hr
Jun 11, 2026

Remote opportunity for Dutch and English bilingual professionals to perform transcription, annotation, audio evaluation, rubric development, and AI model benchmarking for leading AI research projects.

View Details Apply Now

Argentinian Spanish Audio Generalist Evaluator Expert

Mercor

Bilingual LLM Evaluator Contractor · Part-time ↻ Reposted

Transcription Localization Editing +11

United Kingdom, United States
$50 – $50/hr
Jun 11, 2026

Remote AI evaluation opportunity for bilingual Argentinian Spanish and English speakers to perform transcription, annotation, audio evaluation, rubric development, and language model benchmarking for leading AI research projects.

View Details Apply Now

Senior Software Engineer — Agentic Coding

Alignerr

Agent System Evaluator Contractor · Full-time

AI Training Engineering +12

Remote (Global) (US: WA)
$80 – $120/hr
Jun 11, 2026

Senior Software Engineer — Agentic Coding (AI Training) About the Role What if your software engineering expertise could define how the next generation of AI writes, debugs, and ships code on its own?

View Details Apply Now

Freelance Agent Evaluation Engineer

Mindrift

Agent System Evaluator Contractor · Part-time ↘ +45 regions

English AI Testing +12

Ireland, Belgium, Denmark, Finland, Norway, Sweden
$50
Jun 10, 2026

Please submit your CV in English and indicate your level of English proficiency. Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems.

View Details

Nepali Bilingual Expert

micro1

Bilingual LLM Evaluator Contractor · Part-time

Remote (Global)
Jun 9, 2026

Native/near-native Nepali and English speakers to transcribe Nepali video content, annotate timestamps, analyze emotional tone, and conduct grammar and syntax analysis for AI training. Minimum 15 hours/week.

View Details Apply Now

AI Safety Experts — English & Odia

Mercor

Red Team / Safety Evaluator Contractor Short-term

Cybersecurity LLM Evaluation Technical Writing +11

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Help leading AI labs identify vulnerabilities and improve AI safety through adversarial testing, red teaming, prompt injection analysis, and multilingual evaluation in English and Odia. Mercor seeks bilingual AI Safety Experts to strengthen frontier AI systems' safety by generating high-quality safety data and documenting findings.

View Details Apply Now

AI Safety Experts — English & Gujarati

Mercor

Red Team / Safety Evaluator Contractor Short-term

LLM Evaluation Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Gujarati to perform red teaming and adversarial testing on AI systems, identifying vulnerabilities and generating safety data to improve AI robustness and trustworthiness. This fully remote contract role offers flexible scheduling and weekly payments.

View Details Apply Now

AI Safety Experts — English & Assamese

Mercor

Red Team / Safety Evaluator Contractor Short-term

LLM Evaluation Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Assamese to identify vulnerabilities and improve AI safety through adversarial testing, red teaming, prompt injection analysis, and multilingual evaluation. This fully remote contract role offers flexible scheduling and weekly payments, focusing on enhancing AI robustness and trustworthiness.

View Details Apply Now

AI Safety Experts — English & Punjabi

Mercor

Red Team / Safety Evaluator Contractor Short-term

Cybersecurity Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Help leading AI labs identify vulnerabilities and improve AI safety through adversarial testing, red teaming, prompt injection analysis, and multilingual evaluation in English and Punjabi. This contract role offers flexible remote work with weekly payments and the opportunity to collaborate with top AI researchers.

View Details Apply Now

AI Safety Experts — English & Malayalam

Mercor

Red Team / Safety Evaluator Contractor Short-term

LLM Evaluation Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Malayalam to perform red teaming and adversarial testing on AI systems, identifying vulnerabilities and generating safety data to improve AI robustness and trustworthiness. This fully remote contract role involves structured evaluation, documentation, and collaboration with leading AI researchers.

View Details Apply Now

AI Safety Experts — English & Telugu

Mercor

Red Team / Safety Evaluator Contractor Short-term

Cybersecurity Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Telugu to perform red teaming and adversarial testing on AI models, identifying vulnerabilities and generating safety data to improve AI robustness. This fully remote contract role offers flexible scheduling and collaboration with leading AI researchers.

View Details Apply Now

AI Safety Experts — English & Tamil

Mercor

Red Team / Safety Evaluator Contractor Short-term

LLM Evaluation Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Tamil to identify vulnerabilities and improve AI safety through adversarial testing, red teaming, prompt injection analysis, and multilingual evaluation. This fully remote contract role offers flexible scheduling and focuses on generating high-quality safety data to enhance AI robustness.

View Details Apply Now

AI Safety Experts — English & Kannada

Mercor

Red Team / Safety Evaluator Contractor Short-term

LLM Evaluation Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Kannada to perform red teaming and adversarial testing on AI systems, identifying vulnerabilities and generating safety data to improve AI robustness and trustworthiness. This fully remote contract role offers flexible scheduling and weekly payments.

View Details Apply Now

AI Safety Experts — English & Urdu

Mercor

Red Team / Safety Evaluator Contractor Short-term

LLM Evaluation Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Mercor seeks bilingual AI Safety Experts fluent in English and Urdu to perform red teaming and adversarial testing on AI systems, identifying vulnerabilities and generating safety data to improve AI robustness. This fully remote contract role offers flexible scheduling and collaboration with leading AI researchers.

View Details Apply Now

AI Safety Experts — English & Bengali

Mercor

Red Team / Safety Evaluator Contractor Short-term

LLM Evaluation Data Annotation Technical Writing +12

Remote (Global)
$20 – $22/hr
Jun 6, 2026

Help leading AI labs identify vulnerabilities and improve AI safety through adversarial testing, red teaming, prompt injection analysis, and multilingual evaluation in English and Bengali. Mercor seeks bilingual AI Safety Experts to strengthen frontier AI systems by generating safety data and evaluating misuse scenarios remotely on a flexible contract basis.

View Details Apply Now

Machine Translation Evaluation Q2 – English to German; Project Vistula

Crowdgen

Bilingual LLM Evaluator Freelancer · Part-time

Translation English German +3

Germany
$32.9 – $43.8/hr
Jun 5, 2026

Join the CrowdGen team as an Independent Contractor for Project Vistula ! We are currently looking for Independent Contractors who are native German speakers with strong English proficiency and a strong background in language expertise .

View Details Apply Now

AI Translation Evaluator; Spanish-English

Crowdgen

Bilingual LLM Evaluator Freelancer · Part-time

AI Translation Communication +7

Remote (Global)
$20 – $20/hr
Jun 4, 2026

Join the Appen team as an Independent Contractor for Project Centric . Project Centric is seeking individuals for an ongoing, ad-hoc project focused on improving AI-powered translation.

View Details Apply Now

AI Translation Evaluator; Mandarin Chinese (Simplified)-English

Crowdgen

Bilingual LLM Evaluator Freelancer · Part-time

AI Translation Mandarin Chinese +7

Remote (Global)
$25 – $25/hr
Jun 4, 2026

Join the Appen team as an Independent Contractor for Project Centric . Project Centric is seeking individuals for an ongoing, ad-hoc project focused on improving AI-powered translation.

View Details Apply Now

AI Translation Evaluator; Korean-English

Crowdgen

Bilingual LLM Evaluator Freelancer · Part-time

AI Translation Communication +7

Remote (Global)
$25 – $25/hr
Jun 4, 2026

Join the Appen team as an Independent Contractor for Project Centric . Project Centric is seeking individuals for an ongoing, ad-hoc project focused on improving AI-powered translation.

View Details Apply Now

AI Translation Evaluator; Japanese-English

Crowdgen

Bilingual LLM Evaluator Freelancer · Part-time

AI Translation Communication +7

Remote (Global)
$27 – $27/hr
Jun 4, 2026

Join the Appen team as an Independent Contractor for Project Centric . Project Centric is seeking individuals for an ongoing, ad-hoc project focused on improving AI-powered translation.

View Details Apply Now

AI Translation Evaluator; French-English

Crowdgen

Bilingual LLM Evaluator Freelancer · Part-time

AI Translation Communication +7

Remote (Global)
$25 – $25/hr
Jun 4, 2026

Join the Appen team as an Independent Contractor for Project Centric . Project Centric is seeking individuals for an ongoing, ad-hoc project focused on improving AI-powered translation.

View Details Apply Now

AI Translation Evaluator; Arabic-English

Crowdgen

Bilingual LLM Evaluator Freelancer · Part-time

AI Translation Communication +7

Remote (Global)
$18 – $18/hr
Jun 4, 2026

Join the Appen team as an Independent Contractor for Project Centric . Project Centric is seeking individuals for an ongoing, ad-hoc project focused on improving AI-powered translation.

View Details Apply Now

Secondary Education Teacher

DataAnnotation.tech

LLM Evaluator (English) Contractor · Part-time

LLM Evaluation Editing Proofreading +7

New Zealand
$25 – $30/hr
Jun 4, 2026

Remote AI evaluation opportunity for Secondary Education Teachers in New Zealand. Evaluate AI-generated content, complete writing and editing tasks, and help improve the quality and reasoning capabilities of AI systems.

View Details Apply Now

AI Evaluation Specialist

Micro1

Agent System Evaluator Contractor · Full-time

LLM Evaluation Quality Assurance Technical Writing +10

Remote (Global)
$20 – $35/hr
May 29, 2026

Remote contract opportunity for professionals with strong analytical writing and evaluation skills to design AI assessment tasks, create scoring rubrics, and evaluate AI performance across real-world workflows.

View Details Apply Now

Balinese Bilingual Expert

Micro1

Bilingual LLM Evaluator Contractor · Part-time

Transcription Balinese English +12

Remote (Global)
$15 – $95/hr
May 27, 2026

Help train next-generation AI systems as a Balinese Bilingual Expert, applying your expertise to high-quality, real-world input. No prior AI experience required.

View Details Apply Now

Generalist

Micro1

LLM Evaluator (English) Contractor

Data Entry Attention to Detail Problem Solving +11

Remote (Global)
$15 – $25/hr
May 19, 2026

Remote contractor opportunity for adaptable generalists to contribute real-world input, communication, multitasking, and operational support toward training and improving AI systems.

View Details Apply Now

Rubrics Evaluator (Professional Experience)

Mercor

LLM & Agent Evaluation Contractor Short-term

Analytical Reasoning Financial Analysis Rubric Evaluation +10

Remote (Global)
$60 – $85/hr
May 17, 2026

Remote contract opportunity for experienced enterprise professionals to evaluate AI-generated reasoning, business analysis, and operational decision-making using structured scoring rubrics and evaluation frameworks.

View Details Apply Now

Safety Project | Emotional Distress Role-Play Actor

Vetto AI

Red Team / Safety Evaluator Freelancer

Acting Role-Play Improvisation +11

Remote (Global)
$40/deliverable
May 16, 2026

Remote freelance opportunity for actors, performers, and emotionally skilled communicators to participate in AI safety role-play conversations focused on emotional distress and sensitive conversational evaluation.

View Details Apply Now

Research Intern, Multimodal LLM Benchmarking

Centific

LLM & Agent Evaluation Intern · Full-time

Multimodal AI LLM Evaluation Benchmark Design +10

United States
$40 – $40/hr
May 16, 2026

Remote research internship opportunity focused on multimodal LLM benchmarking, AI evaluation, dataset curation, and multimodal foundation model analysis across text, image, audio, and video systems.

View Details Apply Now

Generative AI Associate

Innodata

LLM & Agent Evaluation Contractor · Part-time

Data Annotation LLM Evaluation LLM Prompt Engineering +10

United States
$15 – $15/hr
May 16, 2026

Remote part-time opportunity for contributors interested in evaluating, labeling, summarizing, ranking, and improving generative AI and large language model systems through flexible project-based work.

View Details Apply Now

Generalist — Real World Understanding

Mercor

LLM Evaluator (English) Contractor

Critical Thinking Analytical Reasoning Spatial Reasoning +11

Remote (Global)
$34 – $40/hr
May 14, 2026

Remote contract opportunity for analytically minded generalists to evaluate AI systems on real-world reasoning, visual understanding, and multi-modal problem-solving challenges.

View Details Apply Now

Generalist

Mercor

LLM Evaluator (English) Contractor

Communication Skills Analytical thinking Research +5

Remote (Global)
$35 – $45/hr
May 11, 2026

Remote contract opportunity for generalists contributing to AI training and evaluation projects with leading AI labs and enterprises. Flexible schedule with competitive hourly compensation.

View Details Apply Now

AI Writing Evaluator (Domain Expert)

Volga Partners

LLM Evaluator (English) Contractor · Full-time Short-term

LLM Evaluation AI Writing Evaluation LLM Prompt Engineering +12

United States, Canada
$20 – $23/hr
May 10, 2026

Evaluate AI-generated writing across business and academic domains to improve leading LLM systems. Remote retainer-based role paying $20–$23/hr.

View Details Apply Now

AI Evaluation & Annotation Specialist (Italian)

Volga Partners

Bilingual LLM Evaluator Contractor

Italian LLM Evaluation AI Annotation +12

Italy
$10 – $14/hr
May 10, 2026

Review and evaluate Italian AI-generated responses to help improve large language models. Remote AI annotation role paying $10–$14/hr.

View Details Apply Now

Customer Support Specialist

DataAnnotation.tech

LLM Evaluator (English) Contractor Ongoing

Customer Support LLM Evaluation Writing +11

United States (US: VT)
From $25/hr
May 7, 2026

Evaluate AI chatbot responses for clarity, reasoning, grammar, and customer communication quality in this flexible remote contractor role.

View Details Apply Now

Freelance Writer

DataAnnotation.tech

LLM Evaluator (English) Contractor Ongoing

Writing Editing Content Development +12

Canada
$25 – $30+/hr
May 7, 2026

Help train AI systems by evaluating chatbot-generated writing and completing editing and content review tasks remotely from Canada.

View Details Apply Now

AI Content Writing Specialist

DataAnnotation.tech

LLM Evaluator (English) Contractor Ongoing

Content Writing Editing Proofreading +12

United States (US: CA, GA, IL +5)
From $25/hr
May 7, 2026

Evaluate and improve AI-generated writing through editing, grammar review, and content quality analysis in this flexible remote role.

View Details Apply Now

Generative AI Generalist

DataAnnotation.tech

LLM Evaluator (English) Contractor Ongoing

Generative AI LLM Evaluation AI Training +12

United States (US: MI)
From $20/hr
May 7, 2026

Evaluate and improve AI chatbot responses through writing, editing, and reasoning tasks in this flexible remote AI training role.

View Details Apply Now

Query AI Generalist Trainer (Germany-Based | English & German Required)

RemoExperts

Bilingual LLM Evaluator Contractor

LLM Evaluation German English +11

Germany
$35 – $40/hr
May 7, 2026

Evaluate and rank AI-generated responses in English and German while helping improve next-generation AI systems remotely from Germany.

View Details Apply Now

Small Business Owners (AI Response Evaluation)

Turing

Response Rater Contractor Short-term

Business Analysis Critical Thinking LLM Evaluation +10

Remote (Global)
Not specified
May 6, 2026

Evaluate AI chatbot responses across real-world small business scenarios in a flexible remote role with Turing.

View Details Apply Now

AI Model Assessment Specialist

Micro1

Response Rater Contractor

LLM Evaluation Analytical thinking Reading Comprehension +7

Remote (Global)
$22 – $70/hr
May 2, 2026

Evaluate AI-generated responses and provide structured feedback. Flexible remote role ($22–$70/hr).

View Details Apply Now

AI Response Evaluator (Chinese – Simplified & Traditional)

Blueprint Technologies

Response Rater Contractor

LLM Evaluation Data Annotation Response Rating +7

United States, Latin America
$15 – $17/hr
May 2, 2026

Evaluate and compare AI-generated responses in Chinese to improve model quality ($15 – $17/hr).

View Details Apply Now

Video Game Specialist – Freelance AI Trainer

Meridial AI

Agent System Evaluator Contractor

LLM Evaluation Gameplay Testing Bug Reporting +7

United States (US: AZ, CA, NV +2)
$6 – $65/hr
May 2, 2026

Play and evaluate AI-generated game worlds to improve next-gen AI environments ($6–$65/hr).

View Details Apply Now

AI Evaluation Specialist

Micro1

Response Rater Contractor

Critical Thinking Content Evaluation Editorial Judgment +7

Remote (Global)
$22 – $70/hr
May 2, 2026

Evaluate and improve AI-generated content using critical thinking and editorial judgment ($22–$70/hr).

View Details Apply Now

Generalist (AI Document Evaluator)

Mercor

Response Rater Contractor

Document Analysis Analytical Skills Critical Thinking +7

United States, Europe, United Kingdom, Canada
$80 – $160/hr
Apr 30, 2026

Evaluate documents for AI training quality and accuracy. High-paying remote role ($80–$160/hr).

View Details Apply Now

Generalist Expert (AI Response Evaluator)

Mercor

Response Rater Contractor

Critical Thinking Analytical Skills Written communication +7

United States, United Kingdom, Canada, Australia, New Zealand
$60 – $200/hr
Apr 30, 2026

Evaluate AI-generated responses and provide structured feedback. High-paying remote role ($60–$200/hr).

View Details Apply Now

English Writer – AI Trainer (Freelance)

Mindrift

LLM Evaluator (English) Freelancer · Part-time

English Writing Grammar Editing +6

Remote (Global)
$10 – $20/hr
Apr 29, 2026

Train AI models by writing and evaluating English responses. Remote freelance role up to $30/hour.

View Details Apply Now

Remote job listings

Filters

No jobs available

Tips for finding remote jobs