我有四个模型: articles
, authors
以及 tags
. 每篇文章可以有许多作者,也可以有许多标签。
因此,我的数据库将有以下表格:
`article`
`article_author`
`author`
`article_tag`
`tags`
在mysql中:
DROP TABLE IF EXISTS article_tag;
DROP TABLE IF EXISTS article_author;
DROP TABLE IF EXISTS author;
DROP TABLE IF EXISTS tag;
DROP TABLE IF EXISTS article;
CREATE TABLE IF NOT EXISTS author (
id INT(11) NOT NULL AUTO_INCREMENT,
name VARCHAR(255),
PRIMARY KEY (id)
);
CREATE TABLE IF NOT EXISTS article (
id INT(11) NOT NULL AUTO_INCREMENT,
title VARCHAR(255),
PRIMARY KEY (id)
);
CREATE TABLE IF NOT EXISTS tag (
id INT(11) NOT NULL AUTO_INCREMENT,
tag VARCHAR(255),
PRIMARY KEY (id)
);
CREATE TABLE IF NOT EXISTS article_author (
article_id INT(11) NOT NULL,
author_id INT(11) NOT NULL,
PRIMARY KEY (article_id, author_id),
INDEX fk_article_author_article_idx (article_id ASC) VISIBLE,
INDEX fk_article_author_author_idx (author_id ASC) VISIBLE,
CONSTRAINT fk_article_author_article
FOREIGN KEY (article_id)
REFERENCES article (id),
CONSTRAINT fk_article_author_author
FOREIGN KEY (author_id)
REFERENCES author (id)
);
CREATE TABLE IF NOT EXISTS article_tag (
article_id INT(11) NOT NULL,
tag_id INT(11) NOT NULL,
PRIMARY KEY (article_id, tag_id),
INDEX fk_article_tag_article_idx (article_id ASC) VISIBLE,
INDEX fk_article_tag_tag_idx (tag_id ASC) VISIBLE,
CONSTRAINT fk_article_tag_article
FOREIGN KEY (article_id)
REFERENCES article (id),
CONSTRAINT fk_article_tag_tag
FOREIGN KEY (tag_id)
REFERENCES tag (id)
);
我们可以在数据库中插入一些数据:
INSERT INTO article (id, title) VALUES (1, 'first article'), (2, 'second article'), (3, 'third article');
INSERT INTO author (id, name) VALUES (1, 'first author'), (2, 'second author'), (3, 'third author'), (4, 'fourth author');
INSERT INTO tag (id, tag) VALUES (1, 'first tag'), (2, 'second tag'), (3, 'third tag'), (4, 'fourth tag'), (5, 'fifth tag');
INSERT INTO article_tag (article_id, tag_id) VALUES (1, 1), (1, 2), (1, 3), (2, 2), (2, 4), (2, 5), (3, 1), (3, 2);
INSERT INTO article_author (article_id, author_id) VALUES (1, 1), (1, 2), (1, 3), (2, 2), (2, 4), (3, 1), (3, 2), (3, 3), (3, 4);
现在我要检索文章,对于每一篇文章,我都需要相关的作者ID和标记ID:
SELECT
article.id,
article.title,
JSON_ARRAYAGG(author.id) AS authors,
JSON_ARRAYAGG(tag.id) AS tags
FROM article
INNER JOIN article_author ON article.id = article_author.article_id
INNER JOIN author ON article_author.author_id = author.id
INNER JOIN article_tag ON article.id = article_tag.article_id
INNER JOIN tag ON article_tag.tag_id = tag.id
GROUP BY article.id;
这是返回的副本。不是因为 JSON_ARRAYAGG
(如果需要,我们可以更换 COUNT
但由于同一查询中的双重关系:如果我们从查询中删除标记或作者,则重复项将消失。但我真的希望能够在同一个查询中查询多个关系。
我怎样才能避免这些重复?
1条答案
按热度按时间4smxwvx51#
我猜你指的是json字段中的重复项。问题是你沿着两个不同的维度连接,所以你得到了每一篇文章的笛卡尔积。
对于一些聚合函数,您可以使用
DISTINCT
为了避开这个。该选项对于json函数不可用。相反,您可以使用子查询:注意,因为您只包含ID,所以不需要连接到基表--
authors
以及tags
. 当然,如果需要的话,可以在子查询中这样做,但这是不必要的。这是一把小提琴。