如何编写一个sql(mysql数据库)语句来返回一个与两列相关的唯一结果集?
为了使我的问题尽可能简单,假设我只有两张table images
以及 products
. 我想查询一组特定产品的所有图像,这些图像都有这个字符串 Swatch
在野外, images
. 此查询通过使用mysql数据库的以下sql成功:
SELECT
images.alt,
images.product_id,
images.src
FROM
images
INNER JOIN products
ON products.product_id IN (
"2112055640177",
"2112056590449",
"2112055378033",
"2112062292081",
"2112058490993",
"2112062619761",
"2112062488689",
"2112066420849",
"2112061833329",
"2112052527217"
)
WHERE
images.alt LIKE "%Swatch%";
但是,结果集充满了重复项:
Black Tuscan - Swatch 2112049971313 foobar.com
Black Tuscan - Swatch 2112049971313 foobar.com
Black Tuscan - Swatch 2112049971313 foobar.com
Generic Black - Swatch 2112049971313 baz.com
Generic Black - Swatch 2112049971313 baz.com
Florence - Swatch 2112049971313 foobaz.com
Florence - Swatch 2112049971313 foobaz.com
Gold - Swatch 2112050593905 bazfoo.com
Gold - Swatch 2112050593905 bazfoo.com
Sand - Swatch 2112050593905 bazfoo.com
Sand - Swatch 2112050593905 bazfoo.com
每个产品id图像集都有副本(例如: Black Tuscan - Swatch 2112049971313 foobar.com
, Black Tuscan - Swatch 2112049971313 foobar.com
)
我希望结果集不包含重复的产品样本。换言之,images.alt和images.product\u id的图像应该是唯一的。理想情况下,结果集应该是以下内容,而不是上面的返回值:
Black Tuscan - Swatch 2112049971313 foobar.com
Generic Black - Swatch 2112049971313 baz.com
Florence - Swatch 2112049971313 foobaz.com
Gold - Swatch 2112050593905 bazfoo.com
Sand - Swatch 2112050593905 bazfoo.com
Black Tuscan - Swatch 1234586923813 foobar.com
Sand - Swatch 1234586923813 bazfoo.com
请注意,对于每个产品标识,没有重复的alt text值。
我已经做了很多搜索,我发现这些所谓的职位(一,二,三)。他们建议使用 LEFT JOIN
,或 GROUP BY
,或 DISTINCT
但是我还没有找到正确的sql语句来获得我正在寻找的唯一性-unique by images.alt和images.product\u id。
2条答案
按热度按时间6bc51xsx1#
你不需要一个
JOIN
所有的产品。那也许能解决你的问题。如果这不能解决你的问题,那就用
GROUP BY
:如果你真的想从
products
,你需要做JOIN
正确地:e0bqpujr2#
您的联接被搞砸了,因为它无法将表关联在一起。我想你需要更像这样的东西:
至于为什么会出现复制品,这被称为笛卡尔积。当连接条件被打破时,彼此不相关的行最终被连接起来。
如果你有2个产品和3个图像,你做到了:
连接条件始终为真,每个图像将复制2次,每个产品显示3次
这可能有助于您理解数据库是如何联接数据的:它们将此表中的每一行与该表中的每一行合并,然后删除不符合联接条件中条件的合并行
在您最初的查询中,如果有38个带有“swatch”的图像和10个产品,您将得到30行,因为10个产品行中的每一行都与3个图像中的每一个相结合。如果您有100个产品和100个图像,设想db将所有组合合并,生成10000行,然后删除不符合in的行(不允许使用90/100产品,删除90%的行,删除9000行,留下1000行),然后删除不符合where的所有行(97/100图像没有样本,97%的行被删除,970行被删除,剩下30行)
因为您没有选择所有列(select*),所以您看不到使每一行唯一的变体。。把它放进去,你会看到的
不要使用distinct删除重复项,修复导致笛卡尔积的断开连接条件