如何获取MongoDB中的所有文档ID？

uujelgoq 于 2023-04-05 发布在 Go

关注(0)|答案(9)|浏览(200)

我如何在MongoDB中获得所有文档ID的数组？我只需要一组ID，而不需要文档内容。

mongodb

来源：https://stackoverflow.com/questions/18881982/how-can-i-get-all-the-doc-ids-in-mongodb

9条答案

按热度按时间

r1zhe5dt1#

你可以在Mongo shell中通过在游标上调用map来实现这一点，如下所示：

var a = db.c.find({}, {_id:1}).map(function(item){ return item._id; })

结果是a是一个只有_id值的数组。
它在Node中的工作方式类似。
(This是MongoDB节点驱动程序v2.2和节点v6.7.0）

db.collection('...')
  .find(...)
  .project( {_id: 1} )
  .map(x => x._id)
  .toArray();

请记住将map放在toArray之前，因为这个map不是JavaScript map函数，而是MongoDB提供的函数，它在返回游标之前在数据库中运行。

赞(0）回复(0）举报 2023-04-05

5lhxktic2#

一种方法是简单地使用runCommand API。

db.runCommand ( { distinct: "distinct", key: "_id" } )

它会给你这样的东西：

{
    "values" : [
        ObjectId("54cfcf93e2b8994c25077924"),
        ObjectId("54d672d819f899c704b21ef4"),
        ObjectId("54d6732319f899c704b21ef5"),
        ObjectId("54d6732319f899c704b21ef6"),
        ObjectId("54d6732319f899c704b21ef7"),
        ObjectId("54d6732319f899c704b21ef8"),
        ObjectId("54d6732319f899c704b21ef9")
    ],
    "stats" : {
        "n" : 7,
        "nscanned" : 7,
        "nscannedObjects" : 0,
        "timems" : 2,
        "cursor" : "DistinctCursor"
    },
    "ok" : 1
}

然而，使用实际的distinct API还有一种更好的方法：

var ids = db.distinct.distinct('_id', {}, {});

它只是给你一个id数组：

[
    ObjectId("54cfcf93e2b8994c25077924"),
    ObjectId("54d672d819f899c704b21ef4"),
    ObjectId("54d6732319f899c704b21ef5"),
    ObjectId("54d6732319f899c704b21ef6"),
    ObjectId("54d6732319f899c704b21ef7"),
    ObjectId("54d6732319f899c704b21ef8"),
    ObjectId("54d6732319f899c704b21ef9")
]

不确定第一个版本，但Node.js驱动程序肯定支持后者（我看到你提到你想使用）。看起来像这样：

db.collection('c').distinct('_id', {}, {}, function (err, result) {
    // result is your array of ids
})

赞(0）回复(0）举报 2023-04-05

gcxthw6b3#

我也想知道如何使用MongoDB Node.JS驱动程序来实现这一点，比如@user2793120。其他人说他应该使用.each来迭代结果，这对我来说似乎效率很低。我使用了MongoDB's aggregation：

myCollection.aggregate([
            {$match: {ANY SEARCHING CRITERIA FOLLOWING $match'S RULES} },
            {$sort: {ANY SORTING CRITERIA, FOLLOWING $sort'S RULES}},
            {$group: {_id:null, ids: {$addToSet: "$_id"}}}
    ]).exec()

排序阶段是可选的。如果你想要所有集合的_id，匹配阶段也是可选的。如果你console.log结果，你会看到如下内容：

[ { _id: null, ids: [ '56e05a832f3caaf218b57a90', '56e05a832f3caaf218b57a91', '56e05a832f3caaf218b57a92' ] } ]

然后在其他地方使用result[0].ids的内容。
这里的关键部分是$group section。（否则，聚合会崩溃），并创建一个包含所有_id的新数组字段。（根据$match阶段中使用的搜索条件，并假设您正在对除_id之外的字段进行分组，该字段还具有另一个document _id），可以使用$push代替$addToSet。

赞(0）回复(0）举报 2023-04-05

bybem2ql4#

在mongo控制台上执行此操作的另一种方法可能是：

var arr=[]
db.c.find({},{_id:1}).forEach(function(doc){arr.push(doc._id)})
printjson(arr)

希望能有所帮助！
谢谢！！！

赞(0）回复(0）举报 2023-04-05

jw5wzhpr5#

我挣扎了很长一段时间，我回答这个问题，因为我得到了一个重要的提示。很明显：

db.c.find({},{_id:1});

就是答案
它工作了，某种程度上。它会找到前101个文档，然后应用程序会暂停。我没有让它继续下去。这既在Java中使用MongoOperations，也在Mongo命令行上。
我查看了mongo日志，看到它正在对一个大文档集合进行colscan，我想，疯了，我正在投射总是被索引的_id，为什么它要尝试colscan？
我不知道为什么会这样，但答案很简单：

db.c.find({},{_id:1}).hint({_id:1});

在Java中：

query.withHint("{_id:1}");

然后，它可以正常沿着，使用流样式：

createStreamFromIterator(mongoOperations.stream(query, MortgageDocument.class)).
     map(MortgageDocument::getId).forEach(transformer);

Mongo可以做一些好的事情，但它也可能会以令人困惑的方式陷入困境，至少这是我目前的经验。

赞(0）回复(0）举报 2023-04-05

0ve6wy6x6#

尝试使用agregation管道，如下所示：

db.collection.aggregate([
{ $match: { deletedAt: null }},
{ $group: { _id: "$_id"}}

]）
这个gona返回一个文档数组，结构如下

_id: ObjectId("5fc98977fda32e3458c97edd")

赞(0）回复(0）举报 2023-04-05

eulz3vhy7#

我有一个类似的要求，要为一个有5000多万行的集合获取id。我尝试了很多方法。最快的获取id的方法是只使用id执行mongoexport。

赞(0）回复(0）举报 2023-04-05

txu3uszq8#

上面的例子中有一个对我来说很有效，只是做了一个小的调整。我省略了第二个对象，因为我试图在Mongoose模式中使用。

const idArray = await Model.distinct('_id', {}, function (err, result) {
    // result is your array of ids
    return result;
});

赞(0）回复(0）举报 2023-04-05

uyto3xhc9#

Kotlin和Spring Data 的解决方案
一个简单的解决方案，获取所有文档并从中获取ID：

// Defining the Repository.
@Repository
interface MyRepository : MongoRepository<MyDocument, String> {
}

// Fetching the IDs.
val ids: List<String> = myRepository.findAll().mapNotNull { it._id }

一个优化的解决方案，使用MongoDB Aggregation功能只获取ID：

// Defining the Repository.
@Repository
interface MyRepository : MongoRepository<MyDocument, String> {
    @Aggregation(pipeline = [
        "{ '\$project': { '_id': 1 } }"
    ])
    fun findAllIds(): List<String>
}

// Fetching the IDs.
val ids: List<String> = myRepository.findAllIds()

赞(0）回复(0）举报 2023-04-05

我来回答

如何获取MongoDB中的所有文档ID？

9条答案

相关问题

热门标签

最新问答