在仔细阅读http://en.cppreference.com/w/cpp/algorithm/binary_search时,我注意到它将前向迭代器作为参数。现在我感到困惑,因为我认为它更愿意是一个随机访问迭代器,所以二进制搜索实际上是二进制的。
为了满足我的好奇心,我写了一个小程序:
#include <iostream>
#include <vector>
#include <forward_list>
#include <list>
#include <deque>
#include <algorithm>
#include <chrono>
#include <random>
int main()
{
std::uniform_int_distribution<int> uintdistr(-4000000, 4000000);
std::mt19937 twister(std::chrono::high_resolution_clock::to_time_t(std::chrono::high_resolution_clock::now()));
size_t arr[] = { 200000, 400000, 800000, 1600000, 3200000, 6400000, 12800000 };
for(auto size : arr)
{
std::list<int> my_list;
for(size_t i = 0; i < size; i++)
my_list.push_front(uintdistr(twister));
std::chrono::time_point<std::chrono::high_resolution_clock> start, end;
my_list.sort(); //fixed
start = std::chrono::high_resolution_clock::now();
std::binary_search(my_list.begin(), my_list.end(), 1252525);
end = std::chrono::high_resolution_clock::now();
long long unsigned elapsed_time = std::chrono::duration_cast<std::chrono::microseconds>(end-start).count();
std::cout << "Test finished in " << elapsed_time << "\n";
}
}
用gcc4.7.0编译它并运行
g++ -std=c++11 test.cpp
在我的计算机上提供以下结果:
Test finished in 0
Test finished in 15625
Test finished in 15625
Test finished in 46875
Test finished in 93750
Test finished in 171875
Test finished in 312500
所以看起来它并没有在转发列表上做二分查找,现在我的问题是:
为什么名字这么混乱?
为什么允许这样的代码?
为什么参考文献上说它是“第一个和最后一个之间的距离的对数”?
标准对此有何规定?
编辑:现在代码在搜索之前对列表进行排序-愚蠢的错误,现在结果是:
Test finished in 46875
Test finished in 109375
Test finished in 265625
Test finished in 546875
Test finished in 1156250
Test finished in 2625000
Test finished in 6375000
当然也不是对数的;)
3条答案
按热度按时间7jmck4yq1#
原始SGI STL实现的文档,标准就是从它派生出来的,states that
比较次数为对数:至多log(last - first)+2。如果
ForwardIterator
是随机访问迭代器,则通过该范围的步数也是对数的;否则,步数与最后一个-最先一个成比例。也就是说,* 比较 * 的次数总是对数的,而由于缺少随机访问的影响,前进的次数可以是线性的。在实践中,可能会使用
std::advance
,如果迭代器是随机访问的,则复杂度是常数,否则是线性的。如果比较的开销很大,那么使用线性迭代次数的二分搜索,但使用对数比较次数的二分搜索是有意义的。例如,如果你有一个复杂对象的排序链表,需要磁盘或网络访问来进行比较,那么使用二分搜索可能比使用线性搜索要好得多。
bkkx9g8r2#
与websites may say(例如“
distance(first, last)
中的对数“)相反,该标准实际上只涉及 * 比较 *(例如25.4.3.1,lower_bound
):复杂度:最多
log2(last − first) + O(1)
次比较迭代器的增量 * 不 * 包含在复杂度中!注意,标准库要求所有迭代器增量具有摊销常数复杂度,因此迭代器增量的成本为O(N)阶(但可能这有一个非常小的前导因子)。在部分代码(25.4.3)中:
对于非随机访问迭代器,[算法]执行线性数量的步骤。
uqzxnwby3#
该标准指定排序搜索算法(
std::lower_bound()
、std::upper_bound()
和std::binary_search()
)在线性时间内工作,用于正向和二进制迭代器。对于随机访问,时间是对数的。然而,注意,
comparisons
的数量被限制为对数。