mysql—使用php从网站或文本文档中提取数据并保存在数据库中

jum4pzuy  于 2021-06-20  发布在  Mysql
关注(0)|答案(1)|浏览(360)

关闭。这个问题需要更加突出重点。它目前不接受答案。
**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。

两年前关门了。
改进这个问题
我正在构建一个地理位置应用程序。我有一个名单的街道名称和他们的坐标,我发现在下面的网站街道。该列表由4000多个街道名称和坐标组成。我正在尝试将列表添加到我的数据库中。有谁能告诉我如何从网站或文本文档中提取这些数据,并最好使用php将其插入到我的数据库表中。
数据库表示例

TABLE `street_names` (
  `id` int(11) NOT NULL,
  `name` varchar(150) DEFAULT NULL,
  `latitude` varchar(255) DEFAULT NULL,
  `longitude` varchar(255) DEFAULT NULL,
  `created_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
  `updated_at` timestamp NULL DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1;

文本文档示例

A Kriel Street         -25.69664263     28.41030434
Abraham Mogopodi Avenue         -25.71338241     28.37033247
Absalome Street         -25.70997386     28.3568847
Alan Paton Street         -25.72122505     28.42021664
Alfred Nzo Crescent         -25.6882444     28.41519928
Annah Mabusela Street         -25.70656941     28.34339845
Anton Lembede Street         -25.71813448     28.41874969
Aphane Nhlapo Street         -25.7208474     28.38598257
Apple Close         -25.71151327     28.38914898
Areyeng Street         -25.72404151     28.38545561
Aseletho Street         -25.71910848     28.41628606
Azikwelwa Street         -25.70616386     28.40821879
Azondo Street         -25.69615534     28.41117811
B Z Ndlazi Street         -25.71074853     28.37073878
Badanile Avenue         -25.71883255     28.42320088
Bahula Street         -25.70728106     28.35488834
Baloyi Close         -25.72553726     28.38641741
Bana Street         -25.70942133     28.40631067
Banana Close         -25.71194649     28.39090203
cpjpxq1n

cpjpxq1n1#

我想这个正则表达式可以实现你想要的。这还假设数据格式是一致的纯文本。

(?m)^(?P<Street>(?:[A-Za-z\d]+\h)+)\h{2,}(?P<LAT>-?\d*\.\d+)\h{2,}(?P<LON>-?\d*\.\d+)$

https://regex101.com/r/ctup0l/1/
看起来数据点至少被2个空格分隔开了,所以我用它作为分隔符。这也可以通过 explode 以及 preg_split .

$lines = explode(PHP_EOL, $string);
foreach($lines as $line) {
    $lines_array[] = preg_split('/\h{2,}/', $line, -1, PREG_SPLIT_NO_EMPTY);
}

https://3v4l.org/daunt

相关问题