我有一个文件,可以包含3到4列的数值,这些数值由逗号分隔。空字段是定义的,但位于行末尾时除外:
1,2,3,4,5
1,2,3,,5
1,2,3
下表是在mysql中创建的:
+-------+--------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+-------+--------+------+-----+---------+-------+
| one | int(1) | YES | | NULL | |
| two | int(1) | YES | | NULL | |
| three | int(1) | YES | | NULL | |
| four | int(1) | YES | | NULL | |
| five | int(1) | YES | | NULL | |
+-------+--------+------+-----+---------+-------+
我正在尝试使用mysql load命令加载数据:
LOAD DATA INFILE '/tmp/testdata.txt' INTO TABLE moo FIELDS
TERMINATED BY "," LINES TERMINATED BY "\n";
生成的表:
+------+------+-------+------+------+
| one | two | three | four | five |
+------+------+-------+------+------+
| 1 | 2 | 3 | 4 | 5 |
| 1 | 2 | 3 | 0 | 5 |
| 1 | 2 | 3 | NULL | NULL |
+------+------+-------+------+------+
问题在于,当原始数据中的字段为空且未定义时,mysql出于某种原因不使用columns默认值(为null)而使用零。当字段一起丢失时,可以正确使用null。
不幸的是,我必须能够在这个阶段区分null和0,所以任何帮助都将不胜感激。
谢谢s。
编辑
显示警告的输出:
+---------+------+--------------------------------------------------------+
| Level | Code | Message |
+---------+------+--------------------------------------------------------+
| Warning | 1366 | Incorrect integer value: '' for column 'four' at row 2 |
| Warning | 1261 | Row 3 doesn't contain data for all columns |
| Warning | 1261 | Row 3 doesn't contain data for all columns |
+---------+------+--------------------------------------------------------+
7条答案
按热度按时间83qze16e1#
已将输入文件转换为包含
\N
对于UNIX终端中使用下面SED命令的空白列数据:sed -i 's/,,/,\\N,/g' $file_name
然后使用LOAD DATA INFILE
要加载到mysql的命令ujv3wf0j2#
预处理您的输入csv以将空白项替换为\n。
尝试正则表达式:s/,/,\n,/g和s/,$/,\n/g
祝你好运。
flvtvl503#
显示变量
Show variables like "
secure_file_priv";
注意:将csv文件保存在上述命令指定的位置。注意:这里是
date
'列在csv文件中有一些空值。ifmq2ha24#
这会做你想做的。它将第四个字段读入局部变量,然后如果局部变量最终包含空字符串,则将实际字段值设置为null:
如果它们都可能是空的,那么您可以将它们全部读入变量,并有多个set语句,如下所示:
csbfibhn5#
(variable1,@variable2,…)设置variable2=nullif(@variable2,''或'')>>您可以设置任何条件
s4n0splo6#
mysql手册上说:
使用加载数据填充读取数据时,空列或缺少的列将更新为“”。如果要在列中使用空值,则应在数据文件中使用\n。在某些情况下,也可以使用“空”字。
因此,您需要将空格替换为\n如下所示:
p5fdfcr17#
根据数据库配置,行为会有所不同。在严格模式下,这将抛出错误,否则将发出警告。以下查询可用于标识数据库配置。