采集Node.js日志 - 日志服务

本文介绍如何使用Logtail采集Node.js日志。

背景信息

log4js是一个Node.js日志管理工具，您可以通过log4js把Node.js日志打印到文件中，并自定义日志格式，便于日志采集和整理。

var log4js = require('log4js');
log4js.configure({
  appenders: [
    {   
      type: 'file', //文件输出
      filename: 'logs/access.log', 
      maxLogSize: 1024,
      backups:3,
      category: 'normal' 
    }   
  ]
});
var logger = log4js.getLogger('normal');
logger.setLevel('INFO');
logger.info("this is a info msg");
logger.error("this is a err msg");

通过log4js将日志打印到文件中，输出的日志样例如下所示。log4js分为6个输出级别，从低到高分别为trace、debug、info、warn、error、fatal。

[2016-02-24 17:42:38.946] [INFO] normal - this is a info msg
[2016-02-24 17:42:38.951] [ERROR] normal - this is a err msg

操作步骤

登录日志服务控制台。
在接入数据区域，选择正则-文本日志。
在选择日志空间页签中，选择目标Project和Logstore，单击下一步。
您也可以单击立即创建，重新创建Project和Logstore，详情请参见步骤1：创建Project和Logstore。
在创建机器组页签中，创建机器组。
- 如果您已有可用的机器组，请单击使用现有机器组。
- 如果您还没有可用的机器组，请执行以下操作（以ECS为例）：
  1. 在ECS页签中，选中ECS实例，单击安装。
    如果已在ECS上安装Logtail，请直接单击确认安装完毕。
    说明
    
    如果是Linux系统的ECS实例，单击安装一键式安装Logtail。
    
    如果是Windows系统的ECS实例，需要手动安装Logtail，详情请参见安装Logtail（Windows系统）。
    
    如果是自建集群，需要手动安装Logtail，详情请参见安装Logtail（Linux系统）或安装Logtail（Windows系统）。
  2. 安装完成后，单击确认安装完毕。
  3. 创建机器组，详情请参见创建IP地址机器组或创建用户自定义标识机器组。
在机器组配置页签中，应用机器组。
选择一个机器组，将该机器组从源机器组移动到应用机器组。

在Logtail配置页签中，创建Logtail配置。


参数	说明
配置名称	Logtail配置的名称，设置后不可修改。您也可以单击导入其他配置，导入其他Project中已创建的Logtail配置。
日志路径	指定日志的目录和文件名。日志文件名支持完整文件名和通配符两种模式，文件名规则请参见Wildcard matching。日志文件查找模式为多层目录匹配，即指定目录（包含所有层级的目录）下所有符合条件的文件都会被查找到。例如： /apsara/nuwa/ … /.log表示/apsara/nuwa目录（包含该目录的递归子目录）中后缀名为.log的文件。 /var/logs/app_ … /.log表示/var/logs目录下所有符合app_模式的目录（包含该目录的递归子目录）中包含.log的文件。说明一个文件只能被一个Logtail配置采集。目录通配符只支持星号（）和问号（?）。
设置采集黑名单	开启该功能后，可设置黑名单配置。黑名单配置可在采集时忽略指定的目录或文件，目录和文件名支持完整匹配，也支持通配符模式匹配。例如：选择按目录路径，路径为/tmp/mydir，则在采集时过滤掉该目录下的所有文件。选择按文件路径，路径为/tmp/mydir/file，则在采集时过滤掉该文件。
是否为Docker文件	如果是Docker文件，可以直接配置内部路径与容器Tag，Logtail会自动监测容器创建和销毁，并根据Tag进行过滤采集指定容器的日志。关于容器文本日志采集请参见通过DaemonSet-控制台方式采集Kubernetes文件。
模式	配置为完整正则模式。
单行模式	开启单行模式，即每行为一条日志。
日志样例	输入如下日志样例。 `[2016-01-31 12:02:25.844] [INFO] access - 10.10.10.10 - - "GET /user/projects/ali_sls_log?ignoreError=true HTTP/1.1" 304 - "http:// aliyun.com/" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/10.10.10.10 Safari/537.36"`
提取字段	开启提取字段，通过正则表达式将日志内容提取为Key-Value对。
正则表达式	本示例中，配置为\[([^]]+)]\s\[(\w+)]\s(\w+)\s-\s(\S+)\s-\s-\s"([^"]+)"\s(\d+)[^"]+("[^"]+)"\s"([^"]+).*，在实际场景中，根据以下方式配置正则表达式。自动生成正则表达式在日志样例框中，选中需要提取的字段，单击生成正则，自动生成正则表达式。手动输入正则表达式。单击手动输入正则表达式，手动配置。配置完成后，单击验证即可验证您输入的正则表达式是否可以解析、提取日志样例，详情请参见如何调试正则表达式。
日志抽取内容	通过正则表达式将日志内容提取为Value后，您需要为每个Value设置对应的Key。
使用系统时间	开启提取字段后，需要设置。开启使用系统时间，则日志时间为采集日志时，Logtail所在主机的系统时间。关闭使用系统时间，则需要在日志抽取内容中指定某一个Value为时间字段，并命名为time。选取时间字段后，您可以单击时间转换格式中的自动生成生成解析该时间字段的方式。关于日志时间格式的更多信息请参见时间格式。
丢弃解析失败日志	开启丢弃解析失败日志，解析失败的日志不上传到日志服务。关闭丢弃解析失败日志，日志解析失败时上传原始日志。
最大监控目录深度	设置日志目录被监控的最大深度。最大深度范围：0~1000，0代表只监控本层目录。

请根据您的需求选择高级配置。如没有特殊需求，建议保持默认配置。


参数	详情
启用插件处理	请选择是否启用Logtail处理。开启该功能后，使用Logtail插件处理日志，具体配置请参见处理数据。
上传原始日志	开启该功能后，原始日志内容作为__raw__字段与解析过的日志一起上传到日志服务。
Topic生成方式	空-不生成Topic：默认选项，表示设置Topic为空字符串，在查询日志时不需要输入Topic即可查询。机器组Topic属性：设置为机器组Topic属性，用于明确区分不同服务器产生的日志数据。文件路径正则：设置为文件路径正则，则需要配置自定义正则，用正则表达式从路径里提取一部分内容作为Topic。用于区分不同用户或实例产生的日志数据。
日志文件编码	utf8：指定使用UTF-8编码。 gbk：指定使用GBK编码。
时区属性	设置采集日志时，日志时间的时区属性。机器时区：默认为机器所在时区。自定义时区：手动选择时区。
超时属性	如果一个日志文件在指定时间内没有任何更新，则认为该文件已超时。永不超时：持续监控所有日志文件，永不超时。 30分钟超时：如果日志文件在30分钟内没有更新，则认为已超时，并不再监控该文件。选择30分钟超时时，还需配置最大超时目录深度，范围为1~3。
过滤器配置	只采集完全符合过滤器中的条件的日志。例如：满足条件即采集：配置Key:level Regex:WARNING\|ERROR，表示只采集level为WARNING或ERROR类型的日志。过滤不符合条件的数据：配置为Key:level Regex:^(?!.(INFO\|DEBUG)).，表示不收集level为INFO或DEBUG类型的日志。配置为Key:url Regex:.^(?!.(healthcheck)).*，表示不采集URL中带有healthcheck的日志，例如key为url，value为/inner/healthcheck/jiankong.htm?userCode=wrvvs1rm&zuntopl的日志将不会被采集。更多示例请参见regex-exclude-word、regex-exclude-pattern。

Logtail配置完成后，日志服务开始采集Node.js日志。

在查询分析配置页签中，设置索引。
默认已设置索引，您也可以根据业务需求，重新设置索引，具体请参见开启并配置索引。
说明
- 全文索引和字段索引属性必须至少启用一种。同时启用时，以字段索引属性为准。
- 索引类型为long、double时，大小写敏感和分词符属性无效。

采集Node.js日志 - 日志服务

背景信息

操作步骤

推荐图文

适用于数据项目的7种强大的开源工具

一键重置密码后无法使用新密码登录弹性云服务器_弹

价值88万元！迪拜航空公司试图仲裁夺取域名DAE.COM

你会喜欢的新数组方法:array.at(index)

使用开源智能的5个好处

NAT服务器对外联机的情况

随机推荐

将Dubbo应用平滑迁移至SAE - Serverless

轻量应用服务器搭建 Ubuntu 可视化界面

UntagResources - 运维编排服务

星环科技TDS 为数据全生命周期管理提供一

查看已归档事件_云审计服务 CTS_快速入门

阿里云CodePipeline CD - 弹性容器实例

CCE集群中的节点无法远程登录，如何排查

如何重置云堡垒机用户登录密码？_云堡垒

聊一聊域名的选择为何要做到与商号“名副

包年包月实例修改带宽 - 云服务器 ECS

关于我们