热点:
    编辑

    携程宕机原因水落石出:内部员工误操作

      [  中关村在线 原创  ]   作者:  |  责编:魏景芳
    收藏文章 暂无评论

        北京时间5月29日消息,携程宕机十多个小时后,终于在5月28日23时左右,除个别业务外,携程官方网站及APP恢复正常。事后,携程经过排查发布声明,称数据没有丢失,此事件因员工误操作所致。

    携程宕机原因水落石出:内部员工误操作
    携程宕机原因水落石出(图片来自腾讯)

        今天凌晨1:30分,携程经过技术排查后确认,此次事件是由于员工错误操作导致。对于恢复时间较长的原因,则是由于涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行,花了较长时间。

        携程最后还保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,并表示携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。

        目前,携程官方网站及APP已于28日23:29全面恢复正常。而在5月28日11时左右,点击进入携程网,页面显示404报错,虽然点击“返回首页”后依然可以进入携程网,但其功能和其它链接均无法使用。

    以下为携程对相关问题的说明

    1、事件发生原因

      经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。

    2、为什么恢复时间那么长

        一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。

      发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。

      这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。

      携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。

    3、如何杜绝此类事件的再次发生?

      携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。

    news.zol.com.cn true //news.zol.com.cn/523/5233256.html report 1695 北京时间5月29日消息,携程宕机十多个小时后,终于在5月28日23时左右,除个别业务外,携程官方网站及APP恢复正常。事后,携程经过排查发布声明,称数据没有丢失,此事件因员工误操作所致。携程宕机原因水落石出(图片来自腾讯)今天凌晨1:30分,携程经过技术排查后确认...
    不喜欢(0) 点个赞(0)

    新闻中心文章推荐