买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:日本电信电话株式会社
摘要:提供优化用于对对象空间内的环境进行控制的行动的可靠性高的技术。一种行动优化装置,对用于控制环境的行动进行优化,其取得与环境的状态相关的环境数据,对于取得的环境数据进行时空间插补,基于被进行了时空间插补后的环境数据,使环境再现模型进行学习以在输入了环境的状态和用于控制该环境的行动时输出行动后的环境的状态的正确值,此外,使搜索模型进行学习以在输入了从环境再现模型输出的环境的状态时输出接着应该采取的行动,使用这些学习完毕的环境再现模型以及搜索模型,预测与第一环境的状态以及第一行动对应的第二环境的状态,搜索对于第二环境的状态应该采取的第二行动,并输出搜索的结果。
主权项:1.一种行动优化装置,具备处理器以及与该处理器连接的存储器,所述行动优化装置优化用于对对象空间内的空调进行控制的行动,所述行动优化装置具备:环境数据取得单元,取得与所述对象空间内的环境的状态相关的包含人流、温度、湿度的环境数据,将所取得的所述环境数据存储在环境数据存储单元中,环境数据插补单元,对于所取得的所述环境数据依照预先设定的算法进行时空间插补,环境再现模型学习单元,基于被进行了所述时空间插补后的环境数据,使环境再现模型进行学习以在输入了环境的状态s1和用于控制该环境的行动a1时输出所述行动a1后的环境的状态s1’的正确值,搜索模型学习单元,使搜索模型进行学习以在输入了环境的状态s2时输出接着应该采取的行动a2,行动搜索单元,使用所述学习完毕的搜索模型,搜索对于第一环境的状态应该采取的第一行动,环境再现单元,使用所述学习完毕的环境再现模型,预测与第一环境的状态以及第一行动对应的第二环境的状态,以及输出单元,输出所述搜索的结果,所述环境再现单元进一步构成为,将所述第一环境的状态、所述第二环境的状态及所述将第一行动输入到规定的报酬函数,输出报酬的值,所述搜索模型学习单元通过执行以下步骤来进行所述搜索模型的学习:将环境的状态s3输入到所述搜索模型中,取得下一个应该采取的行动a3的第一步骤;从所述环境再现单元取得所述环境状态s3的下一状态s3’、以及通过所述环境的状态s3、所述下一状态s3’、所述行动a3而计算出的报酬r的第二步骤;以及使用所述环境状态s3、所述下一状态s3’、所述报酬r及所述行动a3更新所述搜索模型参数的第三步骤。
全文数据:
权利要求:
百度查询: 日本电信电话株式会社 行动优化装置、方法以及记录介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。