带有产品源链接的媒体注释的制作方法

2021-11-18 02:37:00 来源：中国专利 TAG：

1.本公开涉及图像分析，并且具体地涉及用提供关于图像内容中显示的对象的信息的源来补充图像内容。

背景技术：

2.许多计算设备包括使用户能够捕获、查看和共享媒体内容的内容共享方面。媒体内容可以是显示对象特征的视频或静止图像。对象可以是媒体内容的焦点的产品(例如，主要产品)，或者可以是背景中的次要产品。观看者可能看到媒体项中的对象并且有兴趣获得关于该对象的更多信息。

技术实现要素：

3.下述呈现本公开的各个方面的简化概述以便提供对这些方面的基本理解。此发明内容不是本公开的广泛概要。它既不旨在标识本公开的关键或决定性元素，也不旨在刻划本公开的特定实施方式的任何范围或权利要求的任何范围。其唯一目的是为了以简化形式呈现本公开的一些构思作为稍后呈现的更详细描述的序言。
4.根据本公开的第一方面，提供一种方法，包括检测图像中的对象、将图像中的对象与源指示符相关联、注释图像以指示对象与源指示符相关联、接收对图像中对象的用户选择、以及基于源指示符和与用户选择相关联的场境数据标识源，其中该源包括关于对象的信息。
5.在本公开的另一方面中，图像包括视频的一个或多个帧，并且对象例如是显示在一个或多个帧中的产品。检测可以涉及检测视频的一个或多个帧中的对象集(例如，产品集)。处理设备可以进一步基于视频的收视数据确定观看者偏好并基于观看者偏好从对象集中选择对象。收视数据可以指示图像的一个或多个当前观看者、未来观看者或过去观看者的偏好。
6.在又一方面，该方法可以通过基于源指示符确定与对象相关联的多个源标识源并且基于与用户选择相关联的场境数据从多个源中选择源。场境数据可以包括例如查看图像的用户的地理位置、用户的源偏好或在用户选择时对象的可用性。处理设备可以进一步以向图像的观看者提供源的源标识符。
7.在又一方面，检测图像中的对象可以包括对图像的图像数据执行数字图像处理并基于数字图像处理识别图像中的对象。然后可以通过更新图像的呈现以强调对象来注释检测到的对象。在一个示例中，更新可以涉及勾勒、突出显示、颜色改变、或者变亮图像的一部分中的至少一种。
8.在又一方面，接收用户对图像中对象的选择可以包括接收用户已经选择包括对象的图像的一部分的指示。
9.根据第二方面，本公开是一种包括处理设备的系统，该处理设备被配置成检测图像中的对象、将图像中的对象与源指示符相关联、对图像进行注释以指示该对象与源指示
符相关联，接收用户对图像中对象的选择，并基于源指示符和与用户选择相关联的场境数据标识源，其中该源包括关于对象的信息。
10.根据第三方面，本公开是一种计算机程序产品，其被配置成使得当被处理设备处理时，计算机程序产品使处理设备检测图像中的对象，使图像中的对象与源指示符相关联，对图像进行注释以指示对象与源指示符相关联，接收用户对图像中的对象的选择，并基于源指示符和与用户选择相关联的场境数据标识源，其中该源包括关于对象的信息。
11.根据本公开的任何方面在上面或者下面关于任何特定实施例定义的特征的个别特征和/或特征的组合可以在任何其他方面或实施方式中个别地、单独地，或与任何其他定义的特征结合使用。此外，本公开旨在覆盖被配置成执行关于方法和/或使用或产生、使用或制造本文中描述的任何装置特征的方法的本文中描述的任何特征的装置。
附图说明
12.在附图的图中以示例而非限制的方式图示本公开。其中：
13.图1图示根据本公开的实施方式的示例系统架构。
14.图2是图示根据本公开的实施方式的具有图像组件和源组件的计算设备的框图。
15.图3是根据本公开的实施方式的显示具有注释对象的图像的示例性用户界面。
16.图4是图示根据本公开的实施方式的用于对图像进行注释以强调对象并将对象与特定信息源相链接的方法的流程图。
17.图5是图示根据本公开的实施方式的示例性计算机系统的框图。
具体实施方式
18.现代计算机系统通常使内容创建者能够手动修改媒体项以改变图像内容并包括关于媒体项中示出的对象(例如，产品)的细节。修改通常需要专门的图像编辑软件，并涉及内容创建者手动编辑图像内容以添加对对象的引用(例如，箭头和文本标签)。创建者所做的图像修改可以是永久性的，并且可以向所有用户显示，即使一些用户可能对图像中的其他对象中的一个更感兴趣。编辑图像内容以添加引用可能是耗时的过程并且可能添加对查看体验来说是突兀的内容。内容创建者可以在媒体项的描述中可替选地添加对对象的引用，但是如果用户没有查看描述的扩展版本，这些引用通常保持(remain)隐藏。此外，添加的引用可能包括特定源的静态网址，诸如如果产品不再可用(例如，发布的新产品、库存不足、地理限制)，零售商可能停止为对象提供信息。
19.本公开的方面通过提供可以增强图像内容以强调特定对象并指示对象的源的技术来解决上述和其他缺陷。即，本公开的方面提供引导式人机交互过程以帮助用户执行技术任务。源可以提供关于对象的创建、使用或销售的附加信息。在一个示例中，该技术可能涉及使用对象识别技术检测图像中的对象。图像可以是静止图像或视频帧，并且已识别的对象可以链接到提供关于对象的更多信息的源(例如，网络服务器)。该技术可以对图像进行注释以向观看者指示对象与能够被用于标识特定源的源指示符相关联。注释可以通过勾勒(outline)、突出显示或对图像进行任何其他类型的修改来强调对象。当观看者选择被强调的对象时，该技术可以基于用户选择的场境数据(contextual data)确定提供给特定观看者的最佳源，所述用户选择的场境数据可以包括时间数据、位置数据或可用性数据(例
如，语言可用性或产品可用性)。当一个或多个图像(例如，视频)包括多个对象集时，该技术可以基于收视(viewership)数据选择已识别的对象的子集。收视数据可以指示过去、当前或未来观看者的偏好，并且可以使技术能够选择观看者更感兴趣的对象。
20.本文描述的系统和方法包括增强图形用户界面以使观看者能够更有效地标识提供关于图像中显示的特定对象的信息的源的技术。特别地，该技术的各个方面可以以更优化的方式向观看者提供对象源的指示。与添加标签和指针相比，更优化的方式可能不那么突兀，并且比在描述或评论字段中包括静态网址列表更显然。该技术的各个方面也可以基于当前或预期的收视自动(无需用户输入)注释和标识源。这可以针对特定观看者或观看者集进行，并且可以在内容创建者已经共享媒体项之后但在观看者已经请求消费媒体项之前、期间或之后执行。例如，该技术可以确定用户已经对特定类型的对象感兴趣并且可以在用户已经请求媒体项之后在媒体项(例如，视频)中注释该类型的对象。
21.以上引用的方法和系统的各个方面在下文中通过示例而非限制的方式详细描述。下面提供的示例在内容共享平台的场境中讨论该技术，该平台可以使最终用户能够上传媒体项和共享媒体项。在其他示例中，该技术可以应用于增强用于向终端用户提供媒体的现有广播机制。下面讨论的媒体项包括图像数据，然而，本公开的教导可以应用于不存在图像的媒体形式(例如，音频、可执行指令、文本)并且可以经由任何形式的人类可感知信号来提供注释。
22.图1图示根据本公开的实施方式的示例系统架构100。系统架构100可以包括内容共享平台110、计算设备120a
‑
z、源130a
‑
z以及网络140。
23.内容共享平台110可以包括一个或多个计算设备(诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等)、数据存储(例如，硬盘、存储器、数据库)、网络、软件组件、硬件组件或其组合，其可以适合于实现这里描述的各种特征。在一些实施方式中，内容共享平台110可以使用户能够编辑上传的媒体项112，该媒体项112可以与一个或多个频道(例如，频道a、频道b
‑
z)或播放列表(未示出)相关联或者是独立的媒体物品。媒体项112可以包括可以作为图像数据114传送(例如，下载或流式传输)到计算设备120a
‑
z的图像。
24.计算设备120a可以从内容共享平台110访问图像数据114并且可以补充图像数据114以注释和嵌入到一个或多个信息源的链接。计算设备120a可以是内容共享平台110的一部分或单独的服务器并且向用作客户端的计算设备120b
‑
z提供注释和源链接服务。在图1中所示的示例中，计算设备120a可以包括图像组件122和源组件124。图像组件122可以被用于分析图像数据114并识别由图像数据114表示的对象。图像数据114可以包括静止图像或视频的一个或者多个帧的数据，并且可以增强以对对象进行注释。源组件124可以使计算设备120a能够用对应于所识别的对象之一的源指示符来补充图像数据114。源指示符可以使计算设备120b
‑
z能够确定提供关于对象的信息的源。可能存在许多可用的源并且源组件124可以使计算设备120a能够提供对于特定观看者来说最佳的源，如下文将更详细地讨论的。
25.源130a
‑
z可以是存储关于所识别的对象中的至少一个的信息的设备。该设备可以包括一个或多个计算设备、存储设备、其他设备或其组合。源可以由计算设备120a
‑
z之一经由外部网络(例如，互联网)远程访问，或者可以由计算设备120a
‑
z之一经由内部网络(例
如，局域网(lan)、企业总线)本地访问。源130a
‑
z可以由操作计算设备120a的同一实体(例如，内容共享实体)操作或可以由不同的实体(例如，第三方)操作。不同的实体可能参与对象的生产、分销、设计、营销、制造、维护、支持或销售。在一个示例中，源130可以是由提供对象并且可以包含对象信息132的实体操作的web服务器。
26.对象信息132可以是描述对象的方面的数据。对象可以是有形或无形的产品并且对象信息132可以包括关于可以呈现给用户的对象的信息。关于对象的信息可以提供关于对象或相关对象的详情，并且可以包括描述性信息(例如，产品摘要、技术规格、型号、版本)、可用性信息(例如，发布日期、零售商、库存、类似产品)、位置信息(例如，对象可用或可以运送到的地区/国家)、价格信息(例如，购买成本、订阅成本、广告商出价)、其他信息或它们的组合。
27.计算设备120b
‑
z可以包括用作客户端并且可以消费由计算设备120a、内容共享平台110或其组合提供的服务的一个或多个计算设备。计算设备120b
‑
z可以被称为“客户端设备”或“用户设备”并且可以包括个人计算机(pc)、膝上型计算机、智能电话、平板计算机、上网本计算机等。计算设备120b
‑
z可以均与可以使用计算设备以访问图像数据114的个人用户(例如，观看者、所有者、操作者)相关联。计算设备120b
‑
z可以均由不同地理位置的不同用户拥有和利用。
28.计算设备120b
‑
z可以包括媒体查看器126b
‑
z，其向观看者提供用户界面以消费和选择图像数据114的部分。媒体查看器可以是使计算设备能够将图像呈现给用户并使用户能够选择图像内的感兴趣区域的任何程序。图像可以被显示为一个或多个视频、网页、文档、书籍、其他媒体或其组合的一部分。媒体查看器可以与一个或多个其他程序集成并且可以访问、检索、呈现和/或导航内容(例如，诸如超文本标记语言(html)页面的网页、数字媒体项等)。媒体查看器可以向正在查看的用户渲染、显示和/或呈现内容。在一个示例中，媒体查看器可以被嵌入在互联网浏览器内并且图像可以被嵌入在网页中(例如，可以提供关于在线商家销售的产品的信息的网页)。在另一示例中，媒体查看器126a可以是允许用户查看媒体项(例如，数字视频、数字照片、电子书等)的独立应用(例如，移动应用)。
29.网络140可以包括公共网络(例如，因特网)、专用网络(例如，局域网(lan)或广域网(wan))、有线网络(例如，以太网)、无线网络(例如，802.11网络或wi
‑
fi网络)、蜂窝网络(例如，长期演进(lte)网络)、路由器、集线器、交换机、服务器计算机和/或它们的组合。
30.图2描绘图示示例性计算设备120的框图，该计算设备120包括用于用图像中的一个或多个对象的源指示符来补充图像的技术。计算设备120可以与图1的计算设备120a
‑
z中的一个或多个相同。在不失一般性的情况下，所图示的组件可以包括更多或更少的组件或模块。例如，可以将两个或更多个组件组合成单个组件，或者可以将组件或模块的特征划分成两个或更多个组件。在一种实施方式中，一个或多个组件可以驻留在不同的计算设备(例如，服务器设备和客户端设备)上。
31.一般而言，在一个实施方式中描述为由计算设备120执行的功能可以在其他实施方式中由多个不同的计算设备120a
‑
z执行。例如，计算设备120可以执行图像组件122的一个或多个功能的程序，并且不同的设备可以执行源组件124的一个或多个功能。通过一起操作的不同或者多个组件可以执行归属于特定组件的功能性。在图2中所示的示例，计算设备120可以包括图像组件122和源组件124。
32.图像组件122可以使计算设备120能够分析图像并识别图像中表示的一个或多个对象。图像可以是描绘对象的视觉感知的人工制品并且可以与静止图像(照片、图片、绘制、渲染、绘画)、视频的一个或多个帧(例如，运动图片)、其他图像或它们的组合相同或相似。图像可以由相机设备捕捉并且是媒体项(例如，网页、视频、可执行文件)的一部分。图像可以经由内容共享平台110、数字存储设备、其他数字传输机制或其组合被共享或传输到计算设备120。计算设备120可以接收多个图像并将它们作为图像数据114存储在数据存储器230中。
33.图像数据114可以包括图像详情和图像内容。图像详情可能包括有关图像的信息，诸如标题、描述、评论、存储位置、文件名、作者、源、文件大小、持续时间、格式、分辨率、图像尺寸、编辑或创建时间、其他详情或其组合。图像的图像内容可以包括表示像素值或对像素值的变化的像素数据并且可以用于渲染图像。图像内容和图像数据两者都可以指示在图像中描绘的对象。
34.图像中的对象可以是人类可以感知的任何对象，并且可以包括有形或无形的产品、商品、服务、其他可交付物或其组合。有形对象可以被人类触摸并且可以包括物理产品、商品、货物或其他对象。无形对象可以在没有被触摸的情况下被人类直接或间接感知，并且可以包括音乐、计算机程序、服务、其他无形元素或其组合。
35.在一个示例中，图像组件122可以包括对象检测模块210、观看者偏好模块212、图像注释模块214和用户选择模块216。对象检测模块210可以分析图像数据以检测在图像中的对象。对象检测模块210可以使用图像详情(例如，标题、描述、评论)、图像内容(例如，像素值)或其组合来确定图像中的对象。在使用图像内容时，对象检测模块210可以对图像的图像内容执行数字图像处理。数字图像处理可以涉及将图像内容分割成一个或多个片段并应用一种或多种对象识别技术(例如，对象分类器)来检测图像的一个或多个片段内的对象。对象检测模块210可以单独地(例如，在特定帧上)或对一系列图像执行，并且可以或可以不考虑跨帧的对象运动。对象检测模块210可以使用或不使用来自用户的输入来标识对象。用户可以在识别对象之前(例如，创建者指示具有对象的区域)或在识别对象之后(例如，从列表中选择对象的子集)提供输入。
36.观看者偏好模块212可以基于与图像相关联的收视来确定一个或多个观看者的偏好。收视可以基于图像或其他类似图像的过去、当前或未来的观看者。过去的观看者可能已经查看了该图像并且可能不再查看该图像，然而当前观看者可能已经开始查看该图像并且可能仍在查看该图像。例如，当图像为视频时，用户可能已经开始观看视频并且还在观看视频。未来的观看者可以是尚未看到图像但可能在未来看到图像的观看者。未来的观看者也可以称为预期观看者或潜在观看者。未来的观看者可以基于观看者的历史行为或一个或多个类似观看者的行为来确定。例如，未来的观看者可能已经消费或订阅了频道或播放列表的内容并且可能没有接收到图像但预计将来接收和消费该图像。图像的收视可以作为收视数据232存储在数据存储230中。
37.收视数据232可以包括关于观看者的数据和关于正在查看的图像内容的数据。该数据可以包括针对特定观看者(例如，当前观看者)或针对多个观看者(例如，听众)的一个或多个测量。在一个示例中，收视数据232可以包括一组观看者的特性、消费数据、其他数据或其组合。该组观看者的特性可以提供关于该组观看者的详情，并且可以包括例如观看者
的位置、语言和/或其他类似信息。消费数据可以特定于观看者或特定于图像内容并且可以包括消费的持续时间、观看者的数量、下降率、重新观看的部分、暂停或放大的部分、其他测量或其组合。
38.观看者偏好模块212可以基于观看者数据232、图像数据114、对象数据、其他数据或其组合来确定一个或多个观看者的偏好。偏好可以指示一个或多个观看者对什么类型的对象感兴趣并且可以用于确定要注释和提供源指示符的对象。在一个示例中，观看者或听众的特性(例如，位置、语言等)和历史媒体消费可用于标识对特定对象或对象类型的偏好。在另一示例中，特定用户对视频的消费可以指示偏好。例如，如果用户重新观看显示对象的一个方面或放大以更好地查看对象的视频的一部分，则观看者偏好模块212可以确定观看者或类似的观看者对该对象感兴趣。这可以被量化和加权并且被用于选择哪些识别的对象应由图像注释模块214在视频的后续部分中或者在该观看者可以消费的另一视频中进行注释。
39.图像注释模块214可以使计算设备120能够对图像进行注释以强调一个或多个检测到的对象。图像注释可以向观看者指示对象与可以经由图形用户界面访问的附加信息相关联。注释图像可以涉及通过改变对象的图像内容、对象周围的图像内容或其组合来更新图像的呈现。图像注释模块214可以向图像添加内容或从图像移除内容以强调对象。在一个示例中，注释图像可以涉及勾勒、突出显示、变亮、变暗、颜色变化、放大或缩小、裁剪或其组合。注释占据的区域可以取决于各个计算设备120b
‑
z的特性，诸如屏幕尺寸，或者用于查看图像的软件的特性，诸如窗口尺寸。注释部分可以包括屏幕坐标，其对应于图像中的对象。在视频的示例中，随着对象在视频回放期间移动，注释部分也可能随着对象移动。
40.图像注释模块214可以利用对象检测模块210和观看者偏好模块212的数据来选择在图像中强调哪些对象。如在上面所讨论的，图像(例如，静止图像或视频)可能包括许多对象，并且这些对象中的一些可能是作为图像焦点的主要对象(例如，正在审查的产品)，而其他对象可能是处于背景或前景中(例如，视频中的其他产品)的辅助对象。当识别出多个对象集时，图像注释模块214可以挑选注释该集合中的所有对象或对象的子集(例如，并非所有已识别的对象)。后者可能是有利的，因为对所有对象进行注释可能是突兀的或分散注意力的，并且可能对查看体验产生不利影响。此外，注释所有对象可能导致处理负担增加。因此，在注释足够数量的对象以提供改进的用户界面和减少与所述注释相关联的处理负担之间可能存在折衷。确定要注释哪些对象可以基于以上讨论的偏好并且可以涉及分析偏好、收视、图像、对象、其他数据或其组合的数据。附加地或可替代地，确定要注释哪些对象可以基于处理能力。例如，图像注释模块214可以确定各个计算设备120b
‑
z的处理能力，并且基于计算设备120b
‑
z的处理能力选择性地注释图像。以这种方式，计算能力更强的计算设备可以比计算能力较低的计算设备接收更多的注释。可以使用计算设备的任何其他特性，诸如屏幕尺寸或分辨率，或者显示图像的媒体播放器的窗口尺寸。例如，较大的窗口尺寸能够比较小的窗口尺寸容纳更多的注释。一些或所有数据(例如，测量)可以被加权并用于生成得分(例如，对象偏好得分)并且可以将对象的得分与阈值进行比较。可以挑选具有满足阈值(高于或低于阈值)的得分的一个或多个对象用于注释和源链接。
41.可以在图像呈现给观看者之前的任何时间挑选和强调对象。例如，图像可以在被相机捕捉之前、期间或之后被注释、由作者编辑、提供给内容分发者(例如，内容共享平台、
广告商、广播者)、由观看者设备请求、传送到查看器设备、由媒体查看器加载、由媒体查看器渲染、由媒体查看器显示、其他时间或其组合。在一个示例中，可以通过修改原始图像的图像内容(例如，像素值)来注释图像。在另一示例中，可以通过将一个或多个层应用于原始图像而不修改原始图像来注释图像。一个或多个层可以对应于一个或多个被注释的对象(例如，一对一或一对多)，并且这些层中的一些或全部可以被发送到观看者的计算设备。在任一示例中，服务器或客户端可以挑选以基于当前观看者使用的硬件和/或软件、或当前观看者的位置和/或当前观看者最感兴趣的对象来提供注释，这可能是已识别的对象的子集。
42.用户选择模块216可以使计算设备120能够检测用户对注释图像中的一个或多个强调对象的选择。用户选择可以由用户(例如，观看者)提供并以用户输入的形式由计算设备120接收。用户输入可以对应于图像的区域并且可以包括手势(例如，触摸或非触摸手势)、鼠标输入、键盘输入、眼睛跟踪、设备移动(例如，摇晃)、其他用户输入或其组合。响应于用户输入，用户选择模块216可以确定用户正在选择的对象并存储场境数据234。在实施方式中，用户选择对应于用户选择包括注释部分的区域。想要关于已被注释的对象的更多信息的用户可以通过例如在被注释的对象的位置处点击鼠标或触摸屏幕来选择对象。在视频的示例中，如上所述，当对象在视频回放期间相对于屏幕移动时，注释部分也可以随着对象移动。因此，所公开主题的实施方式提供了改进的用户界面，其帮助用户执行技术任务。
43.场境数据234可以指示用户选择的场境并且可以基于在用户选择之前、期间或之后的时间捕获的数据。场境数据234可以对应于用户的地理位置、或在用户选择时对象的可用性、用户的源偏好、其他特征或其组合。源组件124可以使用场境数据234来确定观看者的特定源。
44.源组件124可以使计算设备120能够用可以提供关于图像中的对象的附加信息的源来补充图像。可以在用户选择对象之前、期间或之后使用源数据236来标识源。源数据236可以包括源指示符、源标识符、其他数据或其组合。在图2中所示的示例中，源组件124可以包括指示符模块220、源解析模块222和提供模块224。
45.指示符模块220可以将已识别的对象与源指示符相关联。在一个示例中，指示符模块220可以通过将源指示符与图像的特定注释(例如，对象概要x对应于源指示符y)链接来将图像中的对象与源指示符相关联。然后可以将源指示符的数据嵌入图像内、包括在包含图像的媒体项中、或由提供图像或媒体项的服务传送。源指示符的数据可能对观看者隐藏或对观看者可见(例如，描述或评论中的url)。
46.源指示符可以包括可以随后用于标识源的数据。源指示符可以是通用源指示符，其可以指示源存在但可以不指定特定源。源指示符可以包括可以对应于图像中的特定对象的对象标识数据。对象标识数据可以是对应于图像中特定对象的链接、唯一标识符、符号或编码器，并且可以包括数字或非数字数据。对象标识数据可以标识任何水平的特异性的对象，例如，其可以指示对象的类别(例如，电话、饮料、汽车)、类型(例如，智能手机、汽水瓶、麦片盒、汽车)、品牌(例如，cocageneral)、型号(例如，iphone x、coke zero、cheerios、x7)、产品线(例如，x plus、16盎司玻璃瓶、蜂蜜坚果、运动包)、其他水平的特异性，或其组合中的一个或多个。在一个示例中，对象标识数据可以是人类可读的或机器可读的并且可以基于通用资源定位符(url)、通用产品代码(upc)、库存单位(sku)、条形码(快速响应(qr)代码)、全球贸易项目编号(gtin)、国际商品编号
(ean)、车辆标识编号(vin)、国际标准书号(isbn)、其他数据或其组合。在一个示例中，源指示符可以标识特定产品但不能标识该产品的特定源(例如，特定零售商)。在已经检测到用户选择之前、期间或之后，可以通过使用源解析模块222基于源指示符的数据来确定特定源。
47.源解析模块222可以分析与用户选择相关联的源指示符和场境数据以标识特定源。如在上面所讨论的，多个源可以具有所选对象的信息并且源解析模块222可以选择源之一以提供给观看者。解析源指示符可以涉及确定候选源集并选择源的子集(例如，一个或多个)以提供给用户。在一个示例中，源指示符可以包括到提供候选源的内部或外部服务(例如，源聚合器、市场)的链接。源解析模块222可以使用链接、对象标识数据和场境数据来标识候选源集并选择源中的一个。在一个示例中，该候选源集可以包括多个零售商，这些零售商提供关于该源的信息并使观看者能够购买该对象。然后源解析模块222可以使用场境数据234来选择最适合观看者的源。这可能涉及基于以下加权或未加权因素——诸如价格、库存、交货日期、位置、退货政策、零售商偏好、其他信息或其组合——中的一个或多个，来选择源之一。
48.提供模块224可以使计算设备120能够向观看者的计算设备提供源。这可能涉及一个或多个级别的抽象或重定向。在一个示例中，web服务器可以由观看者的计算设备经由通用源指示符访问并且可以返回特定源的源标识符。观看者的计算设备可以使用源标识符(例如，url)访问源以获得并呈现对象信息。在另一示例中，提供模块224可以使用源标识符以从源检索对象信息并且可以将对象信息传送到观看者的计算设备(例如，不直接访问源的观看者设备)。在任一示例中，对象信息可由观看者的计算设备访问并呈现给观看者。
49.数据存储230可以包括存储器(例如，随机存取存储器)、驱动器(例如，硬盘驱动器、固态驱动器)、数据库系统、缓存机制或能够存储数据的其他类型的组件或设备。数据存储230还可以包括可以跨越多个计算设备(例如，多个服务器计算机)的多个存储组件(例如，多个驱动器或多个数据库)。在一些实施方式中，数据存储230可以是基于云的。一个或多个组件可以利用数据存储230来存储公共和私有数据，并且数据存储230可以被配置成为私有数据提供安全存储。
50.在这里讨论的系统收集关于用户(例如，观看者)的个人信息或者可以利用个人信息的情形下，可以给用户提供程序或者特征是否收集用户信息(例如，关于用户的社交网络、社交动作或活动、专业、用户的偏好或用户的当前定位的信息)或者控制是否和/或如何从内容服务器接收可能与用户更相关的内容的机会。此外，某些数据可以在它被存储或者使用之前被以一个或多个方式处理，使得个人可识别的信息被移除。例如，可以处理用户的身份，使得对用户来说不能确定个人可识别的信息，或者可以在获得定位信息的情况下一般化用户的地理定位(诸如到城市、邮政编码或州级别)，使得不能确定用户的特定定位。因此，用户可以控制信息如何关于用户被收集并由内容服务器使用。
51.图3描绘示例性用户界面300，其图示该技术可以如何向观看者呈现图像注释。用户界面可以显示具有一个或多个图像注释314a
‑
c的图像310。图像注释314a
‑
c可以强调图像310内的一个或多个对象，诸如对象312a(例如，智能电话)和对象312b(例如，饮料容器)。图像注释314a
‑
c可以包含在原始图像310内或者可以是显示在图像310之上的一个或多个层。图像注释314a
‑
c可以对应于特定对象312a
‑
b并且可以包括勾勒对象(例如，图像注释
314a)、围绕对象(例如，图像注释314b)、填充对象(例如，图像注释314c)、强调对象的其他注释、或其组合。
52.图4描绘根据本公开的一个或多个方面的用于注释和源链接图像中的一个或多个对象的示例方法400的流程图。方法400及其各个功能、例程、子例程或操作中的每个可以由执行该方法的计算机设备的一个或多个处理器来执行。在某些实施方式中，方法400可以由单个计算设备执行。可替选地，方法400可以由两个或多个计算设备执行，每个计算设备执行该方法的一个或多个单独的功能、例程、子例程或操作。
53.为了说明的简单，本公开的方法被描绘并描述为一系列行为。然而，依照本公开的行为可以各种顺序和/或同时地发生，并且同时不在本文中呈现并描述其它行为。此外，可能不要求所有图示的行为来实现依照所公开的主题的方法。此外，本领域的技术人员应理解和了解的是，能可替选地经由状态图将方法表示为一系列相互状态或事件。附加地，应该了解的是，本说明书中公开的方法能够被存储在制品上以方便将此类方法输送并转移到计算设备。如本文中所使用的术语“制品”旨在包含可从任何计算机可读设备或存储介质访问的计算机程序。在一个实施方式中，方法400可以由图1和2的图像组件122和源组件124执行。
54.方法400可以由服务器设备或客户端设备的处理设备执行并且可以在块402处开始。在块402处，处理设备可以检测图像中的对象。对象可以是产品并且可以显示在用户生成的视频(例如，产品评论)的多个图像(例如，帧)内。在一个示例中，检测对象可以涉及对图像数据执行数字图像处理以识别图像中的对象。在另一示例中，检测对象可以涉及接收标识图像中对应于对象的一个或多个位置或区域的用户输入(例如，内容创建者手势)。图像可以是媒体项的一部分(例如，视频、网页、移动应用、电子书)并且可以是静止图像或视频的一个或多个帧。
55.在一个示例中，视频的帧可以包括多个对象并且处理设备可以注释观看者最感兴趣的对象。这可能涉及处理设备检测该对象集并基于视频的收视数据确定观看者偏好。处理设备可以基于收视数据选择可能感兴趣的一个或多个对象。收视数据可以指示图像或相关图像(例如，来自同一源的不同图像/视频)的一个或多个当前观看者、未来观看者或过去观看者的偏好。
56.在框404处，处理设备可以将图像中的对象与源指示符相关联。源指示符可以是高级源指示符，其可以指示源存在但不能标识特定源。源指示符可以包括可以由服务器设备或客户端设备用来标识特定源的数据。
57.在块406处，处理设备可以注释图像以指示对象与源指示符相关联。注释图像可以涉及更新用户界面中图像的呈现以强调从集合中挑选的一个或多个对象。更新可以涉及概述、亮化、颜色改变或变亮图像的一部分中的至少一种。
58.在框408处，处理设备可以经由用户界面接收对图像中的对象的用户选择。用户选择可以基于标识对象之一的用户输入(例如，手势)。例如，用户可以点击或触摸图像中的对象。响应于用户选择，处理设备可以捕获场境数据，该场境数据包括查看图像的用户的地理位置、用户的源偏好、用户选择时对象的可用性、其他数据或它们的组合。
59.在块410，处理设备可以基于源指示符和与用户选择相关联的场境数据来标识源。源可以包括关于对象的信息并且可以将信息提供给计算设备以在用户界面中呈现给图像
的观看者。在一个示例中，标识源可以涉及基于源指示符确定与对象相关联的源集。处理设备可以进一步基于与用户选择相关联的场境数据从该集合中选择一个或多个源。处理设备还可以提供所选择的一个或多个源的源标识符以在用户界面中呈现给图像的观看者。响应于完成以上参考框410描述的操作，该方法可以终止。
60.图5图示计算机系统500的示例性形式的机器的图解表示，在该计算机系统500中可以执行指令集，其用于使机器执行这里讨论的任何一个或多个方法学。在替选实施方式中，机器可以连接(例如，联网)到lan、内联网、外联网或因特网中的其它机器。机器可以在客户端
‑
服务器网络环境中以服务器或客户端机器的能力操作，或者在对等(或分布式)网络环境中作为对等机器操作。机器可以是个人计算机(pc)、平板pc、机顶盒(stb)、个人数字助理(pda)、蜂窝电话、web电器、服务器、网络路由器、交换机或桥接器，或能够执行指定要由该机器采取的动作的指令集(顺序或其它)的任何机器。另外，虽然仅图示了单个机器，但是术语“机器”还应被视为包括单独地或者联合地执行指令集合以执行本文中讨论的方法学中的任何一种或多种的机器的任何合集。计算机系统500的一些或所有组件可以由计算设备120a
‑
z中的一个或多个计算设备使用或者是说明性的。
61.示例性计算机系统500包括经由总线508彼此通信的处理设备(处理器)502、主存储器504(例如，只读存储器(rom)、闪速存储器、诸如同步dram(sdram)或ram总线dram(rdram)等)、静态存储器506(例如，闪速存储器、静态随机存取存储器(sram)等)和数据存储设备518。
62.处理器502表示诸如微处理器、中央处理单元等的一个或多个通用处理设备。更特别地，处理器502可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、甚长指令字(vliw)微处理器或实现其它指令集的处理器或实现指令集的组合的处理器。处理器502还可以是诸如专用集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)、网络处理器等的一个或多个专用处理设备。处理器502被配置成执行用于执行本文中讨论的操作和步骤的指令526。
63.计算机系统500还可以包括网络接口设备522。计算机系统500还可以包括视频显示单元510(例如，液晶显示器(lcd)、阴极射线管(crt)、或触摸屏)、字母数字输入设备512(例如，键盘)、光标控制设备514(例如，鼠标)和信号生成设备520(例如，扬声器)。
64.数据存储设备518可以包括在上面存储有具体实现本文中描述的方法学或功能中的任何一种或多种的一个或多个指令集526(例如，软件)的计算机可读存储介质524。指令526还可以在其由计算机系统500执行期间完全地或至少部分地驻留在主存储器504内和/或在处理器502内，主存储器504和处理器502还构成计算机可读存储介质。指令526可以进一步经由网络接口设备522在网络574(例如，网络140)上传送或接收。
65.在一个实施方式中，指令526包括用于一个或多个源组件124的指令，其可以对应于关于图1和图2描述的同名对应物。虽然计算机可读存储介质524在示例实施方式中被示为单个介质，但是术语“计算机可读存储介质”或者“机器可读存储介质”应该被视为包括存储一个或多个指令集的单个介质或多个介质(例如，集中式或分布式数据库，和/或相关高速缓存和服务器)。术语“计算机可读存储介质”或“机器可读存储介质”还应被视为包括能够存储指令集或者对其进行编码或者携带指令集以供由机器执行并且使机器执行本公开的方法学中的任何一种或多种的任何介质。术语“计算机可读存储介质”应相应地被视为包
括但不限于固态存储器、光学介质和磁介质。
66.在前面的描述中，阐述了许多详情。然而，对于受益于本公开的本领域普通技术人员而言，将会显而易见的是，可以在没有这些具体详情的情况下实践本公开。在一些情况下，众所周知的结构和设备以框图形式而不是详情示出，以避免混淆本公开。
67.已在对计算机存储器内的数据比特的操作的算法和符号表示方面呈现了详细描述的一些部分。这些算法描述和表示是由数据处理领域的技术人员使用来将其工作的实质最有效地传达给本领域的其它技术人员的装置。算法在这里且一般地被认为是导致期望结果的步骤的自洽序列。步骤是要求物理操纵物理量的操作。通常，尽管不一定，然而这些量采取能够被存储、传输、组合、比较并以其它方式操纵的电信号或磁信号的形式。有时主要由于通用的原因，已证明将这些信号称为比特、值、元素、符号、字符、术语、数字等是方便的。
68.然而，应该记住的是，所有这些和类似的术语都将与适当的物理量相关联并且仅仅是应用于这些量的方便标签。除非像从下面的讨论中显而易见的那样另外具体地陈述，否则应了解的是在整个说明书中，利用诸如“接收”、“传送”、“生成”、“引起”、“添加”、“减去”、“插入”、“包括”、“移除”、“提取”、“分析”、“确定”、“使能”、“标识”、“修改”等的术语的讨论指代计算机系统或类似的电子计算设备的动作和过程，所述计算机系统或类似的电子计算设备将表示为计算机系统的寄存器和存储器内的物理(例如，电子)量的数据操纵并变换成类似地表示为计算机系统存储器或寄存器或其它此类信息存储、传输或者显示设备内的物理量的其它数据。
69.本公开还涉及用于执行本文操作的装置、设备或者系统。此装置、设备或者系统可以是为所要求的目的而专门地构造的，或者其可以包括通过存储在计算机中的计算机程序选择性地激活或者重新配置的通用计算机。这种计算机程序可以被存储在计算机或者机器可读存储介质中，所述计算机或者机器可读存储介质诸如但不限于包括软盘、光盘只读存储器(cd
‑
rom)、和磁光盘的任何类型的盘、只读存储器(rom)、随机存取存储器(ram)、eprom、eeprom、磁或光学卡，或适合于存储电子指令的任何类型的介质。
70.词语“示例”或“示例性”在本文中用于意指充当示例、实例或说明。本文描述为“示例”或“示例性”的任何方面或设计未必解释为比其它方面或设计优选或有利。相反，使用词语“示例”或“示例性”旨在以具体方式呈现概念。如本技术中使用的，术语“或”旨在意指包括性“或”，而不是排他性“或”。也就是说，除非另外指定或从上下文中清楚可知，否则“x包括a或b”旨在表示任何自然的包括性置换。也就是说，如果x包括a；x包括b；或x包括a和b两者，则“x包括a或b”满足任何前述情况。另外，本技术和所附权利要求书中使用的冠词“一”和“一个”一般应解释为表示“一个或多个”，除非另外指定或从上下文清楚地指示为单数形式。贯穿本说明书对“实施方式”或“一个实施方式”的引用意指结合该实施方式描述的特定特征、结构或特性被包括在至少一个实施方式中。因此，在本说明书的各个地方出现的短语“实施方式”或“一个实施方式”不一定都指代相同的实施方式。此外，应注意，参考附图的某些元素所使用的“a
‑
z”符号并不旨在限制特定数量的元素。因此，“a
‑
z”将被解释为在特定实施方式中存在一个或多个元素。
71.应当理解的是，以上描述旨在为说明性的，而不是限制性的。在阅读和理解以上描述后，许多其它实施例对于本领域的技术人员而言将是显而易见的。因此，能够参考所附权
利要求以及此类权利要求所赋予的等同物的完全范围来确定本公开的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种车载环视系统中的亮度均衡方法及系统与流程

带有产品源链接的媒体注释的制作方法

相关文献

最热文献