在我们的职业生涯中,每个人都要经历一个重要的阶段,那就是初入职场。对于大多数人来说,刚进入职场的时候可能面临着文职工作的挑战,而其中一项重要的环节就是面试。在面试过程中,我们常常会面对各种各样的问题,下面就让我们来看看一些常见的初入职场文职工作面试题。
这是一个常见的文职工作面试问题。回答这个问题时,应该突出自己与职位的匹配度,可以结合个人经验、技能和职业目标来说。强调自己对这个职位的热情和兴趣,展现出自己是一个理想的候选人。
在回答这个问题时,应该列举出过去的工作经历,注重强调与文职工作相关的经验,包括管理能力、协调能力等。通过具体的事例来展示自己的能力及工作态度,让面试官对你的实力有更清晰的了解。
文职工作的核心技能包括但不限于良好的沟通能力、组织能力、细心认真的工作态度以及良好的时间管理能力。通过具体的例子来说明自己在这些方面的优势,展示自己适应这份工作的能力。
回答这个问题时,可以从沟通协调、团队合作、问题解决能力等方面入手,强调自己在困难面前的坚持不懈和积极解决问题的态度。最好结合具体案例来说明自己的解决问题的能力。
团队合作在文职工作中是非常重要的,面试官可能会问及这个问题。在回答时,可以强调团队合作的重要性,展示自己具备良好的合作精神和团队意识,能够积极融入团队,共同完成工作目标。
在面试中,表达自己对未来的规划是很重要的。可以谈论个人的职业目标和发展方向,展现出自己有远大的抱负和规划,让面试官看到你对未来的规划和期待。
在准备面试时,一定要了解公司的基本情况,包括公司的发展历程、主营业务、文化价值观等。回答这个问题时,可以结合自己的了解,表达对公司的认同和期待,展现出自己对公司的重视和投入度。
在回答这个问题时,可以根据自己的实际情况,选择最适合的优点进行展示。可以是工作态度认真、学习能力强、适应能力强等方面,通过具体的事例来说明自己的优点,让面试官对你的优势有更清晰的认识。
职场中总会遇到各种挑战,回答这个问题时可以结合自己的经历,讲述自己曾经面对的挑战以及如何克服的过程。突出自己的应变能力和解决问题的能力,展示出自己在职场中的成熟和经验。
工作态度在职场中非常重要,面试官可能会问及这个问题。可以强调自己对工作的热情和认真态度,展示出自己是一个有责任心且敬业的员工,愿意为公司的发展和团队的合作付出努力。
面试是一个相互了解的过程,希望以上初入职场文职工作面试题可以帮助到大家更好地准备面试,展现出自己最好的一面。祝大家能在面试中脱颖而出,成功开启自己的职场生涯!
大家好,欢迎来到我的博客!今天我要和大家分享的是一道美味的羊肉料理——山姆羊腿。作为一种备受推崇的美食,山姆羊腿不仅具有独特的口感,还有丰富的营养价值。无论是家庭聚餐还是节日庆典,山姆羊腿都是一道备受追捧的佳肴。
山姆羊腿作为一道传统美食,拥有悠久的历史。据说这道菜肴起源于中世纪的苏格兰,然后逐渐传播到世界各地。山姆羊腿通常选用优质的羊肉,经过精心烹饪和调味,呈现出肉质鲜嫩、口感丰富的美食佳肴。
制作一道美味的山姆羊腿需要一些耐心和技巧。首先,我们需要准备好新鲜的羊肉。选择一块肉质鲜嫩、脂肪适中的羊腿肉,这样能够保证烹饪后的口感更加美味。接下来,去除多余的脂肪,并用一些香料对羊腿进行腌制,增添风味。
接下来,我们需要将羊腿置于预热的烤箱中,用中火烤制。在烘烤的过程中,我们可以不断地给羊腿刷上一些特制的调味酱,这样能够增强羊肉的香味和口感。待烤制时间达到时,我们取出羊腿,用刀将其切成薄片,摆盘装饰即可。这样一道美味的山姆羊腿就做好了!
山姆羊腿不仅味道鲜美,而且还有丰富的营养价值。首先,羊肉富含蛋白质,对于人体生长发育和维持健康非常重要。其次,山姆羊腿含有丰富的维生素B群和矿物质,如铁、锌等。这些营养物质对于增强免疫力、促进新陈代谢非常有益。
此外,山姆羊腿中的脂肪含量相对较低,相比其他肉类更为健康。当然,对于减肥者来说,适量食用山姆羊腿也是一种不错的选择。羊肉富含的不饱和脂肪酸有助于调节胆固醇水平,并提供身体所需的能量。
山姆羊腿在美食文化中扮演着重要的角色。它不仅是传统节日的标志性食物,还是家庭聚会的必备菜肴。许多地方甚至都设立了专门的羊肉节,以庆祝山姆羊腿的美味。
无论是欢庆节日还是展示地方特色,山姆羊腿都是一道令人垂涎欲滴的佳肴。它的独特风味和精美外观让人们对这道菜肴流连忘返。
通过对山姆羊腿的探索,我们可以发现这道菜肴的悠久历史和丰富营养。它不仅是一道令人垂涎的美食,也承载着人们对于美好生活的向往。
如果您还没有尝试过山姆羊腿,我强烈推荐您去品尝一下。无论是在家中烹饪还是在餐厅品尝,山姆羊腿都会给您带来愉悦的味蕾体验。
感谢大家阅读我的博客,希望能够给您带来一些关于山姆羊腿的有趣信息。如果对这道美食感兴趣,欢迎关注我的博客,我会不定期更新更多精彩美食文章。
大家好,欢迎来到我的博客。今天我要为大家介绍的是一道美味的烤羊排菜品,这让我想起了我朋友山姆曾经为我准备的绝妙佳肴。
大家都知道山姆是个顶级厨师,他对食材的挑选非常讲究。他为烤羊排选择的是新鲜嫩羊肉,确保肉质鲜美。在准备前,山姆先用一些调料腌制羊排,以保持其鲜嫩多汁。他使用新鲜大蒜和香草搭配橄榄油制作的腌料,从而为羊肉增添了丰富的香气。
首先,山姆会将羊排平均切割成适当大小的块。然后,他将块状羊排放入浸没在腌料中的容器中,确保每一块肉都能充分腌制。腌制时间一般为2-4个小时,这能够让肉质更加入味。
接下来,山姆会预热烤箱至400华氏度(200摄氏度)。他将腌制后的羊排块放在烤盘上,并在上方均匀洒上一些海盐和黑胡椒粉。然后,烤盘放入预热的烤箱中,烤制时间大约为20分钟,直到表面变得金黄酥脆。
等到羊排烤制完成后,山姆会将它们取出并轻轻盖上锡纸,静置片刻。这样可以保持肉质的嫩滑和内部的汁液。最后,他会将烤羊排装盘,并撒上一些新鲜的香草叶作为装饰。
现在,山姆烤羊排终于准备好了!这道菜色香味俱佳,肉质嫩滑多汁。当你咬下一口时,肉汁会在口腔中释放出一种丰富的香味,让你陶醉其中。
为了达到最佳食用效果,山姆建议搭配一些新鲜的蔬菜沙拉和一杯红酒。蔬菜沙拉的清爽可以平衡羊肉的油腻感,而红酒的醇香则能与烤羊排的口感相得益彰。
总之,山姆的烤羊排是一道不容错过的美食。无论是在家庭聚餐、朋友聚会还是特殊的场合,这道菜肴都能让你赢得夸赞和赞叹之声。试试这个秘方,你也能成为美食大师!
希望大家能够喜欢这篇博文,并成功制作出美味的山姆烤羊排。如果你有任何疑问或想法,欢迎在评论区留言,我会尽快回复。感谢大家的阅读,下次再见!
谢谢大家阅读这篇博客!希望你喜欢上了这道美味的山姆烤羊排。无论是为了一顿家庭晚餐,与朋友共度美好时光,还是犒劳自己,这道菜都将成为你的首选。 再次感谢大家的阅读,如果你对这道山姆烤羊排有任何疑问或想法,请在评论区留言,我会尽快回复。下次再见!大家好,今天我要向大家介绍的是一款美味可口的面包——山姆羊角面包。这款面包外形像羊角般优美,内馅饱满可口,深受广大食客的喜爱。
羊角面包起源于奥地利,这种面包的形状酷似山羊的弯曲角。它最早是由一位名叫山姆的面包师傅发明的,因此得名山姆羊角面包。起初,山姆只是将面团放在锅里烘烤,但效果并不如人意。
后来,山姆灵机一动,将面团卷成三角形再进行烤制,结果面包外形独特,风味更为出众。之后,他将这款面包引入了奥地利的面包店,并很快在当地取得了巨大的成功。
羊角面包以其独特的形状和口感成为了人们心目中的美味之选。它的外皮金黄酥脆,内部绵软松散。面包馅料丰富多样,可以根据个人喜好选择不同的口味。
山姆羊角面包的制作工艺独特,需要经过反复发酵、压榨和烘烤等多个步骤。这些步骤将面团质地变得轻盈蓬松,且口感更佳,更易消化。
无论是早餐还是下午茶,山姆羊角面包都能成为美食家的最爱。搭配一杯热咖啡或香槟,更能提升美食的享受。
下面我将向大家介绍制作山姆羊角面包的步骤:
山姆羊角面包不仅美味可口,而且富含多种营养。它提供了丰富的碳水化合物和蛋白质,是一种理想的能量来源。
此外,山姆羊角面包还富含维生素B和一些重要的矿物质,如铁、锌和镁。这些营养物质对于维持身体健康和提供充足的能量至关重要。
山姆羊角面包不仅外形别致,口感丰富,而且营养丰富,是一款家庭早餐或下午茶的不二选择。制作过程虽然稍显繁琐,但只要掌握了技巧,就能做出美味的山姆羊角面包。
无论您是爱好烘焙的新手还是经验丰富的大厨,我都推荐您尝试制作山姆羊角面包。相信您一定会爱上它香气四溢的口感和美妙的味道。
希望今天的分享能带给您些许的惊喜和灵感,谢谢您的阅读!
谢谢大家!在当今社交媒体和数字技术的时代,写作已经变得越来越重要。对于博客作者来说,拥有出色的写作技巧是吸引读者和保持他们的注意力的关键。无论是撰写文章还是博客,优秀的写作都可以让你在竞争激烈的互联网世界中脱颖而出。
在写作领域,有一个人是备受推崇的传奇人物,他就是山姆。山姆擅长各种类型的写作,无论是新闻报道、散文、小说还是博客文章,他都能游刃有余地处理。他的文字流畅而有力,总能准确地表达出他想要传达的意思。
山姆具备许多出色的写作技巧,其中最引人注目的是他的叙事能力。他善于把无聊的主题转化为引人入胜的故事,吸引读者的注意力并且让他们产生共鸣。无论是叙述一个人物的经历,还是描述一个场景的细节,山姆总能以他独特的方式将其生动地呈现在读者的脑海中。
另外一个山姆的强项是他的研究能力。无论是撰写一篇关于科技的文章,还是对历史事件进行评论,他总是可以通过深入的研究和广泛的阅读获得可靠的信息。这种对事实和细节的关注使他的写作更加可信,也使他的观点更有说服力。
除了叙事和研究能力之外,山姆还注重于语言的运用。他善于使用恰当的词汇和表达方式来增强文章的效果。他能够轻松地调整自己的语气和风格,以适应不同的读者群体。无论是写给专业人士还是普通读者,山姆都能找到最合适的语言来与他们进行沟通。
与山姆不同,寿喜是一位年轻的博客作者,但他已经取得了令人瞩目的成就。寿喜擅长利用数字技术来创新博客写作。他善于运用视觉效果,通过图像、视频和音频等多媒体元素来丰富他的博客文章。
寿喜深知人们在信息爆炸的时代中的注意力短暂和受限。因此,他采用了一种独特的写作风格,通过短小精悍的段落和醒目的标题来引导读者的阅读。他还利用了互动式内容,例如投票和评论,以促进读者参与和社交互动。
寿喜具备出色的信息搜集和整理能力。他擅长找出当前热门话题,并通过个人见解和深入分析来吸引读者的兴趣。他的博客文章引人入胜,往往能够引起读者的思考,并在他们之间引发有意义的讨论。
寿喜还致力于与读者建立真实而深入的连接。他经常与读者进行互动,并根据他们的反馈来提供更好的内容。他的博客成为了一个社区,吸引了大量的读者和忠实的粉丝。
虽然山姆和寿喜在写作领域有着不同的优势,但他们都是博客写作领域的佼佼者。他们的写作风格和技巧使他们在不同的读者群体中都赢得了广泛的赞誉。
山姆以他的叙事能力和研究能力闻名于世。他的文章引人入胜,富有深度和洞察力。他通过他的文字让读者获得更多的知识,并引导他们思考更深层次的问题。
寿喜则以他的创新性和互动性著称。他的博客文章不仅仅是文字,它们是一个完整的多媒体体验。读者可以通过不同的方式与他互动,从而与他建立更紧密的联系。
山姆和寿喜的优势互补,他们可以互相学习和借鉴对方的写作技巧。山姆可以从寿喜那里学习如何利用数字技术来创新写作,而寿喜可以从山姆那里学习如何运用叙事和研究来提高自己的写作水平。
在博客写作领域,山姆和寿喜都是值得敬佩和学习的榜样。无论是通过叙事和研究能力,还是通过创新和互动性,他们的博客文章都能够与读者产生强烈的共鸣。当代的博客写作需要不断进步和创新,而山姆和寿喜正是推动这个行业发展的领军人物。
在糖果爱好者中,巧克力蛋糕可谓是一种美味的代表。它浓郁的巧克力香气和柔软的口感总能让人食指大动。今天,我为大家带来的是一款特别的巧克力蛋糕——山姆巧克力蛋糕。
山姆巧克力蛋糕是一种结合了传统巧克力蛋糕和山姆糖的美味糕点。它的外观酷似一块巧克力方块,让人看到就有食欲。而在口感上,它充满了浓厚的巧克力味道,搭配上山姆糖的甜蜜,让人回味无穷。
制作山姆巧克力蛋糕并不复杂,下面我为大家介绍一下制作步骤:
山姆巧克力蛋糕的味道非常独特。它融合了巧克力的苦甜和山姆糖的香甜,口感丰富而柔软。咬下一口,细腻的巧克力蛋糕搭配上山姆糖的口感,让人感受到了甜蜜和幸福。
山姆巧克力蛋糕起源于美国,是美国一家名为山姆的糕点店首创的。这家糕点店以制作各种美味的糕点而闻名,而山姆巧克力蛋糕则成为了他们最受欢迎的招牌之一。
最初,山姆巧克力蛋糕只在当地小有名气,但随着社交媒体的发展,它逐渐走红,成为全美范围内的网红美食。如今,不论是生日、婚庆还是其他庆典,山姆巧克力蛋糕都成为人们最喜爱的糕点之一。
山姆巧克力蛋糕虽然美味,但我们也要注意它的营养价值。下面是山姆巧克力蛋糕的主要营养成分:
山姆巧克力蛋糕可以单独享用,也可以搭配其他食物一同享用。以下是几种搭配建议:
山姆巧克力蛋糕以其独特的外观和美味的味道成为了广受欢迎的甜点。制作山姆巧克力蛋糕虽然简单,但它给人带来的满足感却是无法言喻的。下次你想要品尝美味的巧克力蛋糕时,不妨试试山姆巧克力蛋糕,相信你一定会爱上它。
尊敬的读者们,大家好!我是来自山姆科技编程的博主。今天我将为大家探讨关于编程的一些重要话题。
编程是一种创造性的技能,通过编写指令和算法来控制计算机完成特定任务。它是现代科技的基石,涵盖了各行各业的应用领域。无论你是从事软件开发、数据分析、人工智能还是网站设计,编程都是必备的技能。
随着科技的迅速发展,世界越来越数字化。编程的重要性也日益凸显。它不仅仅是满足市场需求的基础技能,还是培养逻辑思维和解决问题能力的强大工具。
编程有助于培养创造力和创新能力。它激发人们开发新的应用、改进现有系统的动力,并促进技术的进步。通过编程,我们可以实现自己的想法,创造出对社会有意义的产品和服务。
此外,学习编程还可以提高逻辑思维能力。编程需要准确严谨的问题分析和解决思路,培养了我们批判性思维和逻辑推理的能力。这种思维模式在日常生活和职业发展中都非常重要。
学习编程并不是一件易事,但也不是不可能。以下是一些学习编程的有效方法:
编程是一个职业发展前景广阔的领域。无论是在科技巨头公司,还是初创企业,编程技能都具有巨大的市场需求。
软件开发工程师、数据分析师、网络安全专家等职业都是与编程密切相关的职位。随着人工智能、云计算、物联网等新兴技术的发展,编程领域将提供更多就业机会和创业空间。
此外,编程技能也是跨行业的竞争力。在金融、医疗、教育等领域,人们需要能够处理大量数据和开发智能应用的人才。掌握编程技能,可以让你从竞争中脱颖而出,拥有更多职业选择。
编程是当今科技发展的重要组成部分,学习编程是与时俱进的必然要求。它不仅能解决现实问题,还为我们创造了无限的可能性。
希望通过本文的分享,能让更多人了解编程的重要性和学习方法。如果你对编程领域感兴趣,不要犹豫,现在就开始学习吧!相信通过不断努力和实践,你一定可以掌握编程技能,开启令人激动的职业之旅。
感谢各位读者的关注和支持!祝愿大家在编程的道路上取得巨大的成功!
咖啡和甜品是许多人心目中的完美组合。无论是早晨的一杯浓郁咖啡,还是下午茶时的一块精致甜品,都能让我们感受到美好的味觉享受。而在各种咖啡店中,山姆咖啡甜品以其独特的风味和高品质的原材料,成为了许多咖啡和甜品爱好者的首选。
山姆咖啡甜品以其多样化的咖啡品种和口味丰富的甜品而闻名。无论你是喜欢浓郁的黑咖啡,还是追求细腻口感的拿铁咖啡,山姆咖啡甜品都能满足你的需求。其采用的是来自全球各地的优质咖啡豆,确保每一杯咖啡都能给人带来独特的味道体验。
山姆咖啡甜品一直以来都致力于提供高品质的咖啡。从选择咖啡豆的源头到独特的烘焙工艺,山姆咖啡甜品始终坚持以客户需求为导向,不断追求咖啡的极致品质。
这里的咖啡豆均来自于全球各地的精选产地,如巴西、哥伦比亚、埃塞俄比亚等。这些地区的土壤和气候条件赋予了咖啡豆独特的风味和口感,而山姆咖啡甜品精心挑选的咖啡豆将这种风味完美地展现在你的味蕾中。
此外,山姆咖啡甜品特有的烘焙工艺让咖啡豆散发出更浓郁的香气和口感。无论是中度烘焙还是深度烘焙,都能让咖啡豆的风味得到最佳的发挥。而烘焙师的技艺和经验也是保证每一杯咖啡都能达到顶尖水平的关键所在。
在山姆咖啡甜品中,甜品是与咖啡相得益彰的重要组成部分。无论是经典的法式奶油泡芙,还是创意的抹茶千层蛋糕,每一款甜品都是由经验丰富的糕点师傅精心制作而成。
这里的甜品追求的是细腻的口感和独特的味道。新鲜的水果、优质的巧克力以及纯正的奶油等原材料被巧妙地融合在一起,创造出令人惊叹的口感体验。山姆咖啡甜品还注重甜品的外形和色彩,使每一道甜品都成为一件艺术品。
无论你是喜欢巧克力口味,还是偏爱清爽的水果口味,山姆咖啡甜品都能满足你的口味偏好。而且每一个甜品都经过精心挑选和制作,确保其原材料的品质和口感的完美呈现。
无论你是一个咖啡和甜品的狂热爱好者,还是只是想要在闲暇时光里享受一杯美味的咖啡和甜品,山姆咖啡甜品都是一个理想的选择。
在这里,你可以找到一个舒适宜人的环境,让你感受到轻松和悠闲的时光。无论是和朋友们聚会交流,还是自己独自享受片刻宁静,山姆咖啡甜品都为你提供了一个理想的场所。
这里的服务员热情友好,会为你提供专业的建议和推荐。无论你对咖啡和甜品了解多少,都可以在这里找到自己喜欢的口味和品种。而且山姆咖啡甜品还定期举办各种咖啡和甜品相关的活动,让你更加了解和欣赏这个美妙的世界。
总而言之,山姆咖啡甜品是一个让你享受咖啡与甜品完美结合的地方。在这里,你能品尝到高品质的咖啡和独特口感的甜品,同时享受悠闲的时光。无论你是一个咖啡爱好者还是一个甜品爱好者,山姆咖啡甜品都能满足你的需求。快来和我们一起,探索咖啡甜品的美妙世界吧!
脐橙一直以来都是人们喜爱的水果之一,而位于中国赣南地区的赣南脐橙更是享有盛誉。今天我们将带您了解赣南脐橙的种植、特点以及如何挑选最优质的脐橙。
赣南地区的气候和土壤条件非常适合脐橙的生长,故而赣南脐橙的种植历史悠久。在山姆镇附近的果园里,您可以看到一片片翠绿的脐橙树,树上挂满了金黄色的果实,给人一种宁静美好的感觉。
选购脐橙时,可以根据以下几点来挑选最优质的赣南脐橙:
通过以上几点挑选,您就可以选购到最优质的赣南脐橙,享受口感鲜美的水果。如果您有机会到赣南地区游玩,不妨前往山姆镇的脐橙果园,亲手采摘新鲜的脐橙,感受大自然的馈赠。
脐橙作为一种美味又营养丰富的水果,不仅可以直接食用,还可以用来制作饮料、甜点等各种料理。无论是榨成橙汁还是加入沙拉中,赣南脐橙都能为您的餐桌增添一道亮丽的风景。
希望通过本文的介绍,您对赣南脐橙有了更深入的了解,也期待您有机会品尝到正宗的赣南脐橙,体验来自大自然的美味馈赠。
之前看了Mahout官方示例 20news 的调用实现;于是想根据示例的流程实现其他例子。网上看到了一个关于天气适不适合打羽毛球的例子。
训练数据:
Day Outlook Temperature Humidity Wind PlayTennis
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Overcast Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Overcast Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Overcast Mild High Strong Yes
D13 Overcast Hot Normal Weak Yes
D14 Rain Mild High Strong No
检测数据:
sunny,hot,high,weak
结果:
Yes=》 0.007039
No=》 0.027418
于是使用Java代码调用Mahout的工具类实现分类。
基本思想:
1. 构造分类数据。
2. 使用Mahout工具类进行训练,得到训练模型。
3。将要检测数据转换成vector数据。
4. 分类器对vector数据进行分类。
接下来贴下我的代码实现=》
1. 构造分类数据:
在hdfs主要创建一个文件夹路径 /zhoujainfeng/playtennis/input 并将分类文件夹 no 和 yes 的数据传到hdfs上面。
数据文件格式,如D1文件内容: Sunny Hot High Weak
2. 使用Mahout工具类进行训练,得到训练模型。
3。将要检测数据转换成vector数据。
4. 分类器对vector数据进行分类。
这三步,代码我就一次全贴出来;主要是两个类 PlayTennis1 和 BayesCheckData = =》
package myTesting.bayes;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.util.ToolRunner;
import org.apache.mahout.classifier.naivebayes.training.TrainNaiveBayesJob;
import org.apache.mahout.text.SequenceFilesFromDirectory;
import org.apache.mahout.vectorizer.SparseVectorsFromSequenceFiles;
public class PlayTennis1 {
private static final String WORK_DIR = "hdfs://192.168.9.72:9000/zhoujianfeng/playtennis";
/*
* 测试代码
*/
public static void main(String[] args) {
//将训练数据转换成 vector数据
makeTrainVector();
//产生训练模型
makeModel(false);
//测试检测数据
BayesCheckData.printResult();
}
public static void makeCheckVector(){
//将测试数据转换成序列化文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"testinput";
String output = WORK_DIR+Path.SEPARATOR+"tennis-test-seq";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean参数是,是否递归删除的意思
fs.delete(out, true);
}
SequenceFilesFromDirectory sffd = new SequenceFilesFromDirectory();
String[] params = new String[]{"-i",input,"-o",output,"-ow"};
ToolRunner.run(sffd, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("文件序列化失败!");
System.exit(1);
}
//将序列化文件转换成向量文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"tennis-test-seq";
String output = WORK_DIR+Path.SEPARATOR+"tennis-test-vectors";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean参数是,是否递归删除的意思
fs.delete(out, true);
}
SparseVectorsFromSequenceFiles svfsf = new SparseVectorsFromSequenceFiles();
String[] params = new String[]{"-i",input,"-o",output,"-lnorm","-nv","-wt","tfidf"};
ToolRunner.run(svfsf, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("序列化文件转换成向量失败!");
System.out.println(2);
}
}
public static void makeTrainVector(){
//将测试数据转换成序列化文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"input";
String output = WORK_DIR+Path.SEPARATOR+"tennis-seq";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean参数是,是否递归删除的意思
fs.delete(out, true);
}
SequenceFilesFromDirectory sffd = new SequenceFilesFromDirectory();
String[] params = new String[]{"-i",input,"-o",output,"-ow"};
ToolRunner.run(sffd, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("文件序列化失败!");
System.exit(1);
}
//将序列化文件转换成向量文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"tennis-seq";
String output = WORK_DIR+Path.SEPARATOR+"tennis-vectors";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean参数是,是否递归删除的意思
fs.delete(out, true);
}
SparseVectorsFromSequenceFiles svfsf = new SparseVectorsFromSequenceFiles();
String[] params = new String[]{"-i",input,"-o",output,"-lnorm","-nv","-wt","tfidf"};
ToolRunner.run(svfsf, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("序列化文件转换成向量失败!");
System.out.println(2);
}
}
public static void makeModel(boolean completelyNB){
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"tennis-vectors"+Path.SEPARATOR+"tfidf-vectors";
String model = WORK_DIR+Path.SEPARATOR+"model";
String labelindex = WORK_DIR+Path.SEPARATOR+"labelindex";
Path in = new Path(input);
Path out = new Path(model);
Path label = new Path(labelindex);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean参数是,是否递归删除的意思
fs.delete(out, true);
}
if(fs.exists(label)){
//boolean参数是,是否递归删除的意思
fs.delete(label, true);
}
TrainNaiveBayesJob tnbj = new TrainNaiveBayesJob();
String[] params =null;
if(completelyNB){
params = new String[]{"-i",input,"-el","-o",model,"-li",labelindex,"-ow","-c"};
}else{
params = new String[]{"-i",input,"-el","-o",model,"-li",labelindex,"-ow"};
}
ToolRunner.run(tnbj, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("生成训练模型失败!");
System.exit(3);
}
}
}
package myTesting.bayes;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.PathFilter;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.mahout.classifier.naivebayes.BayesUtils;
import org.apache.mahout.classifier.naivebayes.NaiveBayesModel;
import org.apache.mahout.classifier.naivebayes.StandardNaiveBayesClassifier;
import org.apache.mahout.common.Pair;
import org.apache.mahout.common.iterator.sequencefile.PathType;
import org.apache.mahout.common.iterator.sequencefile.SequenceFileDirIterable;
import org.apache.mahout.math.RandomAccessSparseVector;
import org.apache.mahout.math.Vector;
import org.apache.mahout.math.Vector.Element;
import org.apache.mahout.vectorizer.TFIDF;
import com.google.common.collect.ConcurrentHashMultiset;
import com.google.common.collect.Multiset;
public class BayesCheckData {
private static StandardNaiveBayesClassifier classifier;
private static Map<String, Integer> dictionary;
private static Map<Integer, Long> documentFrequency;
private static Map<Integer, String> labelIndex;
public void init(Configuration conf){
try {
String modelPath = "/zhoujianfeng/playtennis/model";
String dictionaryPath = "/zhoujianfeng/playtennis/tennis-vectors/dictionary.file-0";
String documentFrequencyPath = "/zhoujianfeng/playtennis/tennis-vectors/df-count";
String labelIndexPath = "/zhoujianfeng/playtennis/labelindex";
dictionary = readDictionnary(conf, new Path(dictionaryPath));
documentFrequency = readDocumentFrequency(conf, new Path(documentFrequencyPath));
labelIndex = BayesUtils.readLabelIndex(conf, new Path(labelIndexPath));
NaiveBayesModel model = NaiveBayesModel.materialize(new Path(modelPath), conf);
classifier = new StandardNaiveBayesClassifier(model);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("检测数据构造成vectors初始化时报错。。。。");
System.exit(4);
}
}
/**
* 加载字典文件,Key: TermValue; Value:TermID
* @param conf
* @param dictionnaryDir
* @return
*/
private static Map<String, Integer> readDictionnary(Configuration conf, Path dictionnaryDir) {
Map<String, Integer> dictionnary = new HashMap<String, Integer>();
PathFilter filter = new PathFilter() {
@Override
public boolean accept(Path path) {
String name = path.getName();
return name.startsWith("dictionary.file");
}
};
for (Pair<Text, IntWritable> pair : new SequenceFileDirIterable<Text, IntWritable>(dictionnaryDir, PathType.LIST, filter, conf)) {
dictionnary.put(pair.getFirst().toString(), pair.getSecond().get());
}
return dictionnary;
}
/**
* 加载df-count目录下TermDoc频率文件,Key: TermID; Value:DocFreq
* @param conf
* @param dictionnaryDir
* @return
*/
private static Map<Integer, Long> readDocumentFrequency(Configuration conf, Path documentFrequencyDir) {
Map<Integer, Long> documentFrequency = new HashMap<Integer, Long>();
PathFilter filter = new PathFilter() {
@Override
public boolean accept(Path path) {
return path.getName().startsWith("part-r");
}
};
for (Pair<IntWritable, LongWritable> pair : new SequenceFileDirIterable<IntWritable, LongWritable>(documentFrequencyDir, PathType.LIST, filter, conf)) {
documentFrequency.put(pair.getFirst().get(), pair.getSecond().get());
}
return documentFrequency;
}
public static String getCheckResult(){
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String classify = "NaN";
BayesCheckData cdv = new BayesCheckData();
cdv.init(conf);
System.out.println("init done...............");
Vector vector = new RandomAccessSparseVector(10000);
TFIDF tfidf = new TFIDF();
//sunny,hot,high,weak
Multiset<String> words = ConcurrentHashMultiset.create();
words.add("sunny",1);
words.add("hot",1);
words.add("high",1);
words.add("weak",1);
int documentCount = documentFrequency.get(-1).intValue(); // key=-1时表示总文档数
for (Multiset.Entry<String> entry : words.entrySet()) {
String word = entry.getElement();
int count = entry.getCount();
Integer wordId = dictionary.get(word); // 需要从dictionary.file-0文件(tf-vector)下得到wordID,
if (StringUtils.isEmpty(wordId.toString())){
continue;
}
if (documentFrequency.get(wordId) == null){
continue;
}
Long freq = documentFrequency.get(wordId);
double tfIdfValue = tfidf.calculate(count, freq.intValue(), 1, documentCount);
vector.setQuick(wordId, tfIdfValue);
}
// 利用贝叶斯算法开始分类,并提取得分最好的分类label
Vector resultVector = classifier.classifyFull(vector);
double bestScore = -Double.MAX_VALUE;
int bestCategoryId = -1;
for(Element element: resultVector.all()) {
int categoryId = element.index();
double score = element.get();
System.out.println("categoryId:"+categoryId+" score:"+score);
if (score > bestScore) {
bestScore = score;
bestCategoryId = categoryId;
}
}
classify = labelIndex.get(bestCategoryId)+"(categoryId="+bestCategoryId+")";
return classify;
}
public static void printResult(){
System.out.println("检测所属类别是:"+getCheckResult());
}
}