Sample 3300002657

Basic Information
IMG/M Taxon OID	3300002657 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0085736 \| Gp0056646 \| Ga0005466
Sample Name	Forest soil microbial communities from Harvard Forest Long Term Ecological Research site in Petersham, Massachusetts, USA - MetaT HF115 (Metagenome Metatranscriptome, Counting Only)
Sequencing Status	Permanent Draft
Sequencing Center	DOE Joint Genome Institute (JGI)
Published?	N
Use Policy	Open

Basic Information

IMG/M Taxon OID

GOLD Reference
(Study | Sequencing Project | Analysis Project)

Sample Name

Forest soil microbial communities from Harvard Forest Long Term Ecological Research site in Petersham, Massachusetts, USA - MetaT HF115 (Metagenome Metatranscriptome, Counting Only)

Sequencing Status

Permanent Draft

Sequencing Center

DOE Joint Genome Institute (JGI)

Published?

Use Policy

Open

Dataset Contents
Total Genome Size	6749702
Sequencing Scaffolds	29
Novel Protein Genes	33
Associated Families	31

Dataset Contents

Total Genome Size

6749702

Sequencing Scaffolds

Novel Protein Genes

Associated Families

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
Not Available	23
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Cyanobacteria/Melainabacteria group → Cyanobacteria → Synechococcales → Synechococcaceae → Synechococcus → unclassified Synechococcus → Synechococcus sp. CC9605	1
All Organisms → cellular organisms → Bacteria → Proteobacteria → Betaproteobacteria → Burkholderiales → Burkholderiaceae → Burkholderia → Burkholderia cepacia complex → Burkholderia ambifaria	1
All Organisms → cellular organisms → Bacteria → Acidobacteria → Acidobacteriia	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Actinobacteria → Actinomycetia	1
All Organisms → cellular organisms → Bacteria → Acidobacteria → Acidobacteriia → Bryobacterales → Solibacteraceae → Candidatus Solibacter → Candidatus Solibacter usitatus	1
All Organisms → cellular organisms → Eukaryota → Viridiplantae → Streptophyta → Streptophytina → Embryophyta → Tracheophyta → Euphyllophyta → Spermatophyta → Magnoliopsida → Mesangiospermae → Liliopsida → Alismatales → Araceae → Pothoideae → Potheae → Anthurium → Anthurium amnicola	1

Dataset Phylogeny

Taxonomy Groups

Number of Scaffolds

Not Available

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Cyanobacteria/Melainabacteria group → Cyanobacteria → Synechococcales → Synechococcaceae → Synechococcus → unclassified Synechococcus → Synechococcus sp. CC9605

All Organisms → cellular organisms → Bacteria → Proteobacteria → Betaproteobacteria → Burkholderiales → Burkholderiaceae → Burkholderia → Burkholderia cepacia complex → Burkholderia ambifaria

All Organisms → cellular organisms → Bacteria → Acidobacteria → Acidobacteriia

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Actinobacteria → Actinomycetia

All Organisms → cellular organisms → Bacteria → Acidobacteria → Acidobacteriia → Bryobacterales → Solibacteraceae → Candidatus Solibacter → Candidatus Solibacter usitatus

All Organisms → cellular organisms → Eukaryota → Viridiplantae → Streptophyta → Streptophytina → Embryophyta → Tracheophyta → Euphyllophyta → Spermatophyta → Magnoliopsida → Mesangiospermae → Liliopsida → Alismatales → Araceae → Pothoideae → Potheae → Anthurium → Anthurium amnicola

Ecosystem Assignment (GOLD)
Name	Forest Soil Microbial Communities From Harvard Forest Long Term Ecological Research (Lter) Site In Petersham, Ma, For Long-Term Soil Warming Studies
Type	Environmental
Taxonomy	Environmental → Terrestrial → Soil → Loam → Forest Soil → Forest Soil → Forest Soil Microbial Communities From Harvard Forest Long Term Ecological Research (Lter) Site In Petersham, Ma, For Long-Term Soil Warming Studies

Ecosystem Assignment (GOLD)

Name

Forest Soil Microbial Communities From Harvard Forest Long Term Ecological Research (Lter) Site In Petersham, Ma, For Long-Term Soil Warming Studies

Type

Environmental

Taxonomy

Environmental → Terrestrial → Soil → Loam → Forest Soil → Forest Soil → Forest Soil Microbial Communities From Harvard Forest Long Term Ecological Research (Lter) Site In Petersham, Ma, For Long-Term Soil Warming Studies

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	forest biome → land → forest soil
Earth Microbiome Project Ontology (EMPO)	Free-living → Non-saline → Soil (non-saline)

Alternative Ecosystem Assignments

Environment Ontology (ENVO)

forest biome → land → forest soil

Earth Microbiome Project Ontology (EMPO)

Free-living → Non-saline → Soil (non-saline)

Location Information
Location	Harvard Forest LTER, Petersham, MA, USA
Coordinates	Lat. (^o)	42.532967	Long. (^o)	-72.180244	Alt. (m)	N/A	Depth (m)	0 to .1
Location on Map

Zoom:	Powered by OpenStreetMap^©

Location Information

Location

Harvard Forest LTER, Petersham, MA, USA

Coordinates

Lat. (^o)

42.532967

Long. (^o)

-72.180244

Alt. (m)

N/A

Depth (m)

0 to .1

Location on Map

Zoom:

Family	Category	Number of Sequences	3D Structure?
F000396	Metagenome / Metatranscriptome	1185	Y
F001290	Metagenome / Metatranscriptome	730	Y
F001357	Metagenome / Metatranscriptome	716	Y
F002692	Metagenome / Metatranscriptome	536	Y
F003383	Metagenome / Metatranscriptome	490	Y
F003427	Metagenome / Metatranscriptome	487	Y
F003556	Metagenome / Metatranscriptome	479	Y
F007311	Metagenome / Metatranscriptome	353	Y
F010404	Metagenome / Metatranscriptome	304	Y
F014264	Metagenome / Metatranscriptome	264	Y
F014631	Metagenome / Metatranscriptome	261	Y
F018180	Metagenome / Metatranscriptome	236	Y
F019794	Metagenome / Metatranscriptome	227	N
F020641	Metagenome / Metatranscriptome	222	Y
F022206	Metagenome / Metatranscriptome	215	Y
F023505	Metagenome / Metatranscriptome	209	Y
F024561	Metagenome / Metatranscriptome	205	Y
F024939	Metagenome / Metatranscriptome	203	N
F034933	Metagenome / Metatranscriptome	173	Y
F035644	Metagenome / Metatranscriptome	171	Y
F036049	Metagenome / Metatranscriptome	170	Y
F040634	Metagenome / Metatranscriptome	161	N
F045872	Metagenome / Metatranscriptome	152	Y
F061605	Metagenome / Metatranscriptome	131	N
F068321	Metagenome / Metatranscriptome	124	N
F070743	Metagenome / Metatranscriptome	122	N
F073807	Metagenome / Metatranscriptome	120	N
F076112	Metagenome / Metatranscriptome	118	Y
F076700	Metagenome / Metatranscriptome	117	N
F081387	Metagenome / Metatranscriptome	114	Y
F093895	Metagenome / Metatranscriptome	106	N

Family

Scaffold	Taxonomy	Length	IMG/M Link
Ga0005466J37255_100094	Not Available	960	Open in IMG/M
Ga0005466J37255_100098	Not Available	750	Open in IMG/M
Ga0005466J37255_100123	Not Available	595	Open in IMG/M
Ga0005466J37255_100152	Not Available	588	Open in IMG/M
Ga0005466J37255_100211	Not Available	583	Open in IMG/M
Ga0005466J37255_100272	Not Available	575	Open in IMG/M
Ga0005466J37255_100309	Not Available	830	Open in IMG/M
Ga0005466J37255_100454	Not Available	600	Open in IMG/M
Ga0005466J37255_100976	Not Available	506	Open in IMG/M
Ga0005466J37255_101105	Not Available	585	Open in IMG/M
Ga0005466J37255_101272	Not Available	847	Open in IMG/M
Ga0005466J37255_101318	Not Available	548	Open in IMG/M
Ga0005466J37255_101744	Not Available	594	Open in IMG/M
Ga0005466J37255_101949	Not Available	544	Open in IMG/M
Ga0005466J37255_102620	Not Available	584	Open in IMG/M
Ga0005466J37255_103968	Not Available	1400	Open in IMG/M
Ga0005466J37255_104335	Not Available	1738	Open in IMG/M
Ga0005466J37255_104521	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Cyanobacteria/Melainabacteria group → Cyanobacteria → Synechococcales → Synechococcaceae → Synechococcus → unclassified Synechococcus → Synechococcus sp. CC9605	591	Open in IMG/M
Ga0005466J37255_104523	Not Available	608	Open in IMG/M
Ga0005466J37255_104580	Not Available	572	Open in IMG/M
Ga0005466J37255_104812	Not Available	554	Open in IMG/M
Ga0005466J37255_105109	All Organisms → cellular organisms → Bacteria → Proteobacteria → Betaproteobacteria → Burkholderiales → Burkholderiaceae → Burkholderia → Burkholderia cepacia complex → Burkholderia ambifaria	594	Open in IMG/M
Ga0005466J37255_106180	Not Available	552	Open in IMG/M
Ga0005466J37255_106205	All Organisms → cellular organisms → Bacteria → Acidobacteria → Acidobacteriia	577	Open in IMG/M
Ga0005466J37255_106611	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Actinobacteria → Actinomycetia	512	Open in IMG/M
Ga0005466J37255_107228	All Organisms → cellular organisms → Bacteria → Acidobacteria → Acidobacteriia → Bryobacterales → Solibacteraceae → Candidatus Solibacter → Candidatus Solibacter usitatus	586	Open in IMG/M
Ga0005466J37255_109275	Not Available	561	Open in IMG/M
Ga0005466J37255_111149	Not Available	630	Open in IMG/M
Ga0005466J37255_111354	All Organisms → cellular organisms → Eukaryota → Viridiplantae → Streptophyta → Streptophytina → Embryophyta → Tracheophyta → Euphyllophyta → Spermatophyta → Magnoliopsida → Mesangiospermae → Liliopsida → Alismatales → Araceae → Pothoideae → Potheae → Anthurium → Anthurium amnicola	531	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
Ga0005466J37255_100094	Ga0005466J37255_1000941	F003383	MRRRVAPLPRSSRSARVASLGCPVPAPFLLSRRPNPQVAPWFRAFGCAGDGRSSCPERRMPLALLVSARLRVAPVALAFSCPACDVGLGSPLALHLRLYRRWIIESPRCSHHSAVPTGRSSGFPKSQPFGIADDSPSELPQTLNPPAPIDGYPSYLGSHTIRFALVESPGCPGHSSLATAIDQFPGCPKSWVSHRSPILRASSLPESWFLG*
Ga0005466J37255_100098	Ga0005466J37255_1000981	F076700	SSLAVQPVLRPPATPVAALQLSLVLGSSGCAGTVTLTCVSALHSGSTSGQPSGSDRFRVLRLDRLQTSDSHRLFRSSARPLAIYQACARSWFHRACARQSWFHLARAAWPFLRLGRQPTSDSHRCRSLARLAASSGLRLMLPLPLVWLRVQFAPVASPYAFTGREPLGLRLVAPSPAEPLMHSLLPPNLASPAKPSMSIPFPLALASSGIFQLNIFRLASAFALLVRPAIPLWLAPQVSPSVRAGGH
Ga0005466J37255_100123	Ga0005466J37255_1001231	F018180	DFVSASLPFSSGSATASGGALARCHGSGLLSLRLPFAHMPAVFFSTSPSFRKVNEACLLSDPSRIGRPFVTPFSAFSVRLIPVRNQPLSSAPCWRTVATVYPLGNCDSLKLETSLSYLTRLGAVSHRTLSLSPFFAFTDSARTLPEELVNPASAVLPFGFALRGVMPTSLA*
Ga0005466J37255_100152	Ga0005466J37255_1001521	F014264	TASLAGSSGSGTMIRRAYVIRDYFWRGGERGKIGRLVRASFSVWKKAEHYNPEGSRGPGGE*
Ga0005466J37255_100211	Ga0005466J37255_1002111	F040634	MHGTEHRISDCRAYSPQAPRLLVYPTSASPLLDAPQLIFPKRDRLLVAAFPSPRTTPACADSVLRSMVPAFYFAHSLAVRPARSAFWLPRQGLVGPSFRRHPRLKPVAFCAGPLCRLCRQVPLPFGSFRSLRIKALPGFATVRSAFRNCPIFVRSPQPFLLKFGCGS*
Ga0005466J37255_100272	Ga0005466J37255_1002721	F076112	VAIPPEPGLTGESEGAVNRTGLAKVRQRIEAAGRELRSRNGGLETGSRFGGAKGRCEMPVPAGAHAGDLQGVNPLSPKGMAGS*
Ga0005466J37255_100309	Ga0005466J37255_1003091	F007311	VPSCWPPHFAVAPVTDYSMLDAWHSPLHADYSALHFVRPVQTADLTRCSTLNALRLPRIAPRSTPCARAGRGSPRATDCSVVQHLELCPACGLLRPRCLAFRAALGLLLARRFPPCGVSGSLRVRHLALHAGLRIAPYADISRPCAVFGFLHPRH*
Ga0005466J37255_100454	Ga0005466J37255_1004541	F014631	VPSDPLNRSLSDRHARPEHGIRLGCDVGPLLPTAGFIQLRIVAQVRVRSPFR*
Ga0005466J37255_100465	Ga0005466J37255_1004652	F003427	VAPGQRTAKAVADPELMVKTRIRSHKRVFTWFASRRPQTPAEASLEASLKISDRKALDGPAMRPVTPLAVENGVGKLAAKVRQMSARERECGELPSP
Ga0005466J37255_100976	Ga0005466J37255_1009761	F010404	MQPFTLLQRRFALQQIPAAGSTLLAYIFKAALEFQLARSASRSRPSLAFFRPTGLDHCESPVANFLS*
Ga0005466J37255_100976	Ga0005466J37255_1009762	F014631	PSDPMDRSLSDRHARPELGIRIGCDVGPLLPAAGLIQPRIVALVLVRSPFR*
Ga0005466J37255_101105	Ga0005466J37255_1011051	F061605	SKPSITAKLPAGMHGTELCSQIRRAFFLSAPRFLLSKAADRCFQARLRASLTGADISKRPFALPKRLPVSEPPFRGQRSRPTPSMPCRSLARPVRLSAPPRAPVRPGTREITAKNPLPDSRSALPTVSRISTPLQGLSNPSGSKRSIRFPIWKLTFRIAPDCPSLPGFGSILVPIPDHRSRLAKRPVACCSS
Ga0005466J37255_101272	Ga0005466J37255_1012721	F024939	PELLGPRTLRCAPVVDCSSLDTWLSPPRADCSAFRLVHPVLATDLIRQSTLDARRRLQIAPLPISCVRVVHRIAPCSTLRALHRSRIAPLSMLVRRACCGLLRPLRFAPCCRSRVDSPGLLQLNRSSLGRLMLRDGLRIAPYADTSHPCANHGSLRVRHFKLRPVHRLLCARRLALASDCGSLRSPVLAPSCCPRIAPRTTLGVLHPTRLAPR*
Ga0005466J37255_101318	Ga0005466J37255_1013181	F023505	ELDNGGGRKKVVGLPGIIPGDWGKVEPGWLVEPLEARFARSGNRWHNSPVPLAAFARRQ*
Ga0005466J37255_101744	Ga0005466J37255_1017441	F036049	MVALGTLLLATVLLAGPLAGPAYTVRVACTVETDVACPALGPGNSTDFIVRNFTDVGLASLEIPANQLLPPTDSAYDMNVHHAWIPWFVTHWRLQESQVRSTHETCTDEVAQLRLSPALANLDWLRVRLWQIPSLQPQRCAIAPTVCLTNC*
Ga0005466J37255_101949	Ga0005466J37255_1019491	F068321	HRMSLYRMLTSVSERLHSIHWLRTDSLGNLLPTWARLGPLSVNEQGAALSHRRFDRGSFRCDRAPNGVAWRFPDWTAVGFAFPSPFLGSRSLWMSVTRILVTCWARFDHDRGSLSPRLGEPLAAILTRIASGVFVADDFRVALSLAADSRRARYPLLRTDFAQKVGLRIRSLFLFRRSLS
Ga0005466J37255_102620	Ga0005466J37255_1026201	F000396	VPSDPISQPNSPPACNGTELCNRDRRVLSFQLPATLFGERQLNASRLTCQLSWLKPASRSGLSLSRNDCPFPGHHFEVKAPDLPLRYPAAHSSRPFGSRFPHALRFAPLRAGSSSQSRYLTPARHLQPFLGSPLPFRAFRTLKDQSVQPDSWPESPPPEHSRLPLTPRHRVLFY*
Ga0005466J37255_103968	Ga0005466J37255_1039681	F035644	MGLHDSPEDWALSEYVQSDYMTDSERDAEADIPVPDRLLPKREYRRLVEALRLSQKIGLLIWLNRQGNLTLGGKERLLYLQSRASFEALEAGLRFARRLSEQEKLQSDFRHQMRELNRRPQSKHFRQSEARRIGVGYRDKGMLPEQSSRARRMAWEESFLPTELIPSEIVEILRRYLPSCLTEDEEWVDLSVFPGTFGSEGDPGLTKLLRPL*
Ga0005466J37255_104335	Ga0005466J37255_1043351	F081387	MGDEKHPTVGSSGEYWSINESLNQHFVEMKGFKNREGYGSCKVCAQIKNMTLYLKRTPGQQRASSCGKTLTGERYWPLLGVKSG*
Ga0005466J37255_104521	Ga0005466J37255_1045211	F070743	K*PIEQLALPTGMRGQSLACSVAEALPSCSPRRLLARHGSVRQSSLALLPARSHRLGTAFRSPATTVLFREPPWRGQRSRPIPSALILNLSSSPFGLGLPPSATFFTPPGVFHAQNPLPSFKPKTLKRPSNFRSPSGLSSFRIEALGQRLSLRSLPFMRGPIFLRSPKALITFDNYALSDHRSRFATVHQAYCSLN
Ga0005466J37255_104523	Ga0005466J37255_1045231	F034933	PEMEQSMTGRESQAMSAEQSAGKAGREVKGAEQSEPEAEGQVSCRK*
Ga0005466J37255_104523	Ga0005466J37255_1045232	F093895	PELLVPTFSTSHRSGIAPCSTLAFCAIHGVLRGLHRMPALLADFSAINPLALCPAHELLRARHLAFCVEPGLLRARRFSPCVEPGLLRVQPSRSVPSPDRSVLFPSRFASLTDCSVVDAWLLVSRPERSVLLTSTLSXSPIARCATLCASHRARITSCTTLDLPPRAQIAPRL*
Ga0005466J37255_104580	Ga0005466J37255_1045801	F023505	LDVGGGRKKAASFPEIIPGDWAKVESGWLAQPLEDRFARSGNRRHNSPVPLSAFARRQ*
Ga0005466J37255_104812	Ga0005466J37255_1048122	F024561	VALGQRTAKSGGRPSANGEEAETQSQTCLHPVRESASANAGSSEPRGLALRFSRRKAL
Ga0005466J37255_105109	Ga0005466J37255_1051091	F001357	MKRMLLTALIALALPMMAFAGSSYDFTNSGGTLTGTSAGLTLTGSELIALNGPGLGLVVGNLGTVTFSTGALTGGNLQMGATFGSGGSFNITGNGTNGVPNGVIFNGSFSGPVTWTLVTLANGTHNYTLTGTIEGTWYNGSNVQGATVQLTINTGKGFFNGSTTISSGDTNISLTVPEPGTLGLLGTGLI
Ga0005466J37255_106180	Ga0005466J37255_1061801	F019794	PLVRWLTFQLALASFLRLGRRPTADSHLVLILQLGSCPTSGSHRLLLQPSACASCCYDSPACAGRRPFAIPAANFRLASDVTPSSFTGFDSPDLRRMFLPPVGPLMHPLLQPNLASPAEPSMSIQSPPVLAPSGSASFNNLRLASVFAMSGATSDPSAAFASGFTLWLGLRRFSDSRQLFVPP
Ga0005466J37255_106205	Ga0005466J37255_1062052	F022206	VERIKTYLKQAEQAREQDLLTAVSLARRADLLAKDLLERLL*
Ga0005466J37255_106611	Ga0005466J37255_1066111	F001290	VSLKTILGYLAVAFVLWWVIEAPTSAAHLVHNIGTFLTTAAAGLSHFFTSI*
Ga0005466J37255_107228	Ga0005466J37255_1072281	F073807	MILAVGALGLAALPAAADTPCATAALSSYLVSGFTCSVGDLDFSDFSFNTGGTNPVTAAGVGVTPVTSPDGPGLDFDPSGFVSGDGLSQDVMVGFTVTAAPGVLIDDIYMGFGNVTTSGTGTALYTENFCGGPEDSCSLFVEAPTTSDTNAVKLSSTDIGGPVSSLNITKDLTLQTGTDGLAATSS
Ga0005466J37255_109275	Ga0005466J37255_1092751	F020641	LITHSTRALRIRAIVANSLDVAQGTTTLKGGITMTNKRPSRAGTLLLTGVVAVLTLTVALHAAQTISMPNAAGVKYSLAPGATSAAVTPAENTPVLVMGVQNSLGYRGVGQVALLHVPSSFLEWTGIESPASAAITSGFSSTSGTHIVYLDYSHLVDIEVASADTFVIHNANTSVTMNGVVTLIW*
Ga0005466J37255_111149	Ga0005466J37255_1111491	F002692	MSRLAMALIAYLALGVLAFATLTDSRIRMLTLLILGLFAFKTWVRRKDVIHPDGDRESQ*
Ga0005466J37255_111149	Ga0005466J37255_1111494	F045872	MREGFEQATIKIEKQQEFSKLQAAVEQAFMPEKVERFLKQ
Ga0005466J37255_111354	Ga0005466J37255_1113541	F003556	VRSNFNRAVSDEDYMAGKLLSAAYEHRHVLSLRTLLLETAEQMSATPHMDMRNQAMAYKYTAEELKQMTANAPTIDSDAFNSFLHSVYGLWEEQLVECYVSVCDGILGYQRVNRGRGNRRREDAPLLAPKIPRALWDTSFASLVDIDVSL*

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

3300002657: Forest soil microbial communities from Harvard Forest Long Term Ecological Research site in Petersham, Massachusetts, USA - MetaT HF115 (Metagenome Metatranscriptome, Counting Only)

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences