Gene Hoch_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1950
Symbol
ID	8544332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2687929
End bp	2688888
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	71%
IMG OID	646386654
Product	S-adenosyl-methyltransferase MraW
Protein accession	YP_003266389
Protein GI	262195180
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0275] Predicted S-adenosylmethionine-dependent methyltransferase involved in cell envelope biogenesis
TIGRFAM ID	[TIGR00006] S-adenosyl-methyltransferase MraW

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0408916
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCACGT CAGACGCATT CGTCCATCTG CCCGTACTCA AGGAGGAAGT CCTCGCGCAT 
ATGTCGCCCC GCCCCGGCGG CGTGTACTGC GATGGCACCT TGGGCGGCGG CGGTCATGCG 
GGCGCCGTGC TCGCGCGCGC CAATCCCGAC GGCCGGCTGT ACGGCATCGA TCGCGACGCC 
ACCGCGCTGG CGGCCGCGCA GCGCGCGCTG GCCGACTTTG GCGAGCGCGT GCAGTTCCTG 
CGCGGCACCT ACGGCTACGC CGATGAGCTT CTGGCCGAGG CCGGGGCGCC GCCGCTCGAC 
GGCATCCTGC TCGATATCGG GCCGTCCTCG CCGCAATTCG ACCGCGCCGA GCGCGGCTTT 
TCGTTCCTCA GGCCCGGTCC CATCGACATG CGCATGGACC AGAGCAGCGG CGAGACCGCG 
CTCGATCTCA TGCGCCGACT CGGGCCGGGC GAGCTCGCCG ACATCCTGTG GTCTTTCGGC 
GAGGAGCGCT TCAGCAAGCG CATCGCGGCG CGCATCAAAG ACGCCGTCCG CGACCACCGC 
CTCGAGACCA CGACCGACCT GGCCGCCCTC GTCGAGGACG CCATCCCCGC TTCCGTGCGC 
CGACAGATGA AGACCCACCC CGCGACCAAA ACCTTCCAGG CGCTGCGCAT CGCCGTCAAC 
GGCGAGCTCG ACCAGCTCGC GCGTTTTTTG CGCGTGTTCC CGCCGCTGCT CGCGCCCGGC 
GGGCGCTGCG TGATCATCAG CTTCCACTCG CTCGAGGACC GGCTGGTCAA GCGCGCGTTT 
CGCGATCTCG CGTGGTCCTC GCGGCTGCCG CCGGATCTGG CCCGCGCCGC GGGCGAGCGC 
ATCGAGCCGG TGTGCGTGCC GGTGACGCGC AAGGCCGTGT TCGCCAGCGA GGACGAGATC 
GCCAGCAACC CGCGGGCGCG CTCGGCGCGG CTGCGCGCGT GCGAGAAGGT GGCGGCATGA

Protein sequence

MPTSDAFVHL PVLKEEVLAH MSPRPGGVYC DGTLGGGGHA GAVLARANPD GRLYGIDRDA 
TALAAAQRAL ADFGERVQFL RGTYGYADEL LAEAGAPPLD GILLDIGPSS PQFDRAERGF 
SFLRPGPIDM RMDQSSGETA LDLMRRLGPG ELADILWSFG EERFSKRIAA RIKDAVRDHR 
LETTTDLAAL VEDAIPASVR RQMKTHPATK TFQALRIAVN GELDQLARFL RVFPPLLAPG 
GRCVIISFHS LEDRLVKRAF RDLAWSSRLP PDLARAAGER IEPVCVPVTR KAVFASEDEI 
ASNPRARSAR LRACEKVAA