Gene Hoch_5487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5487
Symbol
ID	8547900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7528942
End bp	7530060
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	74%
IMG OID	646390160
Product	Mandelate racemase/muconate lactonizing protein
Protein accession	YP_003269863
Protein GI	262198654
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.111107
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.112319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCACC TCGACGGGCC TCTGGGCCGG GACGCGCTGC GCATCGAATC GCTGACCGGG 
GCGCCGCTGA GCGCGCCGCT GCTCGCGCCC TTCGTCATCG CCAGCGGCCG CCTCGACGCG 
GTCGAAAACG CCGCCGTGTG CGTGCGTCTG GCCGGCGGTG CCTGCGGCTG GGGCGAGATT 
CCCGTGCTCG CGCCGGTGAC CCGCGAGAGC CGCGATGAGG CCCTGGCCGC GCTCGAGCGC 
GTGGCCGCCT GGATGTGCGG CCGCGACGCC GGCCGCTGGC GCGCGCTCGC CGGCGAGCTT 
TGCGAGCGCG AACCCGAGCT GGCGGCCACC CGCGCCGGCC TCGAAATGGC ACTCATCGAC 
GCTGTGTGCC GAGCCCACGG GCTGCCGCTG TTTCGCTTTT TCGGCGGCGT GGACGACAAC 
CTGTGCACCG ACATCACCAT CCCCATCTGC GCCGCAGACG AGGCCGAAGC CCTGGCCCGG 
CAGTACGCGG CCGCGGGTTT CTCGACCATC AAGACCAAGA TCGGACACCA GGTCGACGCC 
GACGTCGAAC GCCTGCGCGC CATCCGCCGC GGCCACCCGG CGTGTCGCTT CATCGTCGAC 
GCCAACGAGG GTTACAGCGC CGATGACGCC CTGCGCGCGC TCGCCGCCAT GCGCCGCGCC 
GGGGTCACGC CGGCGCTGTT CGAGCAGCCC GTGGCCCGCG CCGACTGGGA CGGTCTGGGC 
CGCGTGAGCG CCGACGGCGG CGTGCCCGTG GCCGCCGACG AGTCGTGCCG CTCGGCCGCG 
GACGCGCTGC GCATCGCGCG CGACGGCTTG GCCCAGGTGC TCAACATCAA GATCGCCAAA 
TGCGGCGTGG CCGAAGCCCT CGACATCGCC GCCGTGGCCC GCGCCGCCGG CCTCGGCCTG 
ATGATCGGCG GCATGGTCGA GACCCGCCTG GCCATGGGCT TTAGCGCCCA CTTCGCCGCC 
GGTCTGGGCG GGTTCGCGTG GGTCGACCTC GACACCCCGC TGCTCCTGGC CAAGGATCCC 
GTGCGCGGCG GCTATCGCGC CCGCGGCCCG CGCTACCAGC TCGGCCGGGA GCCCGGACAC 
GGCGCCGAAC CCGCGTGGAC GAAAACCCCG ACGCCGTGA

Protein sequence

MKHLDGPLGR DALRIESLTG APLSAPLLAP FVIASGRLDA VENAAVCVRL AGGACGWGEI 
PVLAPVTRES RDEALAALER VAAWMCGRDA GRWRALAGEL CEREPELAAT RAGLEMALID 
AVCRAHGLPL FRFFGGVDDN LCTDITIPIC AADEAEALAR QYAAAGFSTI KTKIGHQVDA 
DVERLRAIRR GHPACRFIVD ANEGYSADDA LRALAAMRRA GVTPALFEQP VARADWDGLG 
RVSADGGVPV AADESCRSAA DALRIARDGL AQVLNIKIAK CGVAEALDIA AVARAAGLGL 
MIGGMVETRL AMGFSAHFAA GLGGFAWVDL DTPLLLAKDP VRGGYRARGP RYQLGREPGH 
GAEPAWTKTP TP