Gene Hoch_4063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4063
Symbol
ID	8546464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5581806
End bp	5583023
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	69%
IMG OID	646388740
Product	Mandelate racemase/muconate lactonizing protein
Protein accession	YP_003268455
Protein GI	262197246
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0405823
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.115232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATCG TCAAGGTCGA GACCTTTTTG GCAGATGGTG GCTGGCGGGC CTGGGGCTTC 
GTCAAAATCG AGACCGACGC CGGCATCACC GGCTGGGGCG AGTGCACCTG CGAGTTCTCG 
CAGTACGCAG TGCTGGGCGC GGTCGCCGAC CTCACGCCGG TGCTCATCGG CCAGGACCCG 
CGCGCCTACG AGATGCGCTT CTGGGACATG TACCGGCTCT CGCGCCTGGG CTCGGTGGGC 
GGCGCCGTGG GCAAGGCCAT CGGCGCCATC GAGTGCGCGC TGCTCGACAT CAAGGCGCGC 
GCGCTGGGCA TCTCGGTGGC CGAGCTGTTC GGCGGGCCGC TGCGCGAAAC CGTGCCCGTG 
TACTGGTCGC ACTTCTGCGT GACCCGCGTG TTCGCGGCCG AGCACTGCCG CGTCGAGCCG 
GTGCGCAGCC TCAGCGACGT GGCCGCGTGC GCGCGCGAGG TCGTGGAGCG CGGCTTCCGC 
GCGCTCAAGA CCAACATCTT CTTCCCCGGC GACCCGGGCG AGGTCTATCA CCCCGGCTTC 
GGCGGCGGCC CCGGCACCAC CGATCAAGTC GCCTGGCCCG AGGTGGTCGG CCAGGCCGAC 
GCGCTCTTCG GCACCATCCG CGACGCCGTG GGCCCGGAGG TGGGCGTCAT CCTCGACGTC 
AACTTCAACT TCAAGCCCGA GAGCTGCATC CGCCTGGCCA GGGAGCTTTC GCCCTACGAC 
CTGCTGTGGA TGGAGCTCGA CATGTACGAT CCCGCGGCCC TGCGCGCGAT CAAAGACGCC 
ATCGACATCC CGCTGTGCTC GCTCGAGACC CTGTTCTACG CCGAGCAGTA CCGGCCGTAC 
TTCGAGCGCC ACGCGGTCGA CGTGGCCATG CTCGACGTGC CCTGGAACGG CTTCGCCCAG 
GCCAAGAAGG TCGGCGACAT GGCCCAGGTG TTCCAGACCA ACGTGTGTCC GCACAACTAC 
TACAGCCACC TGGCCTCGTT CATCAGCGCC CAGCTCTGCG CCGTGCTGCC CAACGTGCGC 
ATGATGGAGA TCGACCTCGA CGACGTGCCC TGGAAGGACG AGATCGTGTC GCGCGCGCCC 
GCGTTCACCG ATGGCGCCAT GCGCGTGCCC GAGGGCCCGG GCTGGGGCAC CGAGATGTTA 
GAAGACGAGC TGCGCCGGCA TCCGTGGAGA CCGGACGAGC GTCCGCTGAC CGTGCCCACC 
GGCTCGTCCG GACGCTGA

Protein sequence

MKIVKVETFL ADGGWRAWGF VKIETDAGIT GWGECTCEFS QYAVLGAVAD LTPVLIGQDP 
RAYEMRFWDM YRLSRLGSVG GAVGKAIGAI ECALLDIKAR ALGISVAELF GGPLRETVPV 
YWSHFCVTRV FAAEHCRVEP VRSLSDVAAC AREVVERGFR ALKTNIFFPG DPGEVYHPGF 
GGGPGTTDQV AWPEVVGQAD ALFGTIRDAV GPEVGVILDV NFNFKPESCI RLARELSPYD 
LLWMELDMYD PAALRAIKDA IDIPLCSLET LFYAEQYRPY FERHAVDVAM LDVPWNGFAQ 
AKKVGDMAQV FQTNVCPHNY YSHLASFISA QLCAVLPNVR MMEIDLDDVP WKDEIVSRAP 
AFTDGAMRVP EGPGWGTEML EDELRRHPWR PDERPLTVPT GSSGR