Gene Hoch_6599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_6599
Symbol
ID	8549016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	9052194
End bp	9053321
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	67%
IMG OID	646391259
Product	chorismate mutase
Protein accession	YP_003270958
Protein GI	262199749
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase
TIGRFAM ID	[TIGR01791] chorismate mutase, archaeal type [TIGR01799] chorismate mutase domain of T-protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTCG ACACCTTGCG TAACGACCTG CAGTCCCTCG ACCGGGAGAT TCTCGCGCTG 
GTGGCCAAGC GCCAGGCCTT GGCCGCCGAG ATCGGCAGCA TCAAGCGCGC CGCCGGGGTG 
CCCACGCGCG ACTACGGGCA GGAGCGCGCG GTGCTCGAGC GCGCCCGCGA GCACGCCGAC 
GAGATGGGCA TCTCGCCCGC GCTCGCCGAG CAGATTCTGC TGCTGCTCAT CCGCTCCTCG 
CTCACCGTGC AGGAGCGCGA CCGCGTGGCC GCGCTGGGCA GCGGCACCGG TCAGCGCGTG 
CTGGTCATCG GCGGCAGCGG CAACATGGGC CGCTGGTTCG CGCGCTTTCT CGGCTCCCAG 
GGCTACGCGG TGACCATCGC CGACCCGACG CCGGCGCCGG CCGAGCTGCG CGACTGCGAC 
CAGGTGAGCG ACTTCCGCGA CACCTCGCTG GACCAGGACA TCATCGTGGT GGCGACGCCG 
ATGATGACGG CCAACGCGAT CTTGCACGAG CTGGCGGAGC GCAAGCCCAA GGGTCTGGTG 
TTCGACGTCG GCTCGCTCAA GAGTCCGCTG CGCACCGGCC TCGCCGCGCT GGTGCAGGCC 
GGCGTGAGCG CGACCTCGCT CCATCCCATG TTCGGTCCCA ACACCGAGCT GCTCAGCGGT 
CGCCACGTGG TGTTCGTCGA TATCGGCGTG CCCGAGGCGA CCAGCCGCGC GCGCGATCTG 
TTTGCGTCGA CCATGGTCGT GCAGGTCGAG CTCGACCTGG AGAATCACGA TCGCCTGATC 
GCCTACGTGC TGGGATTGTC GCACGCGCTC AACATCGCAT TTGCGAGCGC GCTGGCCGAG 
AGCGGAGAGG CCGCGCCCAG GCTGGCCAAG ATGTCGAGCA CGACCTTCGA CGCGCAGCTC 
GAAGTGTCCA CGCGCGTGGC CATGGAGAAT CCGCAACTTT ACTACGAAAT CCAATCACTC 
AACGACTATG GAACCGAGTC TTTGACCGCG TTGCTGTATG CGGTGGAGCG TTTGCGCTCC 
TTGGTTCGCG CCGGTGATGC CAAGGGCTTC GCCGCGTTGA TGGAGCGCGG ACGCGCGTAC 
TTACAAGACC GTCGCAGCGA TGTGGATCCC CGGACGCGCT CCCTATAG

Protein sequence

MSLDTLRNDL QSLDREILAL VAKRQALAAE IGSIKRAAGV PTRDYGQERA VLERAREHAD 
EMGISPALAE QILLLLIRSS LTVQERDRVA ALGSGTGQRV LVIGGSGNMG RWFARFLGSQ 
GYAVTIADPT PAPAELRDCD QVSDFRDTSL DQDIIVVATP MMTANAILHE LAERKPKGLV 
FDVGSLKSPL RTGLAALVQA GVSATSLHPM FGPNTELLSG RHVVFVDIGV PEATSRARDL 
FASTMVVQVE LDLENHDRLI AYVLGLSHAL NIAFASALAE SGEAAPRLAK MSSTTFDAQL 
EVSTRVAMEN PQLYYEIQSL NDYGTESLTA LLYAVERLRS LVRAGDAKGF AALMERGRAY 
LQDRRSDVDP RTRSL