Gene Hoch_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2040
Symbol
ID	8544422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2815662
End bp	2816681
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	71%
IMG OID	646386743
Product	CheB methylesterase
Protein accession	YP_003266478
Protein GI	262195269
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG2201] Chemotaxis response regulator containing a CheY-like receiver domain and a methylesterase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.322604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.302776
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCAGA CTTCTACCCA GCATGAGCGC GTGTTGTGCA TGGGCGCCTC GGCTGGCGGG 
TTGACGGCCT TGCGGCGGCT CGTCGCCGAG CTGCCGGCCG ACTTCCCCGC GCCCATCTGC 
CTGGTCCAGC ACACGCCCTC CGATGGCCCG CGTCTGCTCG ACGGACTGCT CACCCAGGCC 
GGCAAGCTCA GGGCGCGATT TGCCGAGGAT GGCGAGCCGC TCACGGCCGG CACCATCCAC 
ATCGCCCCGC CCGGCATGCA CATGGTCATC GACGACGGCC GCTTGCGCCA CGTGCGCGGC 
CCGCGCGAGA ACCTGGCGCG GCCGGCGATC GATCCGCTGT TCCGCTCCGC GGCGCTGCAT 
TTCAAGCAGC AGACCATCGG CGTGCTGCTC AGCGGCATGC TCGACGATGG CGTGGCCGGG 
CTCAGCGTCA TCGAGCGCTG CGGCGGCGTG GCCGTCATCC AGGACCCCGA GGACGCCGAG 
GCAGCCGACA TGCCGCAGAA CGCGCTCGAC GCGATCGGCG AGCGGCTCGC GGCCGTGCTC 
CCGGCCGATG CCCTGGGCCG CTATCTGCGC GAGCTGCGCA CCGTGGAGCC GCGCACCGGC 
GCCAACTGCC CCGAGCACCT CGGCGCCGAG CACCGCATGT TCGTCGCCGC CTCGGGCATC 
GATGTGGTGC CCATGATCGG CGACCCGGCG GCCCTGAGCT GTCCGACCTG CGGCGGGCCG 
CTGTGGGAGA TGCCCGACGA AGACGTGCGC CGCTACCGCT GCCACGTGGC CCACGGCTTC 
ACCACGCAGT GCCTGGGCGA GGAGCAGCGC ACGGGCATGG AAGAGGCGCT GTGGGCCGCT 
GTCCGGACGC TCGACGAGCG CGTCAAGACG CTCGGCGTGA TGATCCAGGA CGCCGAGAAG 
CGCGGCTATC GGCGCATCGT CGATATGTAT TCGGACGAGC GCAAGGAAGC CAAGCGCCAC 
GCCGACGCGC TGCGCGAGCT GTTTCTCGGC AATCTGGACA AGTCGCCCAA GGGGAACTGA

Protein sequence

MSQTSTQHER VLCMGASAGG LTALRRLVAE LPADFPAPIC LVQHTPSDGP RLLDGLLTQA 
GKLRARFAED GEPLTAGTIH IAPPGMHMVI DDGRLRHVRG PRENLARPAI DPLFRSAALH 
FKQQTIGVLL SGMLDDGVAG LSVIERCGGV AVIQDPEDAE AADMPQNALD AIGERLAAVL 
PADALGRYLR ELRTVEPRTG ANCPEHLGAE HRMFVAASGI DVVPMIGDPA ALSCPTCGGP 
LWEMPDEDVR RYRCHVAHGF TTQCLGEEQR TGMEEALWAA VRTLDERVKT LGVMIQDAEK 
RGYRRIVDMY SDERKEAKRH ADALRELFLG NLDKSPKGN