Gene Moth_0223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0223
Symbol
ID	3831374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	219634
End bp	220707
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	55%
IMG OID	637828159
Product	diguanylate cyclase
Protein accession	YP_429101
Protein GI	83589092
COG category	[T] Signal transduction mechanisms
COG ID	[COG3706] Response regulator containing a CheY-like receiver domain and a GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.133267
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGAAA AGCTCGGGCG GGCCGACTGG TTGGCAGCGA TGCTGGTTAC AGTGGGGGGC 
GTTTTTTTGT CCCTGGCAGC GCCACCGGGC CCGACTGTCT ATTGGGGGTT GACCTGGAGT 
ATATTTAACG GCCTCATCCT GGCTATCGGA ATTCTTAGCA CGGGTTTTAT CACCCGGGTT 
TTGATCCTGG GACTGAACCT GATACTGATA GCTGGCTGGC AGTTAACAAG TGGCTGGCCG 
TCAGCCACGT CACTTCCCTT GCTTCTCTTC TTACCGGTCC TGGTGCCCCT TTATCGGAAG 
CAAAGGAAGG AAATCCTTGC AGGCCTGGTA GGGGGGCTGA TACTGGGAGG ATACAGCACT 
TTAAAAGAAA ATCTGGCTAA TCCGTCTTCA TGGGCTATCC TGGGTGGTTG GGTTGCAATC 
GCGGGCTTCT TTTATTACCT CATGGTGGGT CTGGTGGTTA AGGCCAGGCA GGCTGCTTCT 
TTGCAGGCTG AGGTGGAATA TACCCGTCAC GAGTATCAAG AAGCCTGCAA GCGGCTGGCC 
GCCATGGAGA TGGCGGCCAT TACTGATGAT TTAACCGGGA TTTATAACTA CCGCTACTTC 
GTGCAGGCCT TTAGCAACCT GTTGAACTCC CGGCAGCAGC CCCGTTACCT GGCAGTTTTA 
ATGCTGGATA TCGATTACTT TAAAGAGATA AATGATGCCT ACGGCCATCT CACCGGTAAC 
AGGGTACTGG CGGAACTGGC CACCATCCTG AAGGAGTGCA CCCGTGAACA GGATGTTGTC 
ACCCGTTTCG GCGGGGAGGA GTTCGCTCTC ATTTTGCCCG ATACAGATTA TCACGGTGCC 
CTGCAGGTGG CGGAAAGGAT CCGCAAGGCC ATCGCCGAGC ATACCTTCCA AGCTGAAGGA 
ACGGCCATCC ACGTTACTGT AAGTGCCGGT GTGGCGGTCT GGCCGGTAGA CGGGACCGAT 
AAAAAGGATA TCATTGCCCG GGCCGACCGT GCCCTTTACC AGGCCAAGAC AACCGGGCGT 
AACAGTGTCT GCGCCTATCA GTTCCTGAAA AAGGAACGGG GTGTCCATGA ATAA

Protein sequence

MGEKLGRADW LAAMLVTVGG VFLSLAAPPG PTVYWGLTWS IFNGLILAIG ILSTGFITRV 
LILGLNLILI AGWQLTSGWP SATSLPLLLF LPVLVPLYRK QRKEILAGLV GGLILGGYST 
LKENLANPSS WAILGGWVAI AGFFYYLMVG LVVKARQAAS LQAEVEYTRH EYQEACKRLA 
AMEMAAITDD LTGIYNYRYF VQAFSNLLNS RQQPRYLAVL MLDIDYFKEI NDAYGHLTGN 
RVLAELATIL KECTREQDVV TRFGGEEFAL ILPDTDYHGA LQVAERIRKA IAEHTFQAEG 
TAIHVTVSAG VAVWPVDGTD KKDIIARADR ALYQAKTTGR NSVCAYQFLK KERGVHE