Gene Moth_2148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2148
Symbol
ID	3833148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2249150
End bp	2250163
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	55%
IMG OID	637830070
Product	diguanylate cyclase
Protein accession	YP_430980
Protein GI	83590971
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain [COG2202] FOG: PAS/PAC domain
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0891685
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGTGT CCACCGTAGA GATGGCCCTG AAGCTCCATG AAGCCCTCTC CCTGGCGCAA 
ATGTACCGCA GGATAGTCGA AGACTCCTTG ACGGAGGTCT ATATCTTTCA TCCCGATACG 
TTGAAGTTCC TGGCGGTCAA CCGGGGGGCC AACGAGAACC TTGGCTACGC CGAAGAAGAA 
CTTTTGGACA TGAACATCCT GCAGCTAATG CCGGAATTTG ACCGGGAGAG CTTCAGAGCC 
CTTTTGACCC CTTTACAGCA GGGCCAAAAA GAAAAGATCA TCTTTGACGC CAAGCACCGC 
CGGAAAGACG GCTCCCTCTA CCCGGTGGAA ACGCACCTGC AGCTCTTCGG CCATGGGAAA 
GGCAGCATAT GCGTGGCCTT TATATTAGAT TTGACAGAAC GCAAGAAAAT GGAAGAAAAG 
CTGAGGGAGC AAGGAGAGTT CCTGCGGTCG CTCCTGGCCG CCCTGCCCGT CGGGATCTTT 
ATCATCGACC CCGTCTCCCA CCGCATCGAG AAGGTAAACC TGGAAGCGGC CGCCATGATT 
GGAGCCGCAC CCGAAGAGAT CGAAGGCAGA TCCTGCTGGG AATTTTTCAT ACAATCCGCA 
GGAAGCTGTC CTATTACTGC CTCGAATGAA GAGGTTGACC GCTCCGAACG GCTTTTACGC 
CGGAAGGACG GGCTGGAGAT CCTCGTGCTA AAGACGGTCA AGCGCGTGCG GACGGACAGC 
GGGGAGAAAC TGGTGGAAAC CTTTATAGAC ATCTCCGAAC GCAAACACCT GGAGGAAGAG 
CTTTACCGCC TCTCCATCAC CGACCCTCTG ACCGGCGCTT ACAACCGCCG CTATTTTTTA 
GAAATGCTGG AAAGAGAAGT TGAGCGTATA CGGCGGACCG GGAATCCCTT CTCCCTGATC 
ATGTTTGACC TGGATCACTT CAAAAGTATA AATGACCATT TTGGACATGC CGCAGGAGAC 
CGGGTGGATT CAGGTGGCCG CGCCGGCATA ATTGAAAGCC GCGCTGGTGT ATGA

Protein sequence

MLVSTVEMAL KLHEALSLAQ MYRRIVEDSL TEVYIFHPDT LKFLAVNRGA NENLGYAEEE 
LLDMNILQLM PEFDRESFRA LLTPLQQGQK EKIIFDAKHR RKDGSLYPVE THLQLFGHGK 
GSICVAFILD LTERKKMEEK LREQGEFLRS LLAALPVGIF IIDPVSHRIE KVNLEAAAMI 
GAAPEEIEGR SCWEFFIQSA GSCPITASNE EVDRSERLLR RKDGLEILVL KTVKRVRTDS 
GEKLVETFID ISERKHLEEE LYRLSITDPL TGAYNRRYFL EMLEREVERI RRTGNPFSLI 
MFDLDHFKSI NDHFGHAAGD RVDSGGRAGI IESRAGV