Gene Moth_1133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1133
Symbol
ID	3833231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1161728
End bp	1162861
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	54%
IMG OID	637829063
Product	1,2-diacylglycerol 3-glucosyltransferase
Protein accession	YP_429990
Protein GI	83589981
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCATATTG GTATATTTAC CGATAGCTAC CTGCCCTATA CGAGTGGTGT CGTCAGATCG 
GTAGTTACCT TCAGCAGGGA ACTCCGGGCC CTGGGACACA GGGTGGTAAT CTTTGCCCCA 
GCTTATGGTC ACCATGATCC TGAAAGGGAT ATCTACCGTT TTCGTTCCTT CAGGGCGCCG 
ACCTTTAAAG AGTTTGCCCT AGCCATCCCG GTAGCGCCGG GCCTTACCAA TACCTTACGA 
CAGCTGGGAA TCGATTTGAT CCACGTACAT TCCCCCTTTT TGATGGGCCA GTTGGGGGTC 
AGAATGGCCC GCCGCTTGGG TCTGCCCCTG GTAGCTACTT ATCACACCCT TTATGAGGAA 
TATATCCATT ACTTTCCCCT GGCTCCCGGG CTCCTGCGCC GGGTTGTCCG GAATTATACT 
CTATCCTTTT ACAACGGCTG CCGGCTGGTA ATTACCCCTA CCGATACTAT AGCACGTTAC 
CTGCAGGAAA ATGGGCTCAA AGTACCAGTT GTTAGCATTC CCACAGGAAT AGAGCTGGAA 
CGTTTTCAGG ATGTTGACAC TGGCTGGTTG CGCCGTCACC TGCAGCTTCC AAGGGAAGAG 
ATCATCCTTC TCCATGTAGG CCGTTTGGGC AAAGAAAAAA ATATCTCTTT TGTCCTCCAG 
GCCTTTGCTA AAATCCATGG CGAGGTACCG GCGACCCGTC TGGTCCTGGT AGGTAGTGGC 
CCCTTAAAGG GGGAGTTAGA GCACCAGGCC CATTCCCTGG GAATAGCCCA AGCGGTTACC 
TTTGCCGGTT CCTTTTCTTT TGAACAAATG CCAGCCGTCT ATGCCGGCGC TGATTTATTT 
GTCTTTGCCT CCGTTACCGA GACCCAGGGC CTGGTAGTGG GGGAGGCTAA AGCTGCCGGT 
TTACCGGTAG TTGCCGTACG GGCCCGGGGA GTGCAGGAAA TGGTAGAAGA CGGCCGGGAT 
GGTTTCTTAG TCCCTTTAGA TATTGAGACC TTCAGTGCCC GTATAAGACA ACTGGTCCTT 
GATGCCGGCC TCCGTAAGGA AATGGGTCGG CAGGGACGCC TTAATGCTAG TTCCCTTGCG 
GCGGCGACTA TGGCCCGCCG CCTGGCAGAC CAATACCAGG AGTTACTTGG ATAG

Protein sequence

MHIGIFTDSY LPYTSGVVRS VVTFSRELRA LGHRVVIFAP AYGHHDPERD IYRFRSFRAP 
TFKEFALAIP VAPGLTNTLR QLGIDLIHVH SPFLMGQLGV RMARRLGLPL VATYHTLYEE 
YIHYFPLAPG LLRRVVRNYT LSFYNGCRLV ITPTDTIARY LQENGLKVPV VSIPTGIELE 
RFQDVDTGWL RRHLQLPREE IILLHVGRLG KEKNISFVLQ AFAKIHGEVP ATRLVLVGSG 
PLKGELEHQA HSLGIAQAVT FAGSFSFEQM PAVYAGADLF VFASVTETQG LVVGEAKAAG 
LPVVAVRARG VQEMVEDGRD GFLVPLDIET FSARIRQLVL DAGLRKEMGR QGRLNASSLA 
AATMARRLAD QYQELLG