Gene Moth_1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1140
Symbol	ddl
ID	3833238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1170723
End bp	1171652
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	58%
IMG OID	637829070
Product	D-alanine--D-alanine ligase
Protein accession	YP_429997
Protein GI	83589988
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1181] D-alanine-D-alanine ligase and related ATP-grasp enzymes
TIGRFAM ID	[TIGR01205] D-alanine--D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.000909084
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG CCGTCCTAAT GGGTGGCCCC TCTTCCGAAA GGGAGATTTC TTTAAAAAGC 
GGGTCTGCCG TTGCCGCCGC CCTGTCCGGC CTGGGTCACC AGGTGATAAC TATAGATCTG 
AACAGGGAGG TAGTAGCCAG GTTAAAAAAC TTCGCCCCCG ACGTTGTCTT TAACGCCCTC 
CACGGTAAAC CCGGGGAAGA CGGTTCTGTC CAGGGCCTGC TGGAGGTCCT GGGCCTGCCT 
TATACTGGCA GCCGCGTCCT GGCCAGTGCC ATAACAATGG ATAAAATTAT GACTAAACGC 
GTCCTGCTCC AGGCCGGTAT CCCCACCCCC AAATTTTTAG CCTGGACCGG TGCTGAATAC 
GCCACCGGCA AGAAAGAGAT AAAGGCGGCG ATATTAAAGG AACTAGGTTT GCCGGTGGTC 
ATTAAGGCCC CGACCCAGGG TTCCACCATT GGCACCTTTA TCGTCAGGGA AGAAGGGGAA 
CTGGAGCCGG CCATAGCCGG GGCCCTGAAA TATGACCTTT CCTTTATGGC CGAAGCCTAC 
CTGGCAGGCC CGGAGATCAC GGCTGCCGTC CTGGGGAACC GGAAACCCCA GGTCTTGCCT 
TTAATAGAAA TCGTCTCCCA TACCGGCTTT TATGATTATC AGGCCAAGTA CACCCCCGGC 
CTGAGTGATC ATATTATCCC GCCCCGATTG CCGGATGACG TCCTGGCAGC AGCTACCTCC 
CTGGCCGGCC GGACCTATGC CCTCCTGGGT TGCCGCGGTT TCGCCCGGGT GGATTTTATC 
GTGGCGGGGG GCCGGGAGCC CCAGGTCATT GAAGTCAATA GCGTCCCGGG GATGACCGCC 
ACCAGCCTGG TACCGGACGC CGCCCGGGCG GCAGGATTGG ATTTTCCGGA TCTGGTCCAG 
AAAATCGTCG ACCTGGCCCT GGAGCCTTGA

Protein sequence

MKIAVLMGGP SSEREISLKS GSAVAAALSG LGHQVITIDL NREVVARLKN FAPDVVFNAL 
HGKPGEDGSV QGLLEVLGLP YTGSRVLASA ITMDKIMTKR VLLQAGIPTP KFLAWTGAEY 
ATGKKEIKAA ILKELGLPVV IKAPTQGSTI GTFIVREEGE LEPAIAGALK YDLSFMAEAY 
LAGPEITAAV LGNRKPQVLP LIEIVSHTGF YDYQAKYTPG LSDHIIPPRL PDDVLAAATS 
LAGRTYALLG CRGFARVDFI VAGGREPQVI EVNSVPGMTA TSLVPDAARA AGLDFPDLVQ 
KIVDLALEP