Gene Moth_2167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2167
Symbol
ID	3833016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2267151
End bp	2268272
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	61%
IMG OID	637830089
Product	alanine racemase
Protein accession	YP_430999
Protein GI	83590990
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0787] Alanine racemase
TIGRFAM ID	[TIGR00492] alanine racemase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000000196511
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000176162
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

TTGTCGCGGC CGGTTTGGGC CGAGATTGAC CTGGAAGCAG TGGCCCGCAA TGTCCGGGCC 
ATTAAAAAGA TACTGGCGCC GCAAACAGAA ATTATGGCCA TCGTTAAAGC CAATGCCTAC 
GGCCACGGGG CCGGGCCGGT GGCCAGGACA GCCCTGGCTA ACGGCGTCAG CTGGCTGGGT 
GTAGCTACCC TGGGTGAAGC CCTGGACCTG CGGCGGGAAG GAATTACTGC CCCGCTTCTT 
ATTTTGGGCT ATACCCCGCC GGAGGATGCC GGGCGGGTGG TAGAGGCCGA TATTTCCCAG 
ACGGTCTTCA GCGTTGACCA GGCCCGGGCC CTGAACGCCG CCGCCGCCGC TGTAGGTACC 
AGGGCCCGCC TGCATTTAAA GATCGATACC GGTATGGGCC GGCTGGGTTT TCTGCCCCGG 
GAGGCGGTGA CTGCGGCCCG GGCTATAGCG GATCTGCCCC ATGTCACCCT GGAAGGTATT 
TTCACCCACT TTGCCGCGTC CGATGCCGCT GATAAGACCT ACACCCAGCG GCAGCTGGGC 
TTATTTCAAC AAGTGATTGC CGAACTGGAG AAACAGGGCA TAACCTTTCC CTGGCGCCAT 
GCAGCCAACA GCGGGGCCAT CATCGATCTC CCCGGGACCC ACTTTAACCT GGTCCGCGCC 
GGGATTATCC TTTATGGCCA CTATCCCTCG CCGGAGGTCC AGCGGAAGAG GCTGGCGTTA 
ACGCCGGTGA TGACGCTAAA AACCAGGGTA GTCCTGGTAA AGGAGGTGCC GGCCGGGTCG 
TATATCAGCT ATGGCTGCAC CTACCGCACC CCCGGTCCGG CCAGGATTGC CACCCTCCCG 
GTGGGTTATG CCGACGGCTA TTCCCGTCTC CTTTCCAACC GGGCCGAGGT CCTGGTCCGC 
GGTCGCCGGG CACCGATCGT CGGCCGTATC TGTATGGACC AGTGCATGAT AGATGTTACA 
GCTATACCGG AAGTCCGGGT TGGTGATGAA GTAGTCCTCT TCGGTCGCCA GGGAGGACAG 
ACTCTGACGG TAGAAGAGGT GGCGGCCTGG ATGGGGACCA TTAACTACGA AATCCTGTGC 
CTGATATCCA AGCGCGTGCC ACGTGTATAT CTTCATAGTT AA

Protein sequence

MSRPVWAEID LEAVARNVRA IKKILAPQTE IMAIVKANAY GHGAGPVART ALANGVSWLG 
VATLGEALDL RREGITAPLL ILGYTPPEDA GRVVEADISQ TVFSVDQARA LNAAAAAVGT 
RARLHLKIDT GMGRLGFLPR EAVTAARAIA DLPHVTLEGI FTHFAASDAA DKTYTQRQLG 
LFQQVIAELE KQGITFPWRH AANSGAIIDL PGTHFNLVRA GIILYGHYPS PEVQRKRLAL 
TPVMTLKTRV VLVKEVPAGS YISYGCTYRT PGPARIATLP VGYADGYSRL LSNRAEVLVR 
GRRAPIVGRI CMDQCMIDVT AIPEVRVGDE VVLFGRQGGQ TLTVEEVAAW MGTINYEILC 
LISKRVPRVY LHS