Gene Moth_0210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0210
Symbol
ID	3831361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	205740
End bp	206831
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	64%
IMG OID	637828146
Product	hypothetical protein
Protein accession	YP_429088
Protein GI	83589079
COG category	[S] Function unknown
COG ID	[COG3535] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTCAA GGATAATCCT TGATAATGAG GTCGTGGAGG CGGCCGTCCT GGGAGGGGCC 
GTCCTGGGCG GAGGCGGGGG CGGCTCCATG GAAATGGGGC GCCAGGCCGC CCGCCTGGCG 
GTAGAACTCG GCAGTCCCGA ATTGATAACC CTGGATTCCC TCCCTGAGGA CGCCGTCCTC 
CTTACCGTTT CGGCTGTAGG CGCGCCGGCG GCCAGGACGG TCTATGTCAA GCCGGTGCAT 
TATATCCGTA CCGTGGAGTT ATTTCAAAAG TACACGGGCC AGGAGATCCG GGGCTTAATC 
ACCAATGAGT GCGGCGGCCT GGCTGCTGTC AACGGCTGGC TGCAGGCCGC CGCCCTGGGG 
ATACCGGTTG TCGATGCCCC CTGCAACGGC AGGGCCCACC CCACCGGGGT CATGGGCTCC 
ATGGGCCTGC ACCGGCTGTC CGGTTATGTT TCCCGGCAGG TGGCCGTTGG CGGCAACCCG 
CAAACCAATA GCTATGTGGA GGTTTTCGCC TCCGGGTCCC TGGAGACTGC CGCCGCCCTG 
GTCCGGCAGG CCTCGGTGCA GGCCGGCGGC ATGGTGGCCG TGGCCCGGAA CCCGGTTACC 
GCCGGTTATG CCAGGGAGAA TGCCGCCCCC GGAGCCATCG GCAGGTGTAT TGCCGTGGGC 
CGGACCATTA TCGAGAACCG GTCCAGGGGG CCCCTGCCGG TCATCGAAGG GGTGGCCGGG 
GTTTTACAGG GAGAGATTGC CTTTACAGGC CGGGTAGCCG CCGTCGACCT GGAAACGACC 
GGAGGTTTCG ACGTCGGCAG GGTGGTTGTC CGGGATGGTG ACAGGCTGGC AGAACTCACC 
TTCTGGAACG AGTATATGAC CCTGGAAATC GGCAGTGTGC GGAAAGGGAC CTTTCCTGAC 
CTGCTGGCCA CCATGGACCT GACCACCGGC CTGCCCTTAT CTTCGGCGGA GATCAAGGCC 
GGCCAGGAGA TAGCCATTCT ACACGTTCAC CGCGACCGGC TGATCCTGGG GCGGGGCATG 
AAGGCCCCCG AACTCTTCCA GGTGGTCGAA AAGGCCACCG GCAAAGAAGT AATCAAGTAT 
ATCTTCTCAT AG

Protein sequence

MGSRIILDNE VVEAAVLGGA VLGGGGGGSM EMGRQAARLA VELGSPELIT LDSLPEDAVL 
LTVSAVGAPA ARTVYVKPVH YIRTVELFQK YTGQEIRGLI TNECGGLAAV NGWLQAAALG 
IPVVDAPCNG RAHPTGVMGS MGLHRLSGYV SRQVAVGGNP QTNSYVEVFA SGSLETAAAL 
VRQASVQAGG MVAVARNPVT AGYARENAAP GAIGRCIAVG RTIIENRSRG PLPVIEGVAG 
VLQGEIAFTG RVAAVDLETT GGFDVGRVVV RDGDRLAELT FWNEYMTLEI GSVRKGTFPD 
LLATMDLTTG LPLSSAEIKA GQEIAILHVH RDRLILGRGM KAPELFQVVE KATGKEVIKY 
IFS