Gene Moth_1150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1150
Symbol
ID	3833118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1181109
End bp	1182221
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	57%
IMG OID	637829081
Product	hypothetical protein
Protein accession	YP_430007
Protein GI	83589998
COG category	[S] Function unknown
COG ID	[COG3581] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAAAGG TATCCTTTGC CCACATGGGA TATTCCTACC TGGGTTTTAA ACAGCTGGTG 
GAGGACATGG GCTTCGAAGC CATCGTCCCG GCCAACCCAA GTCCGGCCAC CCTGGACCTG 
GGGGTCCAGT ACGCACCCGA GTTTGCCTGT ATCCCCTTTA AAACCGTCCT GGGCACCTAC 
CTGGAGGTGT TGAACCGGGG GGCTGAGATG ATTATAACCT CGGGAGGGGT AGGACCGTGC 
CGGGCCGGCC TCTATGGCCT CCTCCACGAG AAGATCCTCC GCAACCTGGG CTATAACTTT 
GAGCTTTTTA TCTTCGATCC ACCCCTGACG GGCCTGGGGC CCTTCTTTTG GAAATTGCGG 
CGAGTACTCA AGGAAGCCCG CCTCTCGTGG TTGGCCTTTA TCGATGTCGT CCGCCGAGCC 
TGGGCCAAGC TAAAGCTCCT GGACGAACTG GAGCAAATGG CCACCGTCAC CCGTCCCTAT 
GAGATCAAAC GGGGGGCTAC CACCCGTGCC TTTAACCAGT GTCTGGAAAT CATCGACCGG 
GCCCGAAGCA GCAAGGAGAT AGCCGCTGCC AGGGAAGAAT GCCGGCAATT GCTCCAATCC 
GTGCCCCGGG ATGAAGAGCG CCGCCCTTTA AGGATCGGCA TCGTAGGCGA GATTTATGTC 
CTGCTCGAAC CCTTCATGAA CCTTGATATT GAAAAAACCC TGGGAGAAAT GGGGGTTATC 
ACCAAGCGCT CCATTTACCT GACCAACTAT ACCACCACCG ACGTCCTGGC CCATGGCACC 
GAGGACATTC GCCAGATAGC CCACCCCTAT CTCAACCAGT TTGTCGGCGG CCACGGCCAG 
AGCAGTGTAG GCGAAACTAT TCTCTACGCC AGAAACGGTT TCGACGGCGT CATCCAGCTG 
GCCCCCTTCA CCTGCATTCC GGAAATAGTG GCCAAGAGCA TCCTGCCCCG GGTGAGCCGT 
GATTTTAATA TACCTGTCCT AAGCCTGACC ATTGATGAGC AAACCGGCCG GGCCGGGGTG 
GAGACCCGGC TGGAAGCCTT TGTCGATCTT TTACGCCAGC GTCGCGAGCA AATGGAGGCA 
AGGAGTAATG CAGCCCTGTT ACCTGGGTAT TGA

Protein sequence

MKKVSFAHMG YSYLGFKQLV EDMGFEAIVP ANPSPATLDL GVQYAPEFAC IPFKTVLGTY 
LEVLNRGAEM IITSGGVGPC RAGLYGLLHE KILRNLGYNF ELFIFDPPLT GLGPFFWKLR 
RVLKEARLSW LAFIDVVRRA WAKLKLLDEL EQMATVTRPY EIKRGATTRA FNQCLEIIDR 
ARSSKEIAAA REECRQLLQS VPRDEERRPL RIGIVGEIYV LLEPFMNLDI EKTLGEMGVI 
TKRSIYLTNY TTTDVLAHGT EDIRQIAHPY LNQFVGGHGQ SSVGETILYA RNGFDGVIQL 
APFTCIPEIV AKSILPRVSR DFNIPVLSLT IDEQTGRAGV ETRLEAFVDL LRQRREQMEA 
RSNAALLPGY