Gene Moth_0076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0076
Symbol
ID	3832685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	76460
End bp	77428
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	58%
IMG OID	637828008
Product	ribose-phosphate pyrophosphokinase
Protein accession	YP_428958
Protein GI	83588949
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0462] Phosphoribosylpyrophosphate synthetase
TIGRFAM ID	[TIGR01251] ribose-phosphate pyrophosphokinase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGAGGTTA TAAAAAAGCA AATGGAAACC GAGAGCGGAC GCCTGAAGAT CTTCACCTGC 
AACGCCAACC CCAAACTGGC CGAGGAAATC GGCGCCTACC TGGGTGTGCC CCTGGGAGCG 
GCCAAGGTAA AACGCTTTAG CGATGGGGAA ATAAGCGTCG TTATTGACGA GAGCGTGCGG 
GGGGAGGATG TTTTCGTCAT CCAGCCCACC TGTGAACCCG TCAATGACAA TCTGATGGAA 
CTCTTGATCA TGATCGATGC CCTGCGCCGG GCTTCCGCCA GGCGGATTAC GGCCGTCATA 
CCCTACTATG GCTACGCCCG CCAGGAGCGC AAGACCAGGG CCCGGGACCC TATCTCCGCC 
AAGCTGGTGG CCAATCTCAT TACCGCCGCA GGCGCCCACC GGGTCCTGAC CATGGACCTG 
CACGCGGCGG CCATCCAGGG ATTTTTTGAT ATTCCGGTAG ATCACCTGAC GGCAGTCCCC 
ATCCTGGCCG ATTACTTTAA CAGCAAGGGG TTTGAAAAGG CGGTGATTGT TTCCCCGGAC 
CTGGGGGGCG TGACCAGGGC GCGTAACTTC GCCGAGCGCA TAGGCGCTGA GATCGCCATT 
ATTGACAAGC GGCGGCCGGC GCCCAACGTC GCTGAGATCA TGAACCTCAT CGGCGATGTG 
AAAAATAAAA CGGTCATCAT GATTGATGAC CTCATCGACA CCGCCGGGAC CATCTGCCTA 
GGAGCTAAAG CCCTGATGGA GCAGGGCGCC TGCGCCGTTT ATGCCTGTTG TACCCATCCG 
GTCCTATCCG GACCGGCCCG GGAACGCCTG ATGGCCTCTC CCCTGCAGGA GGTAGTTGTC 
TGCAATACCA TTCCTGTCCC GGAGGGGAAA GAAATACCCA AGCTGCATCG CCTCTCCGTA 
GCTCCCCTCC TGGGGGAAGC CATTATTCGC ATCCACGAAG ACCTCTCGGT CAGTAAACTT 
TTCGATTAA

Protein sequence

MEVIKKQMET ESGRLKIFTC NANPKLAEEI GAYLGVPLGA AKVKRFSDGE ISVVIDESVR 
GEDVFVIQPT CEPVNDNLME LLIMIDALRR ASARRITAVI PYYGYARQER KTRARDPISA 
KLVANLITAA GAHRVLTMDL HAAAIQGFFD IPVDHLTAVP ILADYFNSKG FEKAVIVSPD 
LGGVTRARNF AERIGAEIAI IDKRRPAPNV AEIMNLIGDV KNKTVIMIDD LIDTAGTICL 
GAKALMEQGA CAVYACCTHP VLSGPARERL MASPLQEVVV CNTIPVPEGK EIPKLHRLSV 
APLLGEAIIR IHEDLSVSKL FD