Gene Moth_0563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0563
Symbol	proA
ID	3831463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	585769
End bp	587025
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	60%
IMG OID	637828504
Product	gamma-glutamyl phosphate reductase
Protein accession	YP_429436
Protein GI	83589427
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0014] Gamma-glutamyl phosphate reductase
TIGRFAM ID	[TIGR00407] gamma-glutamyl phosphate reductase

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATGTAG CCCTGGAGGT GCAGACCAAA GGCCAGAGAG CCAGAGAAGC CGCCCGGATC 
CTGGCCGGCC TGGGAACCAG CAAGAAAAAC GAGGCCTTAC TGGCTATGGC CCGGGCCCTG 
GAGGAAGAAC AGGAAGCCAT CCTGGCCGCC AACGCCAGGG ACATGGTCGC CGGAAAAGAA 
AAGGGCCTTT CCCGGGCCCT CCTGGACCGC CTTCTCCTCA ATGAGAAGCG CATCAGGGAT 
ATGGCTGCCG GCCTGCGGGA ACTGGCTGCT CTGCCGGACC CCGTGGGCGA GGTGACCTCC 
ATGTGGACCC GGCCCAACGG CCTGCAGATT GGCCGGGTAC GGGTGCCCCT GGGGGTTATC 
GGTATTATTT ACGAGGCTCG GCCCAATGTC ACCGTCGATG CCGCCGGGCT CTGTCTAAAA 
ACCGGCAATG CCGTCATCCT GCGGGGCGGG TCCGAGGCCT TTTATTCCAA CCAGGCCCTA 
ACCCGTGTCA TCAGCCGGGC GGCAACGGCT GCCGGAGCGC CGGAGGGGGC CATCCAATTA 
ATCGAGACCA CCGACCGGGA AGCTGTAAAT CTTTTATTGC GGGCCAATGA TTACCTGGAT 
GTTTTGATTC CCAGGGGCGG GGCCGGCCTG ATCCGGACCG TGGTAGAAAA CGCCACCGTG 
CCCGTCATTG AAACCGGTGT GGGGAACTGC CACGTCTATG TCGACGCCGA AGCCGACCTG 
GATATGGCCC AGAGGATTGT CATTAACGCC AAGACCCAGC GTCCGGGTGT TTGTAACGCC 
ATGGAAACTC TGCTGGTCCA TGAAAAGGTG GCGGACTCCT TTCTCCCCTC CCTGGCCGCG 
GCTTTAAAGG AAAAGGGAGT CACCATCCGG GGCTGTGAAC GTACCCGGGC CATCATACCC 
TGGGCGGAAG TTGCCACCGA AACCGACTGG GCCACTGAGT ACCTGGATCT CATCCTGGCC 
ATAAGGGTTG TCGACTCCCT TGAGAGCGCC CTGGAGCATA TCCATCGTTA CGGCACCAAA 
CACTCGGAAG CCATTGTTAC GACCAACTAC CAGACGGCCC GGGAATTCCT GGCCCGGGTG 
GATGCGGCGG CCGTATACGT CAATGCCTCA ACGCGTTTTA CCGATGGCTA CGAGTTCGGT 
TTCGGGGCCG AGATTGGTAT CAGTACCCAG AAACTCCATG CCCGTGGTCC CATGGGGCCG 
GAACAACTAA CAACTTTTAA GTATATTATT TTTGGTAGTG GACAGATCCG CCAGTAA

Protein sequence

MNVALEVQTK GQRAREAARI LAGLGTSKKN EALLAMARAL EEEQEAILAA NARDMVAGKE 
KGLSRALLDR LLLNEKRIRD MAAGLRELAA LPDPVGEVTS MWTRPNGLQI GRVRVPLGVI 
GIIYEARPNV TVDAAGLCLK TGNAVILRGG SEAFYSNQAL TRVISRAATA AGAPEGAIQL 
IETTDREAVN LLLRANDYLD VLIPRGGAGL IRTVVENATV PVIETGVGNC HVYVDAEADL 
DMAQRIVINA KTQRPGVCNA METLLVHEKV ADSFLPSLAA ALKEKGVTIR GCERTRAIIP 
WAEVATETDW ATEYLDLILA IRVVDSLESA LEHIHRYGTK HSEAIVTTNY QTAREFLARV 
DAAAVYVNAS TRFTDGYEFG FGAEIGISTQ KLHARGPMGP EQLTTFKYII FGSGQIRQ