Gene Moth_2290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2290
Symbol
ID	3831322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2402588
End bp	2403628
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	61%
IMG OID	637830210
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_431120
Protein GI	83591111
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.587268
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATTAAAG CCGGAATTAT CGGTGCTACC GGTTACACGG GAGCCGAACT GGTCCGCATT 
TTGAGCCGGC ACCCGGAAGT AGAGCTGGTA GCCCTTACCT CACGCAGTTA CGCCGGGGAA 
GGGATGGCCG GCGTTTACCC GTCCCTTACC GGCTATACCA ACCTCACCTG TGAGAATTTG 
ACTCCCGATG AGGTTATGGA CCGGGCGGAA GTTATCTTTA TCGCCCTGCC CCACGGCCAC 
GCCGTCCCGG TAGCCACCCG AGCCAGGGAA CGGGGGATCA AAGTAATTGA CCTGGGCGCC 
GACTGGCGCT TCCGTAACGC CAGGACTTAC GAAGAATGGT ATAAAATCCA GCACGGCAAC 
CACGAGCTGG CGGCCCGGGC CGTCTACGGG CTGCCGGAGA TTCACCGGGA GGCCATCCGT 
AGCGCCGGCC TGGTGGCCAA TCCCGGTTGT TACCCCACCA GCGCCATCCT GGGCCTGGCT 
CCCCTGCTTA AGGGGGGGTA CATTGACCCG GCGACCATCA TAATCGACGC CAAGTCAGGG 
GTTTCCGGGG CCGGCCGGGA GGCCAGGGTT ACCAGCCTCT TTGTTGAGTG CAACGAAAGC 
ATTAATCCCT ACGGCGTCGC CAGTCACCGT CATACCCCGG AGATCGAACA GGAACTCAGC 
GCCCTGGCCG GCAAAGAGGT TAAAGTAACC TTTACCCCCC ACCTGCTTCC CATCAGCAGG 
GGGATCTTGA GTACCATGTA CGCCACCCTG GTACGGCCGG CATCGACGGA GGAACTGCGA 
AGGGTATATG AAAAATTTTA TGCCGGTGAG CCCTTCGTCC ACCTCCTACC CCCCGGCCAG 
TGGCCCCACA CCCGCTGGGT ATATGGCAGC AACAACTGCC ACCTTAATCT CGCCGTAGAT 
ACCCGCACCG GCCGGGTGGT GGTGGCCAGC GCCATCGACA ACCTGACCAA AGGCGCTTCC 
GGCCAGGCGG TGCAGAACCT CAACCTTATG TGCGGTTTCC CGGAGACCAT GGCCCTGGAA 
GTACCAGGAT TGTGTCCATA A

Protein sequence

MIKAGIIGAT GYTGAELVRI LSRHPEVELV ALTSRSYAGE GMAGVYPSLT GYTNLTCENL 
TPDEVMDRAE VIFIALPHGH AVPVATRARE RGIKVIDLGA DWRFRNARTY EEWYKIQHGN 
HELAARAVYG LPEIHREAIR SAGLVANPGC YPTSAILGLA PLLKGGYIDP ATIIIDAKSG 
VSGAGREARV TSLFVECNES INPYGVASHR HTPEIEQELS ALAGKEVKVT FTPHLLPISR 
GILSTMYATL VRPASTEELR RVYEKFYAGE PFVHLLPPGQ WPHTRWVYGS NNCHLNLAVD 
TRTGRVVVAS AIDNLTKGAS GQAVQNLNLM CGFPETMALE VPGLCP