Gene Moth_2289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2289
Symbol	argJ
ID	3831321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2401323
End bp	2402540
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	64%
IMG OID	637830209
Product	bifunctional ornithine acetyltransferase/N-acetylglutamate synthase protein
Protein accession	YP_431119
Protein GI	83591110
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1364] N-acetylglutamate synthase (N-acetylornithine aminotransferase)
TIGRFAM ID	[TIGR00120] glutamate N-acetyltransferase/amino-acid acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.630289
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAG ACTTCCAGCC GGTTGCCGGC GGCATCACCG CCCCGCGGGG TTTTGTCGCC 
GCCGGCATTC ATGCCGGTTT GAAAAAGGAA AAATTGGACC TGGCTCTGAT TGTGAGCGAG 
GTGCCGGCGA CGGCGGCGGC CGTCTATACC CGCAACCGGG TCAAGGCGGC GCCCCTGCGG 
GTGACGGCGG AACACCTCAA GGCCGGCCTG GCCCGGGCCA TTGTCGCCAA CAGCGGCTAT 
GCCAACGCCT GTACCGGGGA GCGGGGTTAC CGGGACGCCC GGGAGATGGC GGTAGTCACG 
GCCGGAGCCG TCGGTTGCGA ACCGTGGCAG GTGGTGGTGG CCTCCACCGG CGTCATCGGC 
GTGCCCCTGC CTATGGATAA AGTCACCGCC GGCATCCAGG CCGCTGCCGC CCGGCTGGCG 
GTGGAGGGAG GCAGAGATGC GGCGGCAGCC ATCATGACCA CCGATACCCG GATCAAAGAG 
ATCGCCATCC AGTTGCCCCT GGGGGGAGAG ACGGTAACTA TTGCCGGCAT CGCCAAGGGG 
TCGGGCATGA TCCACCCCAA TATGGGCACC ATGCTCTGCT TCCTGACCAC CGACGCTGCC 
ATCGAACAGG AGGATCTGGA ACAGGCCCTG AGGGTAGTGG TGGATCGGAC CTTTAATATG 
GTGACCGTGG ACGGCGACAC CAGCACCAAC GACATGGCAG TCATCCTGGC CAACGGCTGC 
GCCGGCAACG CCCCCTTGAC CATTGAAGAG CATGCCGCCT TCCGGTCCGG GTTGGAGTAT 
GTCTGTCGCT ACCTGGCCCG CCTCATCGCC CGTGACGGGG AAGGGGCCAG TAAACTGATA 
ACCGTTGAGG TTTATGGCGC GGCCAGCGAG GTCGAGGCCC GCCAGGTGGC CCGGTCCGTA 
GCCGGTTCCA ACCTGGTCAA GAGTGCCATC TTCGGCGCCG ACGCCAACTG GGGCCGTATC 
ATCTGTGCCG CCGGTTACTC CGGTGCTGAA ATCGACCCGG ATAAGATAGA CATCTACCTG 
GAAAGCCACG CCGGCCGCGA GCAAATGGCC GCCGGTGGCG AGCCCCTGCC CTTCAGCGAA 
GCAAAGGCGG CGGCCATTCT GGCGGAAGAG GAGATTACCA TCATCCTGGA TCTGAACCGG 
GGCCGCGCCG CGGCTACAGC CTGGGGCTGC GACCTTACTT ATGATTATGT AAAGATTAAT 
GCCTCTTACC GGACTTGA

Protein sequence

MTQDFQPVAG GITAPRGFVA AGIHAGLKKE KLDLALIVSE VPATAAAVYT RNRVKAAPLR 
VTAEHLKAGL ARAIVANSGY ANACTGERGY RDAREMAVVT AGAVGCEPWQ VVVASTGVIG 
VPLPMDKVTA GIQAAAARLA VEGGRDAAAA IMTTDTRIKE IAIQLPLGGE TVTIAGIAKG 
SGMIHPNMGT MLCFLTTDAA IEQEDLEQAL RVVVDRTFNM VTVDGDTSTN DMAVILANGC 
AGNAPLTIEE HAAFRSGLEY VCRYLARLIA RDGEGASKLI TVEVYGAASE VEARQVARSV 
AGSNLVKSAI FGADANWGRI ICAAGYSGAE IDPDKIDIYL ESHAGREQMA AGGEPLPFSE 
AKAAAILAEE EITIILDLNR GRAAATAWGC DLTYDYVKIN ASYRT