Gene Mbar_A2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A2003
Symbol	argJ
ID	3627939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	+
Start bp	2526304
End bp	2527491
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	46%
IMG OID	637700881
Product	bifunctional ornithine acetyltransferase/N-acetylglutamate synthase protein
Protein accession	YP_305517
Protein GI	73669502
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1364] N-acetylglutamate synthase (N-acetylornithine aminotransferase)
TIGRFAM ID	[TIGR00120] glutamate N-acetyltransferase/amino-acid acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.262149
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGAAA TCGAAGGTGG AATCTGTGCA GTAAAAGGCG TATCTGCAAA CGGAATTAAA 
GCCGGAAAAC TGGGATTGAC TGTTATTCTT GCAAAGGGGC CGGCAGCAGG CGTTTTTACA 
AAAAATAAGG TCACAGCAGC TCCGGTTACC CTTAGTAAGG GAGTAATCGA GACTCATCAC 
CGTCTTTCGG GATTAATTGT AAATAGCGGA AATGCTAACG CCTTTACAGG TGATGACGGC 
TTTCTGGATG CTATGGAAAT GGCATCCGTA CTTGCCCAGA AACTTGATCT TGAAGCTGAC 
ACGGTTGCAG TTGCCTCGAC AGGGGTAATT GGCAGAAGGC TTGATGTTTC CTTAATCACG 
GAACATCTTC CTGAAGTCCT CAATGGTCTG GGCAGTTCTC CTGAGTGCAG CCGTGAAGCT 
GCAAAAGCAA TGATGACTAC GGATAGAGTC GTAAAAGAAG TAGCTATTGA GATGGACTGC 
GGGATCAGGA TAGGAGCCAT TGCCAAAGGT TCGGGGATGA TCGAGCCCAA TATGGGAACT 
ATGCTCTGTT TTGCATATAC CGATGCGAAA GTGCCTGCCG ACGTCCTGGA TGCTGCTCTC 
AGAATAGCAG TGGATAAAAC TTTCAATATG GTTGTGGTGG ACGGGGATAC AAGTACAAAC 
GACATGGTAC TCCTTACTTC CACCTGCAAG TCTGGAGTCA AGCCCTGTAT GGACTGTCTG 
GATGACTTTG AGGAGGGGCT GATTTACGTC TTCACCGAGC TTGCCAAGAA AATGGCAAAA 
GATGGAGAAG GTGCTACAAA ACTTATTGAA GCTAGGGTAG TTGGCGCAAA AACACACGAG 
GACGCTAAAC TTGCTGCAAA GGCAATTGTA CGTTCTCCTC TGGTTAAGTC TGCAATTTTC 
GGAAAGGACC CCAACTGGGG AAGGGTTGTA GCCGCTGCAG GCTACTCAGG TTCGGAACTT 
GAACAGGAAA GGCTTGCTCT CTCTTTTTCA GGAGGAGGAG AAGAGGTTGA ACTTGTAAAT 
TCCGGCGAGA TTTCCAGTTC TTCGGATCTA GAGCTTTTGA AAAAAATAAT GGCAAATGAA 
GAAATTGTCA TTACCCTTGA CCTTAATCTG GGAAAGGAAC AGGCAATAGC CTGGGGTTGC 
GATCTGACCT ATGATTATGT CAGGATTAAC TCTGAATATA CGACTTAA

Protein sequence

MKEIEGGICA VKGVSANGIK AGKLGLTVIL AKGPAAGVFT KNKVTAAPVT LSKGVIETHH 
RLSGLIVNSG NANAFTGDDG FLDAMEMASV LAQKLDLEAD TVAVASTGVI GRRLDVSLIT 
EHLPEVLNGL GSSPECSREA AKAMMTTDRV VKEVAIEMDC GIRIGAIAKG SGMIEPNMGT 
MLCFAYTDAK VPADVLDAAL RIAVDKTFNM VVVDGDTSTN DMVLLTSTCK SGVKPCMDCL 
DDFEEGLIYV FTELAKKMAK DGEGATKLIE ARVVGAKTHE DAKLAAKAIV RSPLVKSAIF 
GKDPNWGRVV AAAGYSGSEL EQERLALSFS GGGEEVELVN SGEISSSSDL ELLKKIMANE 
EIVITLDLNL GKEQAIAWGC DLTYDYVRIN SEYTT