Gene GSU2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2049
Symbol	argJ
ID	2686046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2248053
End bp	2249234
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	63%
IMG OID	637126740
Product	bifunctional ornithine acetyltransferase/N-acetylglutamate synthase protein
Protein accession	NP_953098
Protein GI	39997147
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1364] N-acetylglutamate synthase (N-acetylornithine aminotransferase)
TIGRFAM ID	[TIGR00120] glutamate N-acetyltransferase/amino-acid acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000663169
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTCA AGGGATTTCG GTTCTCGGCC GTTGAAGCGG CCATTAAGAA GCCGGGCCGT 
CTGGACTTGG CCCTCATCTG CTCGGACGCG CCCGCTGCAG TTGCCGCGGT TTACACCACC 
AACAAGGTGA AGGCAGCGCC GGTGCTTCTG GACATGGAGC GAACCACGAG CGGCACCTGC 
CGCGCGGTGG TGGTCAACAG CGGCAACGCC AATGCCTGCA CCGGAGACCG GGGGATGGAG 
GACGCGCGGG AAACCACCAG CCTCGTGGCC GAACGGATTG GTGCATCTGA GCACGAGGTG 
CTCGTATGCT CTACCGGCGT GATCGGCGTG CCGCTCCCCA TGGAGCGGAT CAGGGGAGGG 
ATTCCTTCCC TCGTGGCCGG GCTGGGTTCA GCGACCCTCG ATCAGATCGC CGCGGCCATC 
ATGACAACCG ACACCTTCCC GAAACTGGAG GCGCGTACCG GGACTGCGGG AGGCGTCGGG 
TACACCATCG CCGGTATCGC CAAGGGCGCC GGCATGATCA TGCCGAACAT GGCCACCATG 
CTCGCCTTTG TCGTCACCGA TGCCGCAGTG GACCCCCAGT GGCTCGACCG GGTTTTCCGC 
CGCGCCAACG ATACCTCTTT CAATGCCATC ACCGTGGACG GCGACATGTC CACCAACGAT 
ACCGCCATCA TTATGGCCAA CGGAGCAGCC GGCAACCCGG TTCTGTCCGA GGGGAGCGAG 
GGCGCCGCGG AATTTGCTGT TCTTTTGGAG GAGGTGCTCC TCTCTCTGGC CAAGCTGATC 
GTCAAGGATG GAGAAGGGGC CACCAAGTTT GTGGAAGTAA CCGTGAAGGG TGCCCGCTCC 
GATGCCGACG CCAAGCGGGC CGCCATGGCC GTCGCCAATT CATGCCTGGT GAAGACCGCC 
TTTTTCGGGC AGGATGCCAA CTGGGGGCGG ATTTTCGCGG CGGTGGGCTA CTCCGGCGCG 
GACGTGGAAC CGGACCGTGC CGAGCTGTTT TTCGACGATG TCAGGATGGT ACAGGGTGGT 
GTTTTCGCAG GCGGCGACGC TGAGGCGCGG GGTACCGGGG TATTGCGGAA GAAGGAGTTC 
ACCGTTACTG TAGACCTGCA TCTGGGCGAC GGACGGGCAA CGGTTTACAC CTCGGACCTG 
TCCTACGACT ACGTCAAGAT CAACGCCGAT TACCGTACCT GA

Protein sequence

MNVKGFRFSA VEAAIKKPGR LDLALICSDA PAAVAAVYTT NKVKAAPVLL DMERTTSGTC 
RAVVVNSGNA NACTGDRGME DARETTSLVA ERIGASEHEV LVCSTGVIGV PLPMERIRGG 
IPSLVAGLGS ATLDQIAAAI MTTDTFPKLE ARTGTAGGVG YTIAGIAKGA GMIMPNMATM 
LAFVVTDAAV DPQWLDRVFR RANDTSFNAI TVDGDMSTND TAIIMANGAA GNPVLSEGSE 
GAAEFAVLLE EVLLSLAKLI VKDGEGATKF VEVTVKGARS DADAKRAAMA VANSCLVKTA 
FFGQDANWGR IFAAVGYSGA DVEPDRAELF FDDVRMVQGG VFAGGDAEAR GTGVLRKKEF 
TVTVDLHLGD GRATVYTSDL SYDYVKINAD YRT