Gene BAS4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4039
Symbol	argJ
ID	2850280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3975031
End bp	3976257
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	38%
IMG OID	637507276
Product	bifunctional ornithine acetyltransferase/N-acetylglutamate synthase protein
Protein accession	YP_030289
Protein GI	49187037
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1364] N-acetylglutamate synthase (N-acetylornithine aminotransferase)
TIGRFAM ID	[TIGR00120] glutamate N-acetyltransferase/amino-acid acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGATTA AAGTAGCGTC TATTACAAAA GTAGAAGATG GTTCGATTGT AACGCCAAAA 
GGTTTCTCGG CCATTGGCAC TGCAATTGGT CTGAAAAAGG GGAAAAAGGA TTTAGGGGCA 
ATCGTTTGTG ATGTACCGGC ATCATGTGCT GCTGTTTATA CAACAAATCA AATACAAGCA 
GCCCCGTTGC AAGTGACGAA GGATAGTATA ACGACTGAGG GGAAACTACA AGCTATTATC 
GTTAATAGTG GAAATGCAAA TGCTTGTACA GGAATGAAAG GGTTGCAAGA TGCTTACGAG 
ATGCGTGCAT TAGGGGCGGA ACATTTTGGA TTGAAAGAAA AGTATGTTGC AGTAGCTTCA 
ACAGGTGTAA TTGGTGTTCC GCTGCCGATG GATATAATCC GAAAGGGAAT TGTAACTCTT 
ATACCGGCGA AGGAAGAAAA TGGAGCTCAT TCTTTTTCTG AAGCAATTTT AACGACGGAT 
CTTATAACGA AAGAAACTTG CTATGAAATG ATTATTGATG GGAAGAAAGT GATGATTGCT 
GGTGTTGCGA AAGGTTCAGG GATGATTCAT CCAAATATGG CAACGATGCT AAGTTTTATT 
ACGACAGACG CTCGTATAGA GCATGACGTA TTGCAAACAG CATTATCACA AATAACGAAT 
CATACATTTA ATCAAATTAC AGTAGATGGA GATACTTCTA CGAATGATAT GGTCATCGCT 
ATGGCAAGTG GATTATCAGA AACGAAACCA ATCGATATGG AACATGCAGA TTGGGAAACT 
TTCGTATTTG CTTTACAGAA GGTATGTGAA GATTTAGCCA AAAAAATTGC ACAAGATGGT 
GAAGGTGCTA CGAAGTTAAT AGAAGTAAAT GTGCTAGGAG TTCAAACAAA TGAAGAGGCA 
AAGAAAATCG CAAAGCAAAT AGTCGGTTCA AGTCTTGTGA AAACAGCAAT ACATGGTGAA 
GACCCAAATT GGGGGCGAAT TATTAGCAGT ATTGGACAAA GTGAAGTAGC AATTAATCCG 
AATACAATTG ACATTACTCT TCAATCTATA TCGGTATTAA AAAATAGTGA GCCTCAAACA 
TTTTCTGAAG AAGAAATGAA AGAGAGATTA CAAGAAGATG AAATAGTCAT TAATGTGTAT 
TTACATTTAG GTAAAGAGAC AGGATCAGCT TGGGGCTGTG ACTTAAGCTA TGAATATGTG 
AAAATAAACG CTTGTTATCG TACATAA

Protein sequence

MMIKVASITK VEDGSIVTPK GFSAIGTAIG LKKGKKDLGA IVCDVPASCA AVYTTNQIQA 
APLQVTKDSI TTEGKLQAII VNSGNANACT GMKGLQDAYE MRALGAEHFG LKEKYVAVAS 
TGVIGVPLPM DIIRKGIVTL IPAKEENGAH SFSEAILTTD LITKETCYEM IIDGKKVMIA 
GVAKGSGMIH PNMATMLSFI TTDARIEHDV LQTALSQITN HTFNQITVDG DTSTNDMVIA 
MASGLSETKP IDMEHADWET FVFALQKVCE DLAKKIAQDG EGATKLIEVN VLGVQTNEEA 
KKIAKQIVGS SLVKTAIHGE DPNWGRIISS IGQSEVAINP NTIDITLQSI SVLKNSEPQT 
FSEEEMKERL QEDEIVINVY LHLGKETGSA WGCDLSYEYV KINACYRT