Gene BAS4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4040
Symbol	argC
ID	2848270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3976266
End bp	3977303
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	38%
IMG OID	637507277
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_030290
Protein GI	49187038
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTCG CGATTATTGG AGCAACTGGG TATGGAGGTA TTGAGTTAAT TCGGTTATTA 
GAACAACATC CATATTTTTC GATAGCATCT CTCCATTCTT TTTCACAAGT TGGCGAGTGT 
ATAACAAATG TATATCCGCA TTTTCAAAAT GTTCTTGTTC ATACGTTACA AGAAATTGAT 
GTGGAGGAAA TAGAGAAGGA AGCAGAAATT GTATTTTTAG CAACCCCAGC AGGAGTATCA 
GCAGAGTTAA CTCCCAAATT ATTAGCAGTA GGCTTAAAAG TAATTGACCT ATCTGGAGAC 
TTTCGTATGA AAGATCCTTT CATATATGAA CAGTGGTATA AAAGGGCAGC TGCAAAAGAA 
GGAGTCCTTA GGGAAGCTGT ATATGGGTTA AGTGAATGGA AAAGGTCCGA AATTCAAAAG 
GCAAATTTAA TTGCAAACCC GGGATGTTTT GCTACAGCTG CATTATTAGC GATATTACCG 
TTAGTTCGTA GCGGCATAAT TGAGGAAGAC TCAATTATTA TTGATGCGAA ATCAGGAGTA 
TCTGGAGCAG GCAAAACGCC AACAACGATG ACTCACTTTC CTGAGTTATA TGATAACTTG 
CGTATTTATA AAGTAAATGA GCATCAACAC ATTCCTGAGA TTGAGCAAAT GCTCGCGGAG 
TGGAATAGAG AAACGAAGCC AATCACGTTT AGTACACATT TAATACCGAT ATCACGTGGG 
ATTATGGTTA CACTGTATGC GAAAGTAAAG CGAGAAATGG AAATAGAACA ACTTCAACAA 
TTATATGAAG AAGCGTATGA ACAATCGGCT TTTATTCGAA TTCGCATGCA AGGAGAGTTT 
CCAAGTCCGA AAGAAGTGAG AGGCTCAAAT TATTGTGATA TGGGGATAGC TTACGATGAA 
AGAACAGGAA GAGTGACAAT TGTTTCTGTT ATAGACAATA TGATGAAAGG TGCGGCTGGT 
CAAGCGATTC AAAATGCAAA TATAGTAGCG GGACTAGAAG AAACGACAGG TTTACAACAT 
ATGCCGCTTT ATCTATAA

Protein sequence

MKVAIIGATG YGGIELIRLL EQHPYFSIAS LHSFSQVGEC ITNVYPHFQN VLVHTLQEID 
VEEIEKEAEI VFLATPAGVS AELTPKLLAV GLKVIDLSGD FRMKDPFIYE QWYKRAAAKE 
GVLREAVYGL SEWKRSEIQK ANLIANPGCF ATAALLAILP LVRSGIIEED SIIIDAKSGV 
SGAGKTPTTM THFPELYDNL RIYKVNEHQH IPEIEQMLAE WNRETKPITF STHLIPISRG 
IMVTLYAKVK REMEIEQLQQ LYEEAYEQSA FIRIRMQGEF PSPKEVRGSN YCDMGIAYDE 
RTGRVTIVSV IDNMMKGAAG QAIQNANIVA GLEETTGLQH MPLYL