Gene EcHS_A4192 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4192
Symbol	argC
ID	5594140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4184667
End bp	4185671
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	53%
IMG OID	640923294
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_001460753
Protein GI	157163435
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAATA CGCTGATTGT GGGTGCCAGC GGCTACGCTG GCGCAGAGCT AGTGACCTAT 
GTAAATCGCC ATCCGCATAT GAACATAACC GCTTTGACTG TTTCAGCGCA AAGCAATGAT 
GCGGGAAAGT TAATCTCCGA TTTGCATCCG CAGCTAAAAG GCATCGTTGA TCTGCCGTTG 
CAGCCGATGT CGGATATCAG CGAGTTTAGC CCAGGGGTGG ACGTAGTGTT TCTCGCCACC 
GCCCATGAAG TTAGCCACGA TTTAGCGCCG CAGTTTCTTG AAGCGGGCTG CGTGGTGTTC 
GACCTTTCCG GCGCGTTTCG TGTTAACGAC GCCACCTTCT ATGAAAAATA TTACGGCTTT 
ACCCATCAAT ACCCGGAACT GTTGGAACAG GCAGCCTACG GTCTGGCGGA GTGGTGCGGT 
AATAAATTAA AAGAAGCGAA TTTGATTGCG GTGCCGGGCT GTTATCCGAC GGCGGCACAG 
CTGGCGCTGA AACCGTTGAT TGATGCCGAT CTTCTTGACC TCAATCAGTG GCCGGTGATC 
AACGCCACCA GCGGCGTGAG CGGTGCAGGG CGTAAAGCGG CCATTTCAAA CAGCTTTTGT 
GAAGTTAGCC TGCAACCGTA TGGCGTCTTT ACTCATCGCC ATCAACCAGA GATCGCCACA 
CACCTCGGTG CTGACGTTAT CTTCACCCCA CATCTGGGCA ATTTCCCGCG CGGCATTCTC 
GAAACCATTA CCTGCCGCCT GAAATCGGGT GTGACCCAGG CGCAAGTCGC GCAAGTGTTA 
CAGCAGGCGT ATGCCCATAA ACCGCTGGTG CGGCTGTATG ACAAAGGCGT TCCGGCGCTG 
AAAAATGTCG TTGGGCTGCC ATTTTGCGAT ATCGGGTTTG CCGTTCAGGG CGAGCATTTG 
ATTATTGTGG CGACCGAAGA CAACTTACTG AAAGGCGCGG CGGCACAAGC GGTACAGTGC 
GCCAATATTC GTTTCGGCTA TGCGGAAACG CAGTCTCTTA TTTAA

Protein sequence

MLNTLIVGAS GYAGAELVTY VNRHPHMNIT ALTVSAQSND AGKLISDLHP QLKGIVDLPL 
QPMSDISEFS PGVDVVFLAT AHEVSHDLAP QFLEAGCVVF DLSGAFRVND ATFYEKYYGF 
THQYPELLEQ AAYGLAEWCG NKLKEANLIA VPGCYPTAAQ LALKPLIDAD LLDLNQWPVI 
NATSGVSGAG RKAAISNSFC EVSLQPYGVF THRHQPEIAT HLGADVIFTP HLGNFPRGIL 
ETITCRLKSG VTQAQVAQVL QQAYAHKPLV RLYDKGVPAL KNVVGLPFCD IGFAVQGEHL 
IIVATEDNLL KGAAAQAVQC ANIRFGYAET QSLI