Gene EcolC_0897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0897
Symbol
ID	6064574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	970132
End bp	971463
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	641600300
Product	N-acetylglutamate synthase
Protein accession	YP_001723893
Protein GI	170018939
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0548] Acetylglutamate kinase [COG1246] N-acetylglutamate synthase and related acetyltransferases
TIGRFAM ID	[TIGR01890] amino-acid N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.763096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTAAAGG AACGTAAAAC CGAGTTGGTC GAGGGATTCC GCCATTCGGT TCCCTATATC 
AATACCCACC GGGGAAAAAC GTTTGTCATC ATGCTCGGCG GTGAAGCCAT TGAGCATGAG 
AATTTCTCCA GTATCGTTAA TGATATCGGG TTGTTGCACA GCCTCGGCAT CCGTCTGGTG 
GTGGTCTATG GCGCACGTCC GCAGATCGAC GCAAATCTGG CTGCGCATCA CCACGAACCG 
CTGTATCACA AGAATATACG TGTGACCGAC GCCAAAACAC TGGAACTGGT GAAGCAGGCT 
GCGGGAACAT TGCAACTGGA TATTACTGCT CGCCTGTCGA TGAGTCTCAA TAACACGCCG 
CTGCAGGGCG CGCATATCAA CGTCGTCAGT GGCAATTTTA TTATTGCCCA GCCGCTGGGC 
GTCGATGACG GCGTGGATTA CTGCCATAGC GGGCGTATCC GGCGGATTGA TGAAGACGCG 
ATCCATCGTC AACTGGACAG CGGTGCAATA GTGCTAATGG GGCCGGTCGC TGTTTCAGTC 
ACTGGCGAGA GCTTTAACCT GACCTCGGAA GAGATTGCCA CTCAACTGGC CATCAAACTG 
AAAGCTGAAA AGATGATTGG TTTTTGCTCT TCCCAGGGCG TCACTAATGA CGACGGTGAT 
ATTGTCTCCG AACTTTTCCC TAACGAAGCG CAAGCGCGGG TAGAAGCCCA GGAAGAGAAA 
GGCGATTACA ACTCCGGTAC GGTGCGCTTT TTGCGTGGCG CAGTGAAAGC CTGCCGCAGC 
GGCGTGCGTC GCTGTCATTT AATCAGTTAT CAGGAAGATG GCGCGCTGTT GCAAGAGTTG 
TTCTCACGCG ACGGTATCGG TACGCAGATT GTGATGGAAA GCGCCGAGCA GATTCGTCGC 
GCAACAATCA ACGATATTGG CGGTATTCTG GAGTTGATTC GCCCACTGGA GCAGCAAGGT 
ATTCTGGTAC GCCGTTCTCG CGAGCAGCTG GAGATGGAAA TCGACAAATT CACCATTATT 
CAGCGCGATA ACACGACTAT TGCCTGCGCC GCGCTCTATC CGTTCCCGGA AGAGAAGATT 
GGGGAAATGG CCTGTGTGGC AGTTCACCCG GATTACCGCA GTTCATCAAG GGGTGAAGTT 
CTGCTGGAAC GCATTGCCGC TCAGGCGAAG CAGAGCGGCT TAAGCAAATT GTTTGTGCTG 
ACCACGCGCA GTATTCACTG GTTCCAGGAA CGTGGATTTA CCCCAGTGGA TATTGATTTA 
CTGCCCGAGA GCAAAAAGCA GTTGTACAAC TACCAGCGTA AATCCAAAGT GTTGATGGCG 
GATTTAGGGT AA

Protein sequence

MVKERKTELV EGFRHSVPYI NTHRGKTFVI MLGGEAIEHE NFSSIVNDIG LLHSLGIRLV 
VVYGARPQID ANLAAHHHEP LYHKNIRVTD AKTLELVKQA AGTLQLDITA RLSMSLNNTP 
LQGAHINVVS GNFIIAQPLG VDDGVDYCHS GRIRRIDEDA IHRQLDSGAI VLMGPVAVSV 
TGESFNLTSE EIATQLAIKL KAEKMIGFCS SQGVTNDDGD IVSELFPNEA QARVEAQEEK 
GDYNSGTVRF LRGAVKACRS GVRRCHLISY QEDGALLQEL FSRDGIGTQI VMESAEQIRR 
ATINDIGGIL ELIRPLEQQG ILVRRSREQL EMEIDKFTII QRDNTTIACA ALYPFPEEKI 
GEMACVAVHP DYRSSSRGEV LLERIAAQAK QSGLSKLFVL TTRSIHWFQE RGFTPVDIDL 
LPESKKQLYN YQRKSKVLMA DLG