Gene EcolC_0563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0563
Symbol
ID	6064426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	606735
End bp	607868
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	58%
IMG OID	641599970
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_001723567
Protein GI	170018613
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.935106
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACACG TTCTGCGCGC CAGAAGGCTG CTGACTGAAG AGGGATGGCT CGATGACCAT 
CAGTTGCGTA TTGCTGACGG TGTCATCGCA GCAATCGAAC CGATTCCAGT GGGCGTGACT 
GAACGCGATG CGGAACTGCT CTGCCCCGCT TATATCGACA CCCATGTACA CGGTGGTGCG 
GGCGTTGATG TAATGGATGA CGCGCCGGAT GTGCTCGACA AGCTGGCAAT GCACAAGGCA 
CGCGAAGGTG TCGGCAGTTG GTTACCGACT ACCGTAACCG CGCCGCTTAA TACCATTCAT 
GCGGCGCTGA AACGTATTGC GCAACGTTGC CAACGCGGCG GACCTGGTGC GCAAGTGCTG 
GGGAGTTATC TCGAAGGACC GTACTTCACG CCGCAGAATA AAGGCGCGCA TCCGCCGGAG 
TTGTTTCGCG AGCTTGAAAT TGCCGAGCTG GATCAATTGA TTGCCGTTTC TCAGCACACC 
TTACGCGTGG TAGCGCTGGC ACCGGAAAAA GAGGGGGCAT TGCAGGCCAT CCGCCATCTT 
AAACAGCAAA ATGTACGAGT GATGCTGGGG CATAGCGCGG CGACCTGGCA ACAAACTCGC 
GCCGCGTTTG ATGCTGGTGC CGACGGCCTG GTGCATTGCT ATAACGGGAT GACAGGTTTA 
CATCACCGCG AACCGGGAAT GGTTGGCGCG GGATTAACGG ACAAGCGCGC CTGGCTGGAA 
CTGATAGCCG ATGGTCATCA TGTGCATCCG GCGGCGATGT CGCTGTGTTG TTGCTGTGCA 
AAAGAGAGAA TCGTGCTGAT CACCGACGCG ATGCAGGCAG CCGGGATGCC GGATGGTCGC 
TATACGTTAT GTGGCGAAGA AGTGCAGATG CACGGTGGCG TTGTCCGTAC CGCGTCCGGT 
GGGCTGGCGG GCAGTACGCT GTCTGTTGAT GCGGCAGTGC GCAACATGGT CGAGTTGACG 
GGCGTAACGC CTGCGGAAGC CATTCATATG GCATCGCTGC ATCCGGCGCG AATGCTGGGT 
GTTGATGGTG TTCTGGGATC GCTTAAACCG GGCAAACGCG CCAGCATCGT TGCGCTGGAT 
AGCGGGCTGC ATGTGCAACA AATCTGGATT CAGAGTCAAT TAGCTTCGTT TTGA

Protein sequence

MTHVLRARRL LTEEGWLDDH QLRIADGVIA AIEPIPVGVT ERDAELLCPA YIDTHVHGGA 
GVDVMDDAPD VLDKLAMHKA REGVGSWLPT TVTAPLNTIH AALKRIAQRC QRGGPGAQVL 
GSYLEGPYFT PQNKGAHPPE LFRELEIAEL DQLIAVSQHT LRVVALAPEK EGALQAIRHL 
KQQNVRVMLG HSAATWQQTR AAFDAGADGL VHCYNGMTGL HHREPGMVGA GLTDKRAWLE 
LIADGHHVHP AAMSLCCCCA KERIVLITDA MQAAGMPDGR YTLCGEEVQM HGGVVRTASG 
GLAGSTLSVD AAVRNMVELT GVTPAEAIHM ASLHPARMLG VDGVLGSLKP GKRASIVALD 
SGLHVQQIWI QSQLASF