Gene EcSMS35_0696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0696
Symbol	nagC
ID	6146508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	699754
End bp	700974
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	54%
IMG OID	641615586
Product	N-acetylglucosamine repressor
Protein accession	YP_001742785
Protein GI	170681967
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00225291
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCAG GCGGACAAGC TCAGATAGGT AATGTTGATC TCGTAAAACA GCTTAACAGC 
GCGGCGGTTT ATCGCCTGAT TGACCAGTAC GGGCCAATCT CGCGGATTCA GATTGCCGAG 
CAAAGTCAGC TTGCCCCCGC CAGCGTAACC AAAATTACGC GTCAGCTTAT CGAACGCGGG 
CTGATCAAAG AAGTTGATCA GCAGGCCTCC ACCGGGGGCC GCCGCGCTAT CTCTATCGTC 
ACCGAAACCC GCAATTTCCA CGCAATCGGC GTACGGCTTG GTCGTCACGA CGCCACCATC 
ACTCTGTTTG ATCTTAGTAG CAAAGTGCTG GCAGAAGAAC ATTACCCGCT GCCGGAACGT 
ACCCAGCAGA CGCTGGAACA TGCCCTGCTG AATGCCATTG CTCAGTTTAT TGATAGCTAC 
CAGCGCAAGC TGCGCGAGCT GATCGCCATT TCCGTGATCC TGCCAGGGCT TGTTGACCCG 
GACAGCGGTA AAATTCATTA CATGCCGCAT ATTCAGGTGG AAAACTGGGG GCTGGTAGAA 
GCACTGGAAG AGCGTTTTAA AGTGACCTGT TTTGTCGGCC ACGATATCCG CAGTCTGGCG 
CTGGCAGAGC ACTACTTCGG TGCAAGTCAG GATTGCGAAG ACTCCATTCT GGTGCGTGTC 
CATCGCGGAA CCGGGGCCGG GATTATCTCT AACGGGCGAA TTTTTATCGG GCGCAACGGC 
AACGTCGGTG AAATTGGCCA TATTCAGGTC GAACCGCTGG GTGAACGCTG CCACTGTGGC 
AACTTTGGCT GCCTGGAAAC TATCGCCGCC AACGCTGCCA TTGAACAACG GGTGTTGAAT 
CTGTTAAAGC AGGGCTACCA GAGCCGCGTG CCGCTGGACG ACTGCACCAT CAAAACTATC 
TGCAAAGCCG CGAACAAAGG CGATAGCCTG GCGTCGGAAG TGATTGAGTA TGTCGGTCGT 
CATCTGGGCA AAACCATCGC CATTGCCATC AACCTGTTTA ACCCGCAAAA GATTGTTATT 
GCCGGAGAAA TCACCGAAGC CGATAAAGTG CTGCTCCCTG CTATTGAAAG CTGCATTAAT 
ACCCAGGCGC TGAAGGCGTT TCGTACTAAT CTGCCGGTGG TACGTTCTGA GCTGGATCAC 
CGCTCGGCAA TCGGCGCTTT TGCGCTGGTA AAACGCGCCA TGCTCAACGG TATTTTGCTC 
CAGCATTTGC TGGAAAATTA A

Protein sequence

MTPGGQAQIG NVDLVKQLNS AAVYRLIDQY GPISRIQIAE QSQLAPASVT KITRQLIERG 
LIKEVDQQAS TGGRRAISIV TETRNFHAIG VRLGRHDATI TLFDLSSKVL AEEHYPLPER 
TQQTLEHALL NAIAQFIDSY QRKLRELIAI SVILPGLVDP DSGKIHYMPH IQVENWGLVE 
ALEERFKVTC FVGHDIRSLA LAEHYFGASQ DCEDSILVRV HRGTGAGIIS NGRIFIGRNG 
NVGEIGHIQV EPLGERCHCG NFGCLETIAA NAAIEQRVLN LLKQGYQSRV PLDDCTIKTI 
CKAANKGDSL ASEVIEYVGR HLGKTIAIAI NLFNPQKIVI AGEITEADKV LLPAIESCIN 
TQALKAFRTN LPVVRSELDH RSAIGAFALV KRAMLNGILL QHLLEN