Gene SeHA_C0801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0801
Symbol	nagC
ID	6489292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	790107
End bp	791327
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	54%
IMG OID	642741053
Product	N-acetylglucosamine repressor
Protein accession	YP_002044711
Protein GI	194448029
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCAG GCGGACAAGC TCAGATAGGT AACGTTGATC TCGTAAAACA GCTTAACAGC 
GCGGCCGTTT ACCGCCTGAT TGACCAGCAT GGTCCTATCT CGCGCATACA AATTGCCGAG 
CAAAGCCAGC TTGCTCCCGC CAGCGTAACG AAAATTACGC GTCAACTCAT TGAACGCGGG 
CTGATCAAAG AAGTCGATCA GCAGGCCTCT ACCGGAGGCC GCCGCGCTAT CTCTATCGTC 
ACGGAAACCC GCAACTTCCA TGCCATTGGC GTTCGCCTGG GCCGTCATGA CACCACTTTA 
ACGCTCTACG ATCTGAGCAG TAAAGTGGTC GCTGAGGAGC ATTATCCGCT GCCGGAGCGC 
ACCCAGGAGA CGCTGGAACA CGCGCTGCTC AACACCATCG CCGTCTTTAT TGATAGCTGT 
CAGCGTAAAA TTCGTGAATT GATCGCTATC TCGGTGATCC TGCCAGGGCT TGTCGATCCG 
GAAAGCGGCG TGATTCGTTA CATGCCGCAC ATTCAGGTTG AAAACTGGGG ACTGGTCGAA 
GCGCTGGAAA AACGGTTTCA CGTTACCTGT TTCGTGGGAC ACGATATTCG TAGCCTGGCA 
CTGGCGGAAC ACTACTTCGG CGCCAGTCAG GATTGCGAGG ACTCGATTCT GGTGCGCGTC 
CATCGTGGTA CAGGCGCCGG GATTATCTCC AACGGACGCA TCTTCATTGG CCGTAACGGC 
AACGTCGGCG AAATTGGGCA TATTCAGGTG GAGCCGTTGG GCGAGCGCTG CCACTGCGGT 
AATTTCGGCT GTCTGGAAAC CATTGCCGCC AATGCGGCGA TTGAACAACG GGTGCTGAAT 
TTGCTTAAAC AAGGGTATCA AAGCCGTGTT CCGCTTGACG ACTGCACGAT TAAAACCATC 
TGTAAGGCGG CAAACCGGGG CGACAGCCTG GCCTCGGAAG TCATTGAGCA TGTTGGCCGC 
CATTTGGGCA AAACGATCGC CATTGCTATC AACCTGTTTA ATCCGCAAAA AATCGTCATT 
GCCGGCGAGA TCATTGAAGC CGATAAAGTC CTGTTGCCCG CTATCGAAAG CTGTATCAAT 
ACGCAGGCGT TAAAGGCCTT TCGCAAAAAT TTGCCGGTGG TACGCTCCAC GCTGGATCAC 
CGTTCTGCTA TCGGCGCATT TGCCTTAGTT AAACGCGCCA TGCTCAACGG AACATTGCTG 
CAACGTTTGC TGGAAAGCTG A

Protein sequence

MTPGGQAQIG NVDLVKQLNS AAVYRLIDQH GPISRIQIAE QSQLAPASVT KITRQLIERG 
LIKEVDQQAS TGGRRAISIV TETRNFHAIG VRLGRHDTTL TLYDLSSKVV AEEHYPLPER 
TQETLEHALL NTIAVFIDSC QRKIRELIAI SVILPGLVDP ESGVIRYMPH IQVENWGLVE 
ALEKRFHVTC FVGHDIRSLA LAEHYFGASQ DCEDSILVRV HRGTGAGIIS NGRIFIGRNG 
NVGEIGHIQV EPLGERCHCG NFGCLETIAA NAAIEQRVLN LLKQGYQSRV PLDDCTIKTI 
CKAANRGDSL ASEVIEHVGR HLGKTIAIAI NLFNPQKIVI AGEIIEADKV LLPAIESCIN 
TQALKAFRKN LPVVRSTLDH RSAIGAFALV KRAMLNGTLL QRLLES