Gene SNSL254_A0741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0741
Symbol	nagC
ID	6483600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	746089
End bp	747309
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	54%
IMG OID	642736153
Product	N-acetylglucosamine repressor
Protein accession	YP_002039919
Protein GI	194442984
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.388075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.560523
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCAG GCGGACAAGC TCAGATAGGT AACGTTGATC TCGTAAAACA GCTTAACAGC 
GCGGCCGTTT ACCGCCTGAT TGACCAGCAT GGTCCTATCT CGCGCATACA AATTGCCGAG 
CAAAGCCAGC TTGCCCCCGC CAGCGTAACG AAAATTACGC GTCAACTCAT TGAACGCGGG 
CTGATCAAAG AAGTCGATCA GCAGGCCTCT ACCGGAGGCC GCCGCGCTAT CTCTATCGTC 
ACGGAAACCC GCAACTTCCA TGCCATTGGC GTTCGCCTGG GGCGTCATGA CACCACTTTA 
ACGCTCTACG ATCTGAGCAG TAAAGTGGTC GCTGAGGAGC ATTATCCGCT ACCGGAGCGC 
ACCCAGGAGA CGCTGGAACA TGCGCTGCTC AACACCATCG CCGTCTTTAT TGATAGCTGT 
CAGCGTAAAA TTCGTGAATT GATCGCTATC TCGGTGATCC TGCCAGGGCT TGTCGATCCG 
GAAAGCGGCG TGATTCGTTA CATGCCGCAC ATTCAGGTTG AAAACTGGGG ACTGGTCGAA 
GCGCTGGAAA AACGGTTTCA CGTTACCTGT TTCGTGGGAC ACGATATCCG TAGCCTGGCG 
CTGGCGGAAC ACTACTTCGG CGCCAGTCAG GATTGCGAGG ACTCGATTCT GGTGCGCGTT 
CATCGTGGTA CAGGCGCCGG GATTATCTCC AACGGACGCA TCTTCATTGG CCGTAACGGC 
AACGTCGGCG AAATTGGGCA TATTCAGGTG GAGCCGTTGG GCGAGCGCTG CCACTGCGGT 
AATTTCGGCT GTCTGGAAAC CATTGCCGCC AATGCGGCGA TTGAACAACG GGTGCTGAAT 
TTGCTTAAAC AAGGGTATCA AAGCCGTGTT CCGCTTGACG ACTGCACGAT TAAAACCATC 
TGTAAGGCGG CAAACCGGGG CGACAGCCTG GCCTCGGAAG TCATTGAGCA TGTTGGTCGC 
CATTTGGGCA AAACGATCGC CATTGCTATC AACCTGTTTA ATCCGCAAAA AATCGTCATT 
GCCGGCGAGA TCATTGAAGC CGATAAAGTC CTGTTGCCCG CTATCGAAAG CTGTATCAAT 
ACGCAGGCGT TAAAGGCCTT TCGCAAAAAT TTGCCGGTGG TACGCTCCAC GCTGGATCAC 
CGTTCTGCTA TCGGCGCATT TGCCTTAGTT AAACGCGCCA TGCTCAACGG AACATTGCTG 
CAACGTTTGC TGGAAAGTTG A

Protein sequence

MTPGGQAQIG NVDLVKQLNS AAVYRLIDQH GPISRIQIAE QSQLAPASVT KITRQLIERG 
LIKEVDQQAS TGGRRAISIV TETRNFHAIG VRLGRHDTTL TLYDLSSKVV AEEHYPLPER 
TQETLEHALL NTIAVFIDSC QRKIRELIAI SVILPGLVDP ESGVIRYMPH IQVENWGLVE 
ALEKRFHVTC FVGHDIRSLA LAEHYFGASQ DCEDSILVRV HRGTGAGIIS NGRIFIGRNG 
NVGEIGHIQV EPLGERCHCG NFGCLETIAA NAAIEQRVLN LLKQGYQSRV PLDDCTIKTI 
CKAANRGDSL ASEVIEHVGR HLGKTIAIAI NLFNPQKIVI AGEIIEADKV LLPAIESCIN 
TQALKAFRKN LPVVRSTLDH RSAIGAFALV KRAMLNGTLL QRLLES