Gene SeHA_C0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0804
Symbol	nagE
ID	6489127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	793673
End bp	795625
Gene Length	1953 bp
Protein Length	650 aa
Translation table	11
GC content	56%
IMG OID	642741056
Product	PTS system N-acetyl glucosamine specific transporter subunits IIABC
Protein accession	YP_002044714
Protein GI	194451768
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific [COG2190] Phosphotransferase system IIA components
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00830] PTS system, glucose subfamily, IIA component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component [TIGR01998] PTS system, N-acetylglucosamine-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTT TAGGTTTTTT CCAGCGGCTG GGTAGGGCGT TGCAGCTCCC TATCGCCGTG 
TTGCCGGTGG CAGCGTTGTT GCTGCGATTC GGCCAACCAG ATTTGCTGAA TATGCCGTTT 
ATCGCGCAAG CGGGCGGGTC TATTTTCGAT AACCTGGCGC TGGTTTTCGC TATCGGCGTG 
GCCTCCAGTT GGTCTAAAGA TAGCGCGGGC GCGGCAGCAC TGGCGGGAGC CGTGGGTTAC 
TTCGTCATGA CCAAAGCGAT GGTGACGATT AACCCGGAAA TCAACATGGG CGTGCTGGCG 
GGGATTATTA CCGGTCTGGT CGGCGGCGCG GTTTATAATC GCTGGTCTGG TATCAAACTG 
CCTGATTTTC TCAGTTTCTT CGGTGGAAAG CGTTTTGTGC CGATCGCAAC GGGCTTTTTC 
TGTCTGGTGC TGGCCGCTAT TTTCGGTTAC GTCTGGCCGC CGGTACAGCA TGGCATCCAT 
GCGGGCGGTG AATGGATCGT TTCCGCAGGC GCGCTGGGTT CCGGTATCTT TGGCTTCATC 
AACCGTCTGC TGATCCCCAC CGGTCTGCAT CAGGTACTGA ACACCATCGC CTGGTTCCAG 
ATTGGCGAAT TCACCAATGC CGCAGGCACT GTATTCCACG GCGATATCAA CCGCTTCTAT 
GCTGGCGACG GCACGGCGGG GATGTTTATG TCCGGCTTCT TCCCGATCAT GATGTTTGGT 
CTGCCGGGCG CCGCTCTGGC GATGTATTTC GCCGCGCCGA AAGAACGTCG TCCGATGGTG 
GGCGGTATGC TGCTGTCTGT CGCGATCACC GCGTTTCTGA CCGGCGTAAC CGAGCCGCTG 
GAATTCCTGT TTATGTTCCT GGCGCCGCTG CTGTACCTCC TGCACGCCAT TTTGACCGGT 
ATCAGCCTGT TCGTCGCGAC GTTGCTGGGT ATCCATGCGG GCTTCTCTTT CTCGGCAGGC 
GCGATCGACT ATGTTCTGAT GTATAACCTG CCAGCGGCCA GCAATAACGT CTGGATGTTG 
CTGGTGATGG GCGTTGTATT CTTTATCATC TACTTCCTGC TGTTCAGCGC GGTTATTCGT 
ATGTTTAACC TGAAAACGCC GGGCCGCGAA GATAAAGTTG ATGAGATGGT AACGGAAGAA 
GCCAACAGCA ACACCGAAGA AGGGTTAACG CAACTGGCGA CCAGCTATAT TGCTGCGGTT 
GGCGGTACGG ACAACCTGAA AGCGATCGAT GCGTGTATTA CCCGTCTGCG CCTGACCGTG 
AACGACTCTG CTCGCGTCAA CGATGCGGCC TGCAAACGCC TCGGCGCTTC CGGCGTGGTG 
AAACTGAACA AACAGACCAT TCAGGTTATT GTCGGCGCGA AAGCGGAATC GATTGGCGAT 
GAAATGAAGA AAGTGGTGGC GCGGGGGCCG GTCGCGGCAG CGTCTGCTGA TGCGGCTCAC 
GTTGCGACAC CTGCTCCGGC GGCCAAACCC CAGGCGGTGC CGAATGCGGT GACTATCGCT 
GAACTGGTCT CTCCGATTAC CGGTGAGGTA GTGGCGCTGG ATCAGGTACC GGATGAAGCG 
TTTGCCAGCA AAGCGGTCGG CGACGGCGTG GCGGTGAAAC CCACCGATAA AACCGTGGTT 
TCTCCGGCGG CGGGTACTAT CGTGAAAATC TTCAACACTA ACCACGCGTT CTGTCTGGAA 
ACCGAAAAAG GCGCGGAGAT CGTTGTCCAT ATGGGTATCG ATACCGTCGC GCTGAACGGT 
CAGGGCTTTA AGCGTCTGGT AGAAGAGGGT GCGGAAGTCA CGGCGGGTCA GCCGGTGCTG 
GAACTGGATC TGGACTTCCT GAATGCCAAT GCGCGTTCCA TGATAAGCCC GGTTGTTTGC 
AGCAACAGCG ATGACTTCAG CGCTCTGGTC ATCAAAGCGG ATGGTCACGT GGTAGCGGGT 
AAAACGCCAC TGTACGAGAT CAAGAGCAAA TAA

Protein sequence

MNILGFFQRL GRALQLPIAV LPVAALLLRF GQPDLLNMPF IAQAGGSIFD NLALVFAIGV 
ASSWSKDSAG AAALAGAVGY FVMTKAMVTI NPEINMGVLA GIITGLVGGA VYNRWSGIKL 
PDFLSFFGGK RFVPIATGFF CLVLAAIFGY VWPPVQHGIH AGGEWIVSAG ALGSGIFGFI 
NRLLIPTGLH QVLNTIAWFQ IGEFTNAAGT VFHGDINRFY AGDGTAGMFM SGFFPIMMFG 
LPGAALAMYF AAPKERRPMV GGMLLSVAIT AFLTGVTEPL EFLFMFLAPL LYLLHAILTG 
ISLFVATLLG IHAGFSFSAG AIDYVLMYNL PAASNNVWML LVMGVVFFII YFLLFSAVIR 
MFNLKTPGRE DKVDEMVTEE ANSNTEEGLT QLATSYIAAV GGTDNLKAID ACITRLRLTV 
NDSARVNDAA CKRLGASGVV KLNKQTIQVI VGAKAESIGD EMKKVVARGP VAAASADAAH 
VATPAPAAKP QAVPNAVTIA ELVSPITGEV VALDQVPDEA FASKAVGDGV AVKPTDKTVV 
SPAAGTIVKI FNTNHAFCLE TEKGAEIVVH MGIDTVALNG QGFKRLVEEG AEVTAGQPVL 
ELDLDFLNAN ARSMISPVVC SNSDDFSALV IKADGHVVAG KTPLYEIKSK