Gene SeD_A0789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0789
Symbol	nagA
ID	6873805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	780320
End bp	781474
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	53%
IMG OID	642783986
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_002214665
Protein GI	198246175
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.500827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGCTT TAACCCAGGG CCGGATCTTT ACCGGTCACG AAATTCTTGA TGACCATGCG 
CTTGTTGTCG CTAATGGCCT GATTGACCGC GTTTGTCCGA TGGCCGAACT GCCGCCGGGA 
ATAGAACAAC GCTCATTGAA TGGGGCCATT CTCTCCCCCG GTTTTATTGA TGTGCAGCTA 
AACGGCTGCG GCGGCGTGCA GTTTAACGAT ACCGCAGAAG CCGTCAGCGT TGAAACGCTG 
GAAATTATGC AGAAAGCCAA TGAAAAATCG GGCTGTACTA ACTTTCTGCC AACGCTTATC 
ACTACCAGCG ACGAATTGAT GAAACAGGGC ATTCGCGTCA TGCGCGAATA CCTGGAAAAA 
CATCCGCACC AGGCGCTGGG TCTCCACCTG GAAGGCCCCT GGCTTAATCT GGTAAAAAAA 
GGCACCCATA ATCCTGATTT CGTGCGTAAA CCAGACGCTG CGCTGGTCGA TTTCTTATGC 
GATAATGCCG ACGTCATCAC CAAAGTCACT CTCGCGCCGG AAATGGTGCC TGCTGACGTA 
ATCGCTAAAC TGGCGAATGC GGGCATTGTG GTTTCCGCAG GTCACTCCAA CGCGACGTTA 
AAAGAGGCGA AAGCAGGCTT CCGCGCCGGG ATTACTTTTG CGACTCACCT GTTTAACGCG 
ATGCCGTACA TTACAGGGCG TGAGCCGGGC CTTGCTGGCG CTGTTCTGGA CGAAGCGGAT 
ATTTATTGCG GCGTTATCGC CGATGGTCTG CATGTCGACT ACGCCAACAT TCGCAATGCC 
AAACGCCTTA AAGGCGACAA ACTTTGTCTG GTGACAGACG CCACCGCACC GGCGGGGGCC 
AATATTGAGC AGTTCATTTT CGCAGGTAAA ACAATATACT ACCGCAATGG ACTGTGTGTG 
GATGAAAACG GTACGTTGAG CGGTTCGTCC TTAACCATGA TTGAAGGCGT ACGCAACCTG 
GTCGCGCATT GCGGCATCGC GCTGGATGAA GTGCTGCGCA TGGCAACACT CTATCCGGCA 
CGCGCTATCG GCGTTGATAA GCATCTCGGT AGCATTGCGC CGGGTAAAGT CGCCAACCTG 
ACCGCGTTCA CCCACGATTT TAAAATTATC AAGACCATCG TTAATGGTGA CGAGGTCGTT 
GACTTGAGTA AGTGA

Protein sequence

MYALTQGRIF TGHEILDDHA LVVANGLIDR VCPMAELPPG IEQRSLNGAI LSPGFIDVQL 
NGCGGVQFND TAEAVSVETL EIMQKANEKS GCTNFLPTLI TTSDELMKQG IRVMREYLEK 
HPHQALGLHL EGPWLNLVKK GTHNPDFVRK PDAALVDFLC DNADVITKVT LAPEMVPADV 
IAKLANAGIV VSAGHSNATL KEAKAGFRAG ITFATHLFNA MPYITGREPG LAGAVLDEAD 
IYCGVIADGL HVDYANIRNA KRLKGDKLCL VTDATAPAGA NIEQFIFAGK TIYYRNGLCV 
DENGTLSGSS LTMIEGVRNL VAHCGIALDE VLRMATLYPA RAIGVDKHLG SIAPGKVANL 
TAFTHDFKII KTIVNGDEVV DLSK