Gene SeD_A2160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2160
Symbol	nagZ
ID	6873488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2073368
End bp	2074393
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	57%
IMG OID	642785266
Product	beta-hexosaminidase
Protein accession	YP_002215929
Protein GI	198243937
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.925801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.000000512637
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGGCCCAG TAATGTTGAA TGTCGAAGGA TGTGAGCTGG ATGCGGAGGA GCGCGAGATA 
CTGGCGCATC CGCTGGTTGG CGGGCTTATT CTGTTCACGC GTAATTACCA TGACCCGGAA 
CAGCTGCGCG AATTAGTGCG CCAGATTCGG GCGGCATCGC GTAACCATCT GGTGGTGGCC 
GTCGATCAGG AAGGCGGGCG CGTACAGCGT TTCCGTGAAG GGTTTACCCG CCTGCCCGCG 
GCGCAATCTT TTTTTGCGCT GCATGGGCTG GAAGAGGGGG GGCGACTGGC GCAGGAGGCT 
GGGTGGCTGA TGGCCAGCGA AATGATCGCG ATGGATATTG ATATCAGTTT TGCGCCAGTG 
CTGGACGTCG GGCATATCAG CGCGGCAATT GGCGAGCGTT CTTATCATGC CGATCCCGCA 
AAAGCGTTGG CAATGGCAAC ACGCTTTATT GACGGTATGC ATGACGCCGG GATGAAAACG 
ACCGGTAAGC ATTTCCCCGG CCACGGCGCG GTCACGGCGG ACTCCCACAA AGAGACGCCG 
TGCGATCCAC GTCCTGAAAC GGACATCCGT GGCAAAGATA TGTCGGTGTT CCGCACGCTG 
ATTAGCGAGA ATAAACTGGA TGCGATTATG CCTGCGCACG TGATCTACCG CGCTATCGAT 
CCGCGTCCGG CAAGCGGTTC GCCGTACTGG CTGAAAACGG TGCTGCGTCA GGAGTTAGGC 
TTTGATGGCG TCATTTTCTC CGACGATCTG TCGATGGAGG GCGCGGCGAT TATGGGCAGC 
TATGCTGAGC GCGCTCAGGC GTCGCTGGAT GCGGGTTGCG ATATGATTCT GGTCTGCAAT 
AATCGTAAAG GCGCAGTCAG CGTGCTGGAT AATCTGTCGC CGATCAAAGC AGAACGTGTT 
ACACGTTTGT ATCATAAAGG TTCATTTTCA CGCCGGGAGC TCATGGACTC AGCACGCTGG 
AAAACAGCCA GCGCCCAGCT CAACCAGTTA CATGAACGCT GGCAGGAAGA AAAAGCAGGT 
CATTAA

Protein sequence

MGPVMLNVEG CELDAEEREI LAHPLVGGLI LFTRNYHDPE QLRELVRQIR AASRNHLVVA 
VDQEGGRVQR FREGFTRLPA AQSFFALHGL EEGGRLAQEA GWLMASEMIA MDIDISFAPV 
LDVGHISAAI GERSYHADPA KALAMATRFI DGMHDAGMKT TGKHFPGHGA VTADSHKETP 
CDPRPETDIR GKDMSVFRTL ISENKLDAIM PAHVIYRAID PRPASGSPYW LKTVLRQELG 
FDGVIFSDDL SMEGAAIMGS YAERAQASLD AGCDMILVCN NRKGAVSVLD NLSPIKAERV 
TRLYHKGSFS RRELMDSARW KTASAQLNQL HERWQEEKAG H