Gene Smed_3410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3410
Symbol
ID	5324294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3617383
End bp	3618543
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	66%
IMG OID	640792361
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_001329066
Protein GI	150398599
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGGGA ACAAGACGAT CACCGGAGCA CGGGTTTTCG ACGGCATCGA CTGGCACGAC 
GGCGCCGCCC TCGTGGTCGA GTCAGGGCAC GTGAAGTCGA TTGTGCCGGC GGGGAGCGTA 
GCCGTCGGTG GCGAGACCGT CGACGCCCAT GGCCTGCTTC TCGTACCCGG CTTCATCGAT 
CTTCAGGTGA ATGGCGGCGG CGGCGCACTC CTGAACGAAG AACCTACCCT CGCAGGCATC 
CGGCAGATCT GCTCGGCGCA TGCGACATTC GGTACGACGG CGCTGCTGCC GACGCTGATC 
ACCGATACCC GCGCCGTCAG GACCGCGGCG ATAGCGGCAG GCCTCGAGGC TAAAGGAGCC 
GCGGTGCCGG GCTTCCTCGG CCTGCATCTC GAAGGCCCTC ATCTCTCGGT CGCGCGTAAG 
GGGGCGCACG ATCCCGCGCT GATCCGCCGG ATGGAGGACG ACGATCTCGC CGAGATACTT 
GGCTGCGCAA AGGCGCTCGG CCGCCTGATG CTGACCGTGG CGCCGGAAAA TGCCACAAAG 
GAGCAGGTTC GGGCGCTGGC CGATGCCGGG GTCGTGGTGA GCCTTGGCCA TACCGATGTG 
GATTACGATA CCGCCCGCGC CTATGCCAAA GCGGGAGCGA GAACCGTCAC GCACCTCTTC 
AACGCCATGA GCGGGCCTGG TCACCGTGAG CCGGGCGTTG TCGGTGCCGC TCTGGCGACG 
GGCGCTCTCC ATGCCGGCAT GATCGCCGAC GGCTATCATG TCCACCCGGC TTCCATGGGC 
ATAGCATTGC GCGGCAAGAA GGGACCGGGG CAGATCTTTC TGGTCACCGA CGCCATGTCG 
CCCCTCGGCA CTGACCAGAC GAGCTTCTTC CTCAACGGAC GAAAAATCCT GCGGCAGGAC 
GGCCGCCTGA CTCTCGCCGA CGGCACCCTC GCCGGCGCCG ATATCGATAT GTTGTCTTCT 
GTTCGTTTCG TCCACCAGAG GCTCGGCCTT CCGGTCGAGG AGGCGATCCG CATGGCGTCC 
GCCTATCCCG CCGACGCCAT GGGAATAGCC TCGCACAAGG GCCGGCTCCT GCCGGGTGCG 
GATGCCGATT TCGTGCTGCT CACGCCGGAG CTCGGCATCA GATCGACCTG GATCGGCGGA 
GAAAGAGTCT TTGCCGCTTG A

Protein sequence

MNGNKTITGA RVFDGIDWHD GAALVVESGH VKSIVPAGSV AVGGETVDAH GLLLVPGFID 
LQVNGGGGAL LNEEPTLAGI RQICSAHATF GTTALLPTLI TDTRAVRTAA IAAGLEAKGA 
AVPGFLGLHL EGPHLSVARK GAHDPALIRR MEDDDLAEIL GCAKALGRLM LTVAPENATK 
EQVRALADAG VVVSLGHTDV DYDTARAYAK AGARTVTHLF NAMSGPGHRE PGVVGAALAT 
GALHAGMIAD GYHVHPASMG IALRGKKGPG QIFLVTDAMS PLGTDQTSFF LNGRKILRQD 
GRLTLADGTL AGADIDMLSS VRFVHQRLGL PVEEAIRMAS AYPADAMGIA SHKGRLLPGA 
DADFVLLTPE LGIRSTWIGG ERVFAA