Gene Rleg2_3801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3801
Symbol
ID	6982564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3932146
End bp	3933297
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	67%
IMG OID	643398523
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_002283289
Protein GI	209551372
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.481629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGTA AGATCTTCAT CGGCGCGCGC ATCTTCGATG GCGAGCGCTT CCATGACGAC 
AAGGCGCTCA TCGTTGCCGA TGGACGGGTC GAAGCGATTG CGGCTGGAAA CGATCTGCCG 
GATGGCGAGA CGGTGACGCT TGCCGGCGGC GTGCTGTCGG CCGGCTTCAT CGATGCGCAG 
GTCAATGGCG GCGCCGGGCG GATGCTGAAC GACGAACCTT CCGCCGCCTC GATGGCGATC 
ATCGCCGGCG GGCACCGGCC CTATGGCACG ACATCGCTGC TGCCGACGCT GATCACCGAT 
ACATCGGAGG CATCCATTGC CGCGATCGAG GCGGCGACAG AAGCGGTCAA GGCGAACCGC 
GGCGTCGCCG GCCTGCATCT CGAAGGCCCA CATCTGGCGC CGGCCCGCAA GGGCGCGCAT 
CTGGCCGAAC TGATGCGGCC GGTCGAGGAC CGCGACCTCA AGGCCTTCAT CCGGGCACGC 
GAGGCGATCG GCACGCTGCT CGTCACCATG GCGGCCGAGC AGGTAACGGT TGCCCAGGTG 
CGCGAACTTG CCGAAGGCGG CGTCACCGTC AGCATCGGCC ATTCCGATTG CTCGAGCGAG 
GCGGCGGAGG AACGTTTCGA TGCCGGGGCG CGAGGTGTCA CGCATCTTTT CAACGCCATG 
AGCCAGATGG GGCACCGTGC GCCAGGTCTC GTCGGCGCGG CGATCGACCA TCCCTCGACC 
TGGTGCGGCA TCATCGCCGA CGGTCACCAT GTCGATCCGA AAGCCCTGCG CACGGCGCTG 
CGCGCCAAGC GCGGCGAAGG CAAGCTGTTC TTCGTCACCG ATGCAATGTC GCTCGTCGGG 
TCTGAGAAGG ATTCCTTTAC GCTGAACGGG CGCACCGTCC GGCGCGAAAG AGGCGGCTTC 
TGCTCGAAGC TGGTGCTGTC CGACGGCACG CTGGCCGGTT CCGACGTCGA CATGATCTCG 
ACGATCCGCT ACGGCGTCAC CTATCTCGAC CTGACGCTCG CCGAAGCCCT GCGCATGGCA 
ACGCTCTACC CCGCCCGTTT CCTCAGGCTT GCCGATCGCG GCCATCTCTC GCCGGGCGCG 
CGCGCCGATC TTGTGCATCT CACCGATGCG CTAACTGTCA CCGCCACCTG GCTTGCCGGC 
GAAACGGCGT GA

Protein sequence

MARKIFIGAR IFDGERFHDD KALIVADGRV EAIAAGNDLP DGETVTLAGG VLSAGFIDAQ 
VNGGAGRMLN DEPSAASMAI IAGGHRPYGT TSLLPTLITD TSEASIAAIE AATEAVKANR 
GVAGLHLEGP HLAPARKGAH LAELMRPVED RDLKAFIRAR EAIGTLLVTM AAEQVTVAQV 
RELAEGGVTV SIGHSDCSSE AAEERFDAGA RGVTHLFNAM SQMGHRAPGL VGAAIDHPST 
WCGIIADGHH VDPKALRTAL RAKRGEGKLF FVTDAMSLVG SEKDSFTLNG RTVRRERGGF 
CSKLVLSDGT LAGSDVDMIS TIRYGVTYLD LTLAEALRMA TLYPARFLRL ADRGHLSPGA 
RADLVHLTDA LTVTATWLAG ETA