Gene Rleg_4130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4130
Symbol
ID	8014925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4212584
End bp	4213735
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	66%
IMG OID	644826700
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_002977910
Protein GI	241206814
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.318316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.204694
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCGCA AGATCTTCCT CGGCGCCCGC ATCTTCGACG GCGAGCACTT CCATGACGAC 
AAAGCCCTCA TCGTTGCCGG CGGCCGCGTC GAAGCGATCG TCGCGAGAAA CGATCTGCCG 
GACGGCGAAG TGGTGACGCT TGCCGGTGGT GTTCTGTCGG CCGGCTTCAT CGATGCGCAG 
GTCAATGGCG GCGCCGGGCG GATGCTGAAC GACGAGCCTT CCGCCGCCTC GATGGACATT 
ATCGCCGGCG GGCACCGGCC CTATGGTACG ACGTCGCTGC TGCCAACGCT GATCACCGAT 
ACATCAGAGG CCTCCATTGC CGCGATCGAG GCGGCCAAGG AGGCAGTGAA AATGAACCGC 
GGCGTCGCCG GTCTGCATCT CGAAGGTCCG CACTTGGCGC CTGCGAGGAA GGGCGCGCAT 
CTGGCCGAAC TGATGCGGCC GGTGGAGGAC CGCGACGTCA AGGCTTTCAT CCGGGCGCGC 
GAGGCGATCG GCACGCTGCT GGTCACCATG GCCGCCGAGC AGGTGACGGT TGCCCAGGTG 
CGCGAACTTG CGGAAGCCGG CGTCACCGTC AGCATCGGCC ATTCCGATTG TTCGAGCGAG 
GCGGCGGAAG ACCGTTTCGA TGCCGGCGCG CGGGGCGTCA CGCATCTCTT CAACGCCATG 
AGCCAGCTGG GACACCGTGC GCCCGGTCTT GTCGGCGCGG CAATCGATCA TCCCTCAACC 
TGGTGCGGCA TCATCGCCGA TGGCCATCAC GTAGATCCGA AGGCCTTGCG CACAGCGCTC 
CGCGCCAAAC GCGGCGAAGG CAAGCTGTTC TTCGTCACCG ACGCGATGTC GCTCGTCGGG 
TCGGAGAAGG ATTCGTTCAC GCTGAACGGG CGCACCGTCC GGCGTGAAAG GGGCGGCTTT 
TGCTCGAAGC TGGTGCTGTC CGACGGCACG CTGGCCGGTT CCGATGTCGA CATGATCTCG 
ACGATCCGTT ACGGCGTCAC CTATCTCGAC CTGACGCTCG CCGAGGCCTT GCGCATGGCG 
ACCCTTTATC CCGCGCGGTT TCTCAGGCTT GCCGATCGCG GCCATCTCTC GCCGGGCGCG 
CGTGCCGATC TCGTGCATCT CACCGATGCG CTTGCCGTCA CCGCCACCTG GCTCAGCGGC 
GAAGCGGCCT AA

Protein sequence

MVRKIFLGAR IFDGEHFHDD KALIVAGGRV EAIVARNDLP DGEVVTLAGG VLSAGFIDAQ 
VNGGAGRMLN DEPSAASMDI IAGGHRPYGT TSLLPTLITD TSEASIAAIE AAKEAVKMNR 
GVAGLHLEGP HLAPARKGAH LAELMRPVED RDVKAFIRAR EAIGTLLVTM AAEQVTVAQV 
RELAEAGVTV SIGHSDCSSE AAEDRFDAGA RGVTHLFNAM SQLGHRAPGL VGAAIDHPST 
WCGIIADGHH VDPKALRTAL RAKRGEGKLF FVTDAMSLVG SEKDSFTLNG RTVRRERGGF 
CSKLVLSDGT LAGSDVDMIS TIRYGVTYLD LTLAEALRMA TLYPARFLRL ADRGHLSPGA 
RADLVHLTDA LAVTATWLSG EAA