Gene Rleg2_5038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5038
Symbol
ID	6978132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	685725
End bp	687005
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	54%
IMG OID	643394181
Product	glycosyl transferase family 2
Protein accession	YP_002278999
Protein GI	209547081
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTGC TTGAAACCAC TGGCATCGCT GCCGTCTCGC TCTATGGATT GCTCTCCACT 
GCCTATAGGA CTGTACAGGT CTTTCATTCT CGACGTGCAC TTGGGTCGGA AACATCGAAA 
ACGTTGGACG AACCGCGGGC TTTGCCTAGC GTGGACATCA TTGTTCCTTC CTTCAACGAG 
AAGCCCCACG TCTTATCGGA TTGTCTGGCA TCCTTATCCA ACCAGGATTA TCCAGGCACG 
ATTCGATTTT ATGTAGTTGA CGACGGTTCC AGAAATCGTG ACGCCGTGGT GGCCCAGCAA 
AAAGTCTATG CGGGCGACCC AAGATTCGAA TTCATTCTGC TTCCGAGGAA TGTCGGAAAG 
CGCAAAGCGC AAATCGCTGC GATATTCCAA TCGTCCGGGG ACCTGATCTT GAATGTGGAT 
TCAGACACTA CATTAGCTCC CGACGTCGTC TACAAACTCG CTCAAAAAAT GCGCAATCCG 
GCGGTCGGCG CGGTGATGGG GCAACTCGTA GCTAGCAATC AGGCCGACAC GTGGCTGACC 
CGACTGATTG ACATGGAGTA CTGGCTCGCA TGCAATGAGG AGCGTGCAGC CCAAGGCCGG 
TTCGGTGCCG TGATGTGTTG CTGCGGGCCC TGTGCCATGT ACCGGCGGTC CGCCTTCCTT 
ATGCTTCTTG ATCAATACGA GACACAGCTC TATCGGGGAA AGCCGAGTGA CTTCGGGGAG 
GATCGTCATC TTACTATCCT TATGCTTAGC GCAGGCTTTA GAACGGAATA TGTTCCAAGC 
GCCATCGCAG CGACAGTTGT TCCTGATGAG ATGGGTGCCT ATCTCCGCCA ACAACTGCGT 
TGGGCGCGGA GTACATTCAG AGACACCTTG CTGGGGCTCC ACCTTCTCCC TGGCATGAAC 
TGGTATTTGA CTTTGGACGT CATCGGGCAG AATGCCGGCC TGCTGCTCCT CGGATTATCC 
CTTTTGGCGG GCCTCGCTCA GTTCGCACTA ACAGGCTCGG TGCCTTGGTG GGTGATAGCG 
ACCATCGGAT CTATGTCACT GATACGATGT GCTGTGGCGG CCTATCGTGC CAGACAAATA 
CGGTTTCTTG CCTTCTCGAT GCACACGCTT GTGAACATCT TTCTTTTGTT TCCGTTGAAG 
GCGTACGCGC TATGTACCCT GTCCAATAGC GATTGGCTCT CGCGCGGCTC TGGAGCCAAC 
GTGTCTGTCG CTGTTCGGGA GCAGAGCGCT TCCGAAAATC CAAGGCTGAC GGCACCCGAA 
GCTACGTTCA GCGGCGAATA G

Protein sequence

MTLLETTGIA AVSLYGLLST AYRTVQVFHS RRALGSETSK TLDEPRALPS VDIIVPSFNE 
KPHVLSDCLA SLSNQDYPGT IRFYVVDDGS RNRDAVVAQQ KVYAGDPRFE FILLPRNVGK 
RKAQIAAIFQ SSGDLILNVD SDTTLAPDVV YKLAQKMRNP AVGAVMGQLV ASNQADTWLT 
RLIDMEYWLA CNEERAAQGR FGAVMCCCGP CAMYRRSAFL MLLDQYETQL YRGKPSDFGE 
DRHLTILMLS AGFRTEYVPS AIAATVVPDE MGAYLRQQLR WARSTFRDTL LGLHLLPGMN 
WYLTLDVIGQ NAGLLLLGLS LLAGLAQFAL TGSVPWWVIA TIGSMSLIRC AVAAYRARQI 
RFLAFSMHTL VNIFLLFPLK AYALCTLSNS DWLSRGSGAN VSVAVREQSA SENPRLTAPE 
ATFSGE