Gene Rleg2_5268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5268
Symbol
ID	6978362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	894477
End bp	895637
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	55%
IMG OID	643394377
Product	glycosyl transferase family 2
Protein accession	YP_002279195
Protein GI	209547277
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCCAT GTGCAGAGGG GGACCGGCGA TATACCTTTG ATTCTGATCA ACCTTTGGTC 
TCAGTGGTCA TACCGGCCTT CAACGCTTCG ACCTATATTG AACGCACGCT TCGGTCCGCT 
CTGCGCCAGA CCTACACCGG TCTCGAGATT ATCGTTGTCA ATGACGGTTC AACAGACCAC 
ACGGCGAAAC TCGTCGAGCA GATGGCGATG TTGGACTCAC GCATTCGTCT GCTGTCCACA 
TCGAACCGCG GCGTCGCGGC CGCAAGGAAT ACTGGAATCG AAGAATCATC GGGCCAGTTT 
GTGGCGTTCC TTGACGCCGA CGATCTCTGG CACCGGACGA AAATCGAAAA GCAGGTGAAT 
GCGCTCAACC GGTTGTCCTC GCGGTGGGCT GCGGTCTACG CTCTGCACCA TATCATTAAT 
GAGGACGACG AAATCATTCA GCCTGCCAAC TCGGATGTCG CAAGAGGATA TATCTACGCC 
CGGCACCTGA CCTTTAAGTA TGTAGGCAAT GGAAGCGCGC TTCTCGTCCG GCGGAGCGTT 
GCCCTTGAGA TAGGCGGGTT CGATACTTCA TACGCCGCGG CCGGCATCGG AGGCTGCGAA 
GACCTCGATT TCGAGCTCAA GCTCGCCGCG CGCTACTTCA TCGAAGTCGT TCCCGAAGCG 
CTGGTGGGAT ACAGAAAGCA CCCTGGCAGT ATGTCGTCCA ATCATCTGCA AATGGGCAAA 
AGCGCGTTGG AGGTCGTTCG ACGTTCGCTG GCTGCCAATC CCCAGATCCC ACGATACGCG 
GTTCGAAGTG CTATGGATGC CACTCATAAA TATGCGTTTT GGGAATTCCG ACAGACTCAG 
AGAACATACC TTTCTCTGGT GACCATGCAG TCAATTTTCC GTACCGACCC GATTTTCATG 
GTTCTGCTTG TTCTCCAGAA GGGTCTGCGC CGGCTACGAC ATTGTCTTGG TTGCGGGATG 
ACGGCGGCGA AAGTTGAAGA TCCGCGGCGA ATGAATAGGT CGAAATTCGG CGATCAAATC 
GCTGCTTCGG TTCTGGATCA GTCGAAGGCG ACGCCAAGGT TGCGACGTCG CTTGACGCGG 
CTGGCTGAAG TGGATGCAAG TCTTAATCAA CAGTTGGTCC CGAGCGAACG GAACCTGACG 
CGAAGGAGGG TGGAACGATA G

Protein sequence

MLPCAEGDRR YTFDSDQPLV SVVIPAFNAS TYIERTLRSA LRQTYTGLEI IVVNDGSTDH 
TAKLVEQMAM LDSRIRLLST SNRGVAAARN TGIEESSGQF VAFLDADDLW HRTKIEKQVN 
ALNRLSSRWA AVYALHHIIN EDDEIIQPAN SDVARGYIYA RHLTFKYVGN GSALLVRRSV 
ALEIGGFDTS YAAAGIGGCE DLDFELKLAA RYFIEVVPEA LVGYRKHPGS MSSNHLQMGK 
SALEVVRRSL AANPQIPRYA VRSAMDATHK YAFWEFRQTQ RTYLSLVTMQ SIFRTDPIFM 
VLLVLQKGLR RLRHCLGCGM TAAKVEDPRR MNRSKFGDQI AASVLDQSKA TPRLRRRLTR 
LAEVDASLNQ QLVPSERNLT RRRVER