Gene Rleg2_4215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4215
Symbol
ID	6982988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	4392767
End bp	4394005
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	57%
IMG OID	643398946
Product	glycosyl transferase family 2
Protein accession	YP_002283703
Protein GI	209551786
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCGGCA TCAAACTCAG CATTTGCATC CCGACCTACA ATCGTGAAGC CTATCTCAGA 
AACTCGCTGA CCTACTGCGA GAACGACTAC AGGTTCGACT TTCCCTTTGA AGTCGTCATT 
TGCGACAATG CCTCCACGGA TGGTACGCAG CAGGTGGTCG AGGAATTCAT CAGCCGCGGG 
CTGCCGATCC GCTACTACAA GCGTGAAACC AACGCCGGCG CCGCGGCGAA CGTCACGAGC 
GCTCTGCGCC TCGGCAAGGG CGAATATCTC ATCTACCTGG CCGACGACGA TATCCTGATT 
GCCGATGCGG TGGCCGATAC CGTCTTATAT CTCGACAACA ATCCGGAAGT GACCTGCGCC 
CATGCGCCGT GGTTCCTCTA CGACGAAGTC GCTAAAACCG ACATCATGAA GTTCTACAAT 
GTCGAGGAAG ATCGGAAATT TCAGCGCGGC AGCTTTGGCG ACGTCTTCCA ATATCTCTGC 
GAACGCCACA TCTTTCCGGA AATCGCGATC TACCGCTCGT CAACGCTGCG GTCGGCCTGG 
GTCCCGCGGG AGTTCTGCTT CTACCCGTTC GCGTTTTTTG CGCATTTTCT CGATCAGGGC 
GCGGTTACTT TCCTGCAGCG CCCGTTCTAC CGCTCGATCG CCAATTCGGC GATCACCCGC 
GATCGCCCGC AGGAAGGCAC CAATGACGTC ATGACGAGCT GGGATCGCTA TCGTGGCGGG 
CTTGAATATT TCCTCTATAC GGGCGTCAGG CGCGGGGCGC TGGCCCTGAC GCCCGAGACG 
CGTCTCAAAT ATGACGAGAT GTGCAGGATC TTCACGCTCA ATCGAATGGC GGTCGCCTTC 
CGCTTCTGGG CAGAGCGCAA AAATTTCATC AAGGCCTATG AACTCTATAC CCGCATCATG 
TGGGGCGGGA TGCTCGACCA CCCGGAAATC CGCGCCTTCC GTGAAAGGCT ACCCCTGATG 
GTCGTCATTC AGACGCTGGT GAGCGAAGTG AATTCGGCAA TCGGTATCGA TACGCTGCTT 
CTTGCCGGCT TCTCGGAAAT CGCGGTGCTC GAAGACCTGA TGCGCGAACT CGGTCTCAAT 
GAAAAAGTAA GGTTTACCAC AGAACTCAGC GACCGCGCGC TCGATAGCAC CGCGGTCTTC 
GTCACCGTCG ACAGAGACCG GGAATATTTC GTAGCCCTCG GCTACCTGCC CAATCTGGTG 
TTCCACGAGC ACGATCTTGC CCGGCACATT ATCATGTGA

Protein sequence

MSGIKLSICI PTYNREAYLR NSLTYCENDY RFDFPFEVVI CDNASTDGTQ QVVEEFISRG 
LPIRYYKRET NAGAAANVTS ALRLGKGEYL IYLADDDILI ADAVADTVLY LDNNPEVTCA 
HAPWFLYDEV AKTDIMKFYN VEEDRKFQRG SFGDVFQYLC ERHIFPEIAI YRSSTLRSAW 
VPREFCFYPF AFFAHFLDQG AVTFLQRPFY RSIANSAITR DRPQEGTNDV MTSWDRYRGG 
LEYFLYTGVR RGALALTPET RLKYDEMCRI FTLNRMAVAF RFWAERKNFI KAYELYTRIM 
WGGMLDHPEI RAFRERLPLM VVIQTLVSEV NSAIGIDTLL LAGFSEIAVL EDLMRELGLN 
EKVRFTTELS DRALDSTAVF VTVDRDREYF VALGYLPNLV FHEHDLARHI IM