Gene Rleg2_5976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5976
Symbol
ID	6977362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	+
Start bp	393724
End bp	394872
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	67%
IMG OID	643393428
Product	Glycosyltransferase 28 domain
Protein accession	YP_002278246
Protein GI	209546356
COG category	[R] General function prediction only
COG ID	[COG4671] Predicted glycosyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.211682
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.611684
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCAC CGCGCATCTT CTTCTACGTC CAGCACCTGC TCGGCATCGG TCACATCGCC 
CGCGCCAGCC GCATCGCCAA CGCACTCGTC CAGGACGGCT TCGACGTGAC GGTCGTCACC 
GGCGGCCTGC CGGTGCCGGG TTTTCCCGGC GACGGTGTCA AGACCGTGGC CCTGCCGCCG 
GTCGTCGCCA GCAATGCCGG ATTTTCCGGT CTCGCCGATG CCGATGGCCG CCCCGCCGGC 
GAGGACTTCC TCAGTGCCCG CCGCGATCTG CTGCTTGAGG CCTTCCACGC CGCCAGGCCC 
GATGTCGTCA TCATCGAAGC CTTCCCCTTC GGCCGGCGGC AGATGCGCTT CGAACTGCTG 
CCGCTGTTTG CGGCGATCGA CAAGGCCGAG CCGCGGCCGA AGCTCGTAAG CTCCGTGCGC 
GACATCCTGC AGGAAAACCG CAAAGCCGGC CGCGACGCGG AGACCGCAGC CCTGGTCAAG 
GATCATTTCG ATGCGGTGCT CGTCCATGGC GACCCCGATT TCATCAGGCT TGAGGACACC 
TTTCCGCTGA CGGCAGAGAT CGCCGACAGG CTGCGTTATA CCGGCCTCGT CGCAGCGCCG 
CCGGCGCCGG AACCGACTGA AACCTTCGAC ATAATCGCAT CGGCAGGCGG CGGCGCGGTT 
GGCGCCGCTC TGATCGGCGC GGCGAAAGAG GCGGCGGCCC TGCTGCCGGC CGATCTTCGC 
TGGCTGCTGA TCGCAGGCCC GAACCTGCCG GAAGCCGATT TCGCTGCATT GTCTCAGGAT 
GCGGCGCCAA ACGTGACGCT GGTGCGCTTC CGCAGGGATT TCCCCTCGTT GCTGCGCGGC 
GCCAAGGTTT CGATCTCCCA GGCAGGCTAC AACACGGTCG GCGACCTGCT GCGCACCGAA 
TGCCGGGCAA TCCTCATCCC CTTCGTCGCC GGCGGCGAAA CCGAACAGAC CGTGCGCGCC 
GAGCGGCTGC AGGCGCTTGG TCTCGCCGAC ATTCTGCCGG AAACGGGACT GACGCCGGGC 
CATGTGAAGG AAGCCGTGGA AAAGGCGCTT GCCGCGCCGC GCAGCGGGTT GGTCTCGCTC 
GATCTCGACG GGGCTGAGAA AACCGCCGGC ATCATCCGCT CCATCATTGC CGGCGATTCG 
AAGCTTTGA

Protein sequence

MTAPRIFFYV QHLLGIGHIA RASRIANALV QDGFDVTVVT GGLPVPGFPG DGVKTVALPP 
VVASNAGFSG LADADGRPAG EDFLSARRDL LLEAFHAARP DVVIIEAFPF GRRQMRFELL 
PLFAAIDKAE PRPKLVSSVR DILQENRKAG RDAETAALVK DHFDAVLVHG DPDFIRLEDT 
FPLTAEIADR LRYTGLVAAP PAPEPTETFD IIASAGGGAV GAALIGAAKE AAALLPADLR 
WLLIAGPNLP EADFAALSQD AAPNVTLVRF RRDFPSLLRG AKVSISQAGY NTVGDLLRTE 
CRAILIPFVA GGETEQTVRA ERLQALGLAD ILPETGLTPG HVKEAVEKAL AAPRSGLVSL 
DLDGAEKTAG IIRSIIAGDS KL