Gene Rleg2_1206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1206
Symbol
ID	6979926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1218145
End bp	1219188
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	64%
IMG OID	643395919
Product	Cellulase
Protein accession	YP_002280726
Protein GI	209548809
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3405] Endoglucanase Y
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.364245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCGGT GGCGCGCGCT CCTGCTGGCG GCCTCTGTCG CGCTTGCACC GGCTCTGCCG 
GCCACCGCGC AGCAGGCGAT GATCAATGCC GACGCGTGGT CGGCCTACAA GGCGAAGTTT 
CTCGATCCGA GCGGCCGCAT CGTCGACAAC GGCAACGGCA ACATCAGTCA CAGCGAAGGG 
CAGGGCTACG GCCTGCTGCT CGCCTATCTC TCGGCAAGCC CGGCCGATTT CGAGCAGATC 
TGGTATTTTA CCCGTACCGA GCTGCTGCTG CGCGACGACG GCCTGGCCGT TTGGAAATGG 
GATCCGAACG TCAAGCCGCA CGTGGCCGAC ACCAACAATG CCACCGACGG TGACATGCTG 
ATCGCCTATG CGCTGGCGCT TGCCGGCACG GCATGGAAAC GGGAAGACTA TATCCTCGCT 
GCCTCCCGCA TGGCGCAGGC GCTGCTTGCC GAAACCGTCG GCAGCTCGCA GGGCCGCACC 
TTGCTGATGC CGGGAACCGA AGGGTTTACC GGCAGCGACC GCGACGATGG TCCCGTCGTC 
AACCCGTCCT ACTGGATTTA TGAGGCGATC CCGGTGATGG CAGCGCTCGC GCCGTCGGAT 
GCCTGGCAAA AACTGTCGAA TGACGGCGTG GAGCTGTTGA AGACGATGCA ATTCGGCCCG 
CGCAAGCTTC CCGCCGAATG GGTGAGCCTG CACGACAAGC CGCGGCCGGC AGAGGGGTTC 
GACGCCGAAT TCGGCTACAA CGCCATCCGC ATCCCGCTCT ATCTCGCCCG CGGCGGCATC 
ACCGACAAGG CACTGCTCAT CCGCCTGCAA AAGGGGATGT CGCAAGACGG CGTTCCCGCC 
ACCATTGATC TGACCACCGG CCGGCCGAAG ACCGTGCTGT CGGACCCCGG TTATAGAATT 
GTTAACGATG TTGTGGCCTG TGTTGTCGAT GGGACCAGGC TGCCGAGTTC GGCGCTGCAG 
TTTGCCCCCG CGCTCTATTA TCCGTCCACC CTTCAACTGC TGGGGCTGGC CTATATCGGG 
GAGAAGCATC CGGAGTGTCT GTGA

Protein sequence

MRRWRALLLA ASVALAPALP ATAQQAMINA DAWSAYKAKF LDPSGRIVDN GNGNISHSEG 
QGYGLLLAYL SASPADFEQI WYFTRTELLL RDDGLAVWKW DPNVKPHVAD TNNATDGDML 
IAYALALAGT AWKREDYILA ASRMAQALLA ETVGSSQGRT LLMPGTEGFT GSDRDDGPVV 
NPSYWIYEAI PVMAALAPSD AWQKLSNDGV ELLKTMQFGP RKLPAEWVSL HDKPRPAEGF 
DAEFGYNAIR IPLYLARGGI TDKALLIRLQ KGMSQDGVPA TIDLTTGRPK TVLSDPGYRI 
VNDVVACVVD GTRLPSSALQ FAPALYYPST LQLLGLAYIG EKHPECL