Gene Rleg2_3993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3993
Symbol
ID	6982763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	4156514
End bp	4158166
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	60%
IMG OID	643398722
Product	Tetratricopeptide domain protein
Protein accession	YP_002283481
Protein GI	209551564
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATAG ACATCATCGA TACCATTGCC GGGTTCGAGG CGCTGCGCGA CAACTGGGAT 
CAGGTCTTCA TGGAAGATCC CGATGCGCAG CATTTCCTCT CCTGGATCTG GCTGAAGAAT 
TATCTGTCCC GCCGGCGCCG CTGGTTCATA CTCGCCCTTC GCGAACGCGA TCCGTACGAA 
CCCTACGTTG CTTTTTTTCC CCTACGCCTC ATCACGCATC TGAACGAAAA GACCGGGCTC 
TTCTACGACG AGATCATCAT GGCCGGGAAT TTTGCGGCCG ATTATACCGG CTTCATCGTC 
AGGCCGGATT ACGAACATCA TGCCATTGCC GGCTTTGCCT CGTTTATCAA ACATCAGAAC 
TGGACCGACC TGAAGCTCGA ATATTTCAGT GGCCCTGCCG GGCGGCGCGA GAAGATGATC 
GAGGCGCTGC GAGGACCGGA GGTGATGTTT CGCGACAGCT CGCCGAAAAA CAATGAGAAC 
ATCGACAATA CGATCTGCCC GATCGTTTCC CTGCCGGCAA GCTTCGACCA CTATCTCGAA 
CAGCGCATGA GCAGCCAGAC GCGCCAGAAG CTCCGCCGGT TCCTGCGCAA AGTCGAAGGC 
GACGATATCT ACCGCATCAC GATGTCGACC CCCGAGACCA TCCATCGCGA CCTGGACATT 
CTCTTCGATC TCTGGCGGAC CAAGTGGAGC GCCCGCAAAG GCGCGGAGCG GACCGAGCGG 
CTGATCATTA CCACGCGCGA AATGCTGATG GACTGTTTCA ACAACGGCAA TCTCGAGGTG 
CCGGTCTTCT GGCATGGCGA CCAGCCGCTC GGCGCGCTGG CAAATATCGT CGACCGGCAG 
AAGAAAGCGA TCCTCTTCTA TATCACCGGT CGCGACGAAA ACTGGAAAAC GCCGTCTCCC 
GGTCTCATCC TGCACGGTTA CTGCATCCGG CGGGCGATCG AGCAGGGCTT CAAGACCTAT 
GACTTCCTGC GCGGAAACGA GCCCTATAAA TATATGTTCG GGGTCGAGGA ACGACACATC 
AGCTGCACGC TCTTCCGCAC CCGCAATGGC CAGAATCTGC ATGGCGCGCT CAACCCGCGC 
AGCATTCGCT TCGTCTATGA GCAGGCGCTT GACATGTACC GCAACGGCGC CCGCCGGAGA 
GCGGAGATCG TCTTCAACCA GGTCCTGCAA TCGGCTCCAG GCCATACCGG CGCGGGCTTC 
GGGCTGGCCA ATCTGCTGTT CGACCGGGGC AAGCTGACGG AGGCACTGGC TGCCTATAAG 
GCGCTCGCCG AACAAGCGCC CGATCCGACA CCGATCCGGA TGCGGCTTGG CGACACGCAG 
CTTGCTTTGC ATCAATACGA CCAGGCCGCC GAGACGTTCC GCCTGGTCGG CGAGGTCGGG 
CCGCATCTGA TCCAGGCGCA TTACAAGCGT GGCATTGCCC TTGTTGCCGG TAAACGGCTG 
GCCGAGGCGG AAGCTGCTTT CGCCGCGATC CGGGACGTGC ATTCGGACGA TCCGGCCGCA 
CTCGACTATG TTGCCAAGGC AAATGCCGCC CTCGAACGGA TCCAGGCGAG CGCCGAACCC 
ACGCCTCACA AGACCGATGT CGTGTCCGAG ACCATCGCCC GCTGGAACCG GGGCTGGCAG 
CTCAGCGAGC GACGCCGGCC ACGTTTGCAC TGA

Protein sequence

MRIDIIDTIA GFEALRDNWD QVFMEDPDAQ HFLSWIWLKN YLSRRRRWFI LALRERDPYE 
PYVAFFPLRL ITHLNEKTGL FYDEIIMAGN FAADYTGFIV RPDYEHHAIA GFASFIKHQN 
WTDLKLEYFS GPAGRREKMI EALRGPEVMF RDSSPKNNEN IDNTICPIVS LPASFDHYLE 
QRMSSQTRQK LRRFLRKVEG DDIYRITMST PETIHRDLDI LFDLWRTKWS ARKGAERTER 
LIITTREMLM DCFNNGNLEV PVFWHGDQPL GALANIVDRQ KKAILFYITG RDENWKTPSP 
GLILHGYCIR RAIEQGFKTY DFLRGNEPYK YMFGVEERHI SCTLFRTRNG QNLHGALNPR 
SIRFVYEQAL DMYRNGARRR AEIVFNQVLQ SAPGHTGAGF GLANLLFDRG KLTEALAAYK 
ALAEQAPDPT PIRMRLGDTQ LALHQYDQAA ETFRLVGEVG PHLIQAHYKR GIALVAGKRL 
AEAEAAFAAI RDVHSDDPAA LDYVAKANAA LERIQASAEP TPHKTDVVSE TIARWNRGWQ 
LSERRRPRLH