Gene Rleg2_4645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4645
Symbol
ID	6977739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	280116
End bp	282110
Gene Length	1995 bp
Protein Length	664 aa
Translation table	11
GC content	57%
IMG OID	643393819
Product	Cellulose synthase (UDP-forming)
Protein accession	YP_002278637
Protein GI	209546719
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR01131] ATP synthase subunit 6 (eukaryotes),also subunit A (prokaryotes)

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.998424
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCAGT ATCTTGTAGC GCTGGTTCCG ACCTTTCTCG TTCTGGCCTT CTTTTTCCTG 
GGGCCGTTCA ATTGGTCGCG CCATCACACC TGGACACGGG CGGTGACCTG CGCGTTTGTC 
GGTGCATTCG CATTACGATA CATGTTCTGG CGCCTGACGG AGACAGTGCT TCCCTATCCC 
GACGGCGGTC CGAGTTTCTA CTGGGTCTGG ATCCTCTTCA TCGCCGAGAT TCTGGCCTGC 
GTCGAAGTCA TCCTCTTTCT GGTATTGATG AGCCGCTATG TCGACCGCAG CGCGGAAGCG 
GACAGGCTGG CGCGCGTTTT CTTTGCGCGG GAGCAGCGTG AACTGCCGAC TGTCGATGTT 
TTCATTCCGA CCTATAATGA GCCGCTCGAC GTGCTCGAGC GAACCATCAT CGGCGCCCGT 
TCGCTGGATT ATCCTGCCGA CAAATTGAAT GTGTATGTGC TTGACGATCA ACGCCGGGAT 
TGGCTGAAGG CCTATTGCCA GGAAAAGAAC GTCATCCACG TCACGCGCGG CGACAACAGC 
CATGCCAAAG CAGGCAACAT GAACAACGGG CTGAAGGTCA GCTCGGGCGA GTTTATTGCG 
ATCTTCGACG CCGATTTTGT GCCCTATCGA CATTTCCTTC GCCGGACGCT GCCCTTCTTT 
TCAGATGGCA GCATCGGCAT CGTCCAGACA CCGCAACATT TCTTCAATGT CGACCCGGTG 
CAATCAAACC TTGGCCTGGA GAATATCTGG CCGGACGAGC AGCGCTTGTT CTTCGACGAG 
ATCGCGCCCA GCCGAGACGC CTGGGACGTC AGTTTCTGCT GCGGCTCATG CTCGATTGCG 
CGCCGCGAGG CCGTCGACGC AATAGGCGGA TTTCCGACGG AGTCGATCAC CGAAGACCTG 
CTGACAACTC TTTCGATGCT CAACAAAGGC TACAAGACGC GCTATCTGAA TGAGCGGCTA 
TCGATGGGGC TGGCCGCCGA AAACCTGACC GGTTATTTCG TGCAGCGCGA ACGGTGGTGT 
CAGGGGGGTA TTCAAACCCT TTACCTCTAT AATGGCCCGC TGCGCGGCCC GGGATTGACG 
CTCTTTCAAC GGATCATGTT CTTGCCGGCA TCTTGGCTGG TGCAGTATCT GGTCCGCTTC 
ACGATATTGC TCGTCCCGAT CGTCTATCTC TGGTTCGGCC TGCTCCCGCT CTATTTCACC 
GATATAGCCG ATTATGTCTC TCATCAGGTG CCGCTGCTGG CGGCGTATTT TCTGCTGATG 
CTGTGGATCA CGCCGACGCG CTATCTGCCA GTGATTTCCA GCGCCGTCGG GACCTTTTCG 
ACATTCCGCA TGTTGCCGAC CGTGGTCTCC AGCCTAGTGA GACCATTTGG CAAGCCGTTC 
CGGGTGACGC CAAAGGGCAG CAGCAACGAG GCCAACCAGT TCGACCGCTA CAGCTTCGCC 
TGGATCGCAA TCATGATCAC GGTCACCGTC CTTGGACTTC TGGTCAACGT CGTACCGGAA 
ACATCGCATG TACAAGGCCA GTTTTCACCC GTCGCGGCGT GGTGGTCAGG CATCAATATC 
GTCGTCCTGC TCATCGCGTC ACTGATCTGC TTTGAGAAAC CCCGGCGTCT GTTTCATGCG 
TTCAAGCTCG ATGAGTCCGC TGTCGTCGAC GACGTCCCCG GCCAAATCGT CAGTCTGGCA 
CTTGATAAGG CGGTCGTTGC AGTTCCCAGC ATGGCCCGAT TTCAATCCAA ATCGGTCATG 
CTGAAACTCC CCGGCTTCGC CCCGTTCGAA GCGGAGCTCG GACAGGTCAC GCAACGACGA 
AGCAGCATAA GCCGCGGCGG CGACAAGCAA GCCTATTACC TGCACCTGTA TTTCGAACTC 
AGCGGCGCTG CTCGCGACAG CATGATTGTC AAACTCTACA CCGGCCAATA TTCCCGCGAC 
ATTCGCGACA TCGACAAGGT TGCCGTCTCG CTTAATCTGT TGTTGCGGTC ATTCGGACGG 
ACACGCACCT TGTAG

Protein sequence

MVQYLVALVP TFLVLAFFFL GPFNWSRHHT WTRAVTCAFV GAFALRYMFW RLTETVLPYP 
DGGPSFYWVW ILFIAEILAC VEVILFLVLM SRYVDRSAEA DRLARVFFAR EQRELPTVDV 
FIPTYNEPLD VLERTIIGAR SLDYPADKLN VYVLDDQRRD WLKAYCQEKN VIHVTRGDNS 
HAKAGNMNNG LKVSSGEFIA IFDADFVPYR HFLRRTLPFF SDGSIGIVQT PQHFFNVDPV 
QSNLGLENIW PDEQRLFFDE IAPSRDAWDV SFCCGSCSIA RREAVDAIGG FPTESITEDL 
LTTLSMLNKG YKTRYLNERL SMGLAAENLT GYFVQRERWC QGGIQTLYLY NGPLRGPGLT 
LFQRIMFLPA SWLVQYLVRF TILLVPIVYL WFGLLPLYFT DIADYVSHQV PLLAAYFLLM 
LWITPTRYLP VISSAVGTFS TFRMLPTVVS SLVRPFGKPF RVTPKGSSNE ANQFDRYSFA 
WIAIMITVTV LGLLVNVVPE TSHVQGQFSP VAAWWSGINI VVLLIASLIC FEKPRRLFHA 
FKLDESAVVD DVPGQIVSLA LDKAVVAVPS MARFQSKSVM LKLPGFAPFE AELGQVTQRR 
SSISRGGDKQ AYYLHLYFEL SGAARDSMIV KLYTGQYSRD IRDIDKVAVS LNLLLRSFGR 
TRTL