Gene Rleg2_0414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0414
Symbol
ID	6979129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	425574
End bp	426542
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	58%
IMG OID	643395127
Product	putative glycosyltransferase spore coat polysaccharide biosynthesis protein
Protein accession	YP_002279939
Protein GI	209548022
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3980] Spore coat polysaccharide biosynthesis protein, predicted glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.407624
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.45905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGTCT TCTGCATAGA GAGTTCGCAT GCACGCGGGA TGGGGCATCT GTTTCGGTCG 
CTGACGCTCG CCACCGAACT GCGTTCGCGC GGTCATTCGG TCCGTTTCGC GGCGAATGAT 
CATCCGAATT CGCTGAGGAT CATTCGGGAG CGCGGCTTTG ACGTTGCGCT TTACGATCTC 
GCCGCCGTCA CTGGATGGGA GGAGGGTCTC GTCGATCCCA CTACCGTTCC GTCGCCGATC 
TGGATCAACG ACCGCCTCGA TACGAGAAGA CCTCACAGCG AAACGATCAA GCGTTTGGGC 
GCCAAACTCG TGACTTTTGA TGATCGCGGC GATGGCGCTG AACTTGCCGA CATGAATATC 
TGCGCTCTTC TTTTCGAAAA GACGGAGGAT CTGAAGGGCG AAGATATCCG GCTGGGGGTG 
GAGTACATGA TACTCAATCC TGAAATCGAG AGATATCGCA GAGTTCGGCA AAGCCTTGCA 
TCGATACTCG TCACACTCGG GGGCGCCGAT ACCTACGGAG TGACGGTCCG CGTCGCCAAA 
TGGCTGAGCA GCAAGCCTTT TCCTGTCACC ATCGTCACAG GCCCGAGCTT CCAGCATATG 
GCGGAGCTTG AAGAGGTCGT CTCGACCGCA GAGCCGGATC GGTTCAAGCT GCTGAATCAG 
GTGCCGTCGC TTGCGGCAGA GATGTACGGG CACGATCTGG CGATTACCGG CGGTGGCGTT 
ACGCCCTTCG AAGCCTGTGC GGCCGGCCTG CCGTGCGTGG TGATCGCCAA CGAACCTTTC 
GAAATCCCGG TCGGCCGTGC TCTTGAAGGA TTGGGGGCCG CGTTCTTTGC CGGACATCAC 
TCTGAATTCG ATCTCGGCAT CCTGGAAAAG GCGATTCCGA TCAGGAGCAT GAGCGAGACT 
GCCATGACCA AGGTCGACCT CGGTGGGGTC GGGCGTATTG CCGCTTTGCT GGAAAGATTG 
GCTGCATGA

Protein sequence

MFVFCIESSH ARGMGHLFRS LTLATELRSR GHSVRFAAND HPNSLRIIRE RGFDVALYDL 
AAVTGWEEGL VDPTTVPSPI WINDRLDTRR PHSETIKRLG AKLVTFDDRG DGAELADMNI 
CALLFEKTED LKGEDIRLGV EYMILNPEIE RYRRVRQSLA SILVTLGGAD TYGVTVRVAK 
WLSSKPFPVT IVTGPSFQHM AELEEVVSTA EPDRFKLLNQ VPSLAAEMYG HDLAITGGGV 
TPFEACAAGL PCVVIANEPF EIPVGRALEG LGAAFFAGHH SEFDLGILEK AIPIRSMSET 
AMTKVDLGGV GRIAALLERL AA