Gene Rleg_6235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6235
Symbol
ID	8016247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	+
Start bp	294529
End bp	295674
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	60%
IMG OID	644827540
Product	glycosyl transferase group 1
Protein accession	YP_002978740
Protein GI	241258856
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.93613
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.352956
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGATGA ACACGCTCAC GGATGGAAAT CGGGTAGCGA CGCGGAACGC AGCAGCAACC 
GTCCGCCACT ACGTCCCGGG TGGTTGCGAA AACGGTGGCG GAATTGGCAG GCTCGTCGGC 
TATATATCGA ACACGGCAAA GGAGGCCGGC GAAACACACC TCGTCACCGA CACTAGAGGG 
TCTCGGTGGT CCTCCGTTGC GTCGCCTTTG CGCGTGCTCG GCGCCGTCTT GATGATGGCG 
AAGGACCGGA TAATTGCTCC GGCACGCATT CACCATATTC ATGTCGCGGG TCGCGGCAGC 
ACCGCAAGAA AACTGATCCT GACCGAGGCT GCCCGTCTCC TCGGATGCTC TCACATATTG 
CACCTGCACG ACTACGACTA CGCGCGCGAT TTTGCCGCAC GCTCGCCACG TCAACAAATG 
CTTGTACGCC GGATGTTCCA ACATGCTGAC CAGGTCGTGG CACTGGGCCA GCGCGACCGC 
ATGACGCTTA CGACGCTTCT CGGCGTGGAT GAGCGCCGCG TAGTCGTCAT TGGCAATTGT 
GTGCCCGACC CCGGACCGCG CAATGTTCAT GTCGGCGAGA TGCCGTTGAT CATATTTCTC 
GGCCGGCTGA GCGAACGCAA AGGCGTTCAG GAGCTTCTGC TTGCCTTAAG TCATCCGATC 
ATGAAAGAGC TCCAGTGGCG AGCCGTGCTG GCAGGCGACG GACCTGTGGA AGACTACCGG 
CGTCAGGCTG CCGCCATGGG ACTTTCAGAT CTGGTGAAAA TGCCGGGCTG GCTTGGCGCC 
GACGAGGCGC GGGCGTTGTG TACACGGGCA GATATCCTGG TCTTACCTTC GCATGCCGAG 
GGCTTGGCAA TGGCTGTGGT CGAAGGGCTT GCCCATGGGC TCGCCGTCGT CACCACGCGC 
GTCGGCGCGC ATGGCGAAGT CATCTCCGAC GGTGAAACTG GCGTCTTCGT ACCTGTCGGA 
GACAAGGATG CCCTGGCTGC GGCGCTGGCT AAGCTCGTCA CCGACCCGGA AGTCCGCAAC 
TATCTGTCGG CCAAGGCCCG CGCTCATTAT CTCAATAATT TCAGTATGAA GGCTTACATG 
CGATCGCTGG ACAAACTCTA CGACGCTATC TCCGCGCAAC CTCAAACAAC GGCGGGTGAA 
CGATGA

Protein sequence

MLMNTLTDGN RVATRNAAAT VRHYVPGGCE NGGGIGRLVG YISNTAKEAG ETHLVTDTRG 
SRWSSVASPL RVLGAVLMMA KDRIIAPARI HHIHVAGRGS TARKLILTEA ARLLGCSHIL 
HLHDYDYARD FAARSPRQQM LVRRMFQHAD QVVALGQRDR MTLTTLLGVD ERRVVVIGNC 
VPDPGPRNVH VGEMPLIIFL GRLSERKGVQ ELLLALSHPI MKELQWRAVL AGDGPVEDYR 
RQAAAMGLSD LVKMPGWLGA DEARALCTRA DILVLPSHAE GLAMAVVEGL AHGLAVVTTR 
VGAHGEVISD GETGVFVPVG DKDALAAALA KLVTDPEVRN YLSAKARAHY LNNFSMKAYM 
RSLDKLYDAI SAQPQTTAGE R