Gene Rleg_0456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0456
Symbol
ID	8011656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	474468
End bp	475568
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	56%
IMG OID	644823050
Product	glycosyl transferase group 1
Protein accession	YP_002974304
Protein GI	241203208
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAATTA GTATTGACGC AACCGGATTG GGCGGCCCCA AGACAGGAAC ATCAGTCTAT 
CTTATAGAGA TTTTGTCGCG CTGGAGCCGC AATACGTCCA TCAACCACGA GTTCACGATC 
TTCGCGAGCG AGAAGGCCGT TTCCCTCTGC TCGGAAGCCG GATTGGACCA TCGGTTTCGT 
TTCGTCCGCG CGCCCAACAA CCGCCATATC AGAGTGATCT GGCAGCAGCT AATGATTCCG 
TGGCATATGC GCCGACTTGG AATCGATGTG CATTGGGGGA CGGCCTTCGT ATTACCGGTG 
GCTTCGCAAA GGCCAATGGC CGTTACAATA CATGACCTAA CCTTCCAACT GTTTCCCGAG 
GTGCACGAGC GCTTAAAGCG CTTTTACTTT CCGGCTATTA TGCAACGTTC AGTGGCAAAG 
GCGCAGGCTG TATTTGCGGT GTCTCGGACC ACAGAAACGG ACCTAAAACG CATCATTCCA 
GAGAGTAGAG GAAAGACAAC CGTCACGCTG CTGGCTGCAC GCAAGCTGGG CTCGGATTCG 
CAGGCTCCCC GCGACCAACG TAACTCAGGC GACTACCTGC TCTTCGTCGG AACCTTAGAG 
CCACGAAAGA ATCTTCCACG ATTGCTGGCC GCCTGGCAGA TGCTCGATGA TGCCACCCGG 
GGCAACACGC GGCTTGTTAT CGTCGGCGCC ACGGGATGGA TGGTAAGCGA CTTGCTACAA 
AGCCTCAAGA CGAACGATAC CATAGATTTT CTGGGGCACG TCAGCGATTC TTCTCTAGCA 
GAACTGATGC AAGGCGCTAG GGCCCTTCTC TATCCATCAC TCTACGAGGG GTTTGGTTTG 
CCGGTGGTTG AAGCGATGGC GCGCGGAATA CCGCTGTTGA CCAGCAATAC CGGCGCTACC 
GCGGAGATCG CCGAAGGCGC GGCGATCCTT GTCGACCCGA CGAATGTGGA TGACATCCGT 
GGCGGACTTG TGAGGCTGCT GACGGAACCA GAGCTGCTTG GCGCCCTGTC CGCCCAAGGC 
CGCGAGCGGG CAAAATCATT CTCCTGGGAA CGCACGGCCC AACTGACATT GGAAACCCTG 
GAAGGGTTGA AGCGAGCATG A

Protein sequence

MRISIDATGL GGPKTGTSVY LIEILSRWSR NTSINHEFTI FASEKAVSLC SEAGLDHRFR 
FVRAPNNRHI RVIWQQLMIP WHMRRLGIDV HWGTAFVLPV ASQRPMAVTI HDLTFQLFPE 
VHERLKRFYF PAIMQRSVAK AQAVFAVSRT TETDLKRIIP ESRGKTTVTL LAARKLGSDS 
QAPRDQRNSG DYLLFVGTLE PRKNLPRLLA AWQMLDDATR GNTRLVIVGA TGWMVSDLLQ 
SLKTNDTIDF LGHVSDSSLA ELMQGARALL YPSLYEGFGL PVVEAMARGI PLLTSNTGAT 
AEIAEGAAIL VDPTNVDDIR GGLVRLLTEP ELLGALSAQG RERAKSFSWE RTAQLTLETL 
EGLKRA