Gene Rleg_0449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0449
Symbol
ID	8011649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	466227
End bp	467411
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	55%
IMG OID	644823043
Product	glycosyl transferase group 1
Protein accession	YP_002974297
Protein GI	241203201
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATAT TGATCTATCT CACCGGCGGT ACCCACTGGA TTGGCGGTGT CCAGTACACT 
CGCAACCTGT TGCGCGCTGT TTCGCTGCTG CCAGCGCAGG AACGCCCCGC GCTCGTGCTT 
CAGATAGGTC GGAAGAATGC TGGCCAAGGA TACGAGGAGG AATTCTCGCA CTATCCCGGG 
GTGGTCATCG ATGGGCCACT TGAGCGGGGT TCGGCGATCC GGTCAAGAAT ATTGGATCTC 
GCGCGGCGCG CATGGAAGAG GTCGACCGGC AAGGATCTAC GTCAGAAGCT TCTGCACTCC 
GACGAGTGTG ACGTCGCATT TCCTGCAAAA GGTCCAAACA TTCCGGGTTT GGCACAGAAG 
GTCTATTGGG TTCCTGATTT TCAGTACAAG CATTTCCCAC AGTTTTTCTC CGAAGACGAG 
CGACGTAGCC GTGACGCCTT TTACGGAAAG ATGTTTGATG AGAGCGGCAT TCTTGTCCTG 
AGCAGTGAAG CGGTGAAAGC CGACTTCATA CGGTTTTTCC CGACCTATTC CCAAAAACCG 
GTGCGCATCC TCCACTTTTC AAGCACGCTT CATGACGAGG AGTATGCCCT GGATCCAGTC 
GCGGTCTGTG CTAAACATGG CTTGCCGGAA AAATTTGTGT ATCTGCCCAA TCAGATGTGG 
CAACACAAGG GCTTCGACGC CGCCTTTCGT GCGCTGGGCA TTCTGAAACG CGCGGGGGTT 
ATCATCCCCC TTGTCCTGAC GGGGAGCTCA GAGGATTATC GCAGTAATGA CTACGCTCGC 
CAACTCGAAG AAATCCTGAC GGAATATGAC CTTCAGGATC AGATCTACCG TCTGGGCGTC 
CTGCCGCGAA GCGAGCAACT TCAGCTTTTC CGCCGCGCTG CCGTTGTTCT TCAGCCATCA 
CGGTTCGAAG GGTGGAGCAC GACAGTCGAA GATACCCGCG CCCTGGGGAG GCCGATCGTG 
TTGTCGAACA TCGATGTTCA TCTGGAGCAG GCCCCCCCAA ACGCGAGCTA TTTTGTTGTC 
GGGGATCAAA AAGATCTTGC GGATAAGCTC GGCAAAGCTT GGCTCACCGC CGAGGCGGGG 
CCTGATTTCA AACAGGAAGA TGCCGCACGC AAGGCGGCAA ACCTCAACAG TTTGGCGTAT 
GCGAGGACCT TTCTTTCAAT TATGAGACAG GCTCATCGCG AGTGA

Protein sequence

MKILIYLTGG THWIGGVQYT RNLLRAVSLL PAQERPALVL QIGRKNAGQG YEEEFSHYPG 
VVIDGPLERG SAIRSRILDL ARRAWKRSTG KDLRQKLLHS DECDVAFPAK GPNIPGLAQK 
VYWVPDFQYK HFPQFFSEDE RRSRDAFYGK MFDESGILVL SSEAVKADFI RFFPTYSQKP 
VRILHFSSTL HDEEYALDPV AVCAKHGLPE KFVYLPNQMW QHKGFDAAFR ALGILKRAGV 
IIPLVLTGSS EDYRSNDYAR QLEEILTEYD LQDQIYRLGV LPRSEQLQLF RRAAVVLQPS 
RFEGWSTTVE DTRALGRPIV LSNIDVHLEQ APPNASYFVV GDQKDLADKL GKAWLTAEAG 
PDFKQEDAAR KAANLNSLAY ARTFLSIMRQ AHRE