Gene Rleg_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1104
Symbol
ID	8012226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1086304
End bp	1087791
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	63%
IMG OID	644823687
Product	putative glycosyltransferase protein
Protein accession	YP_002974938
Protein GI	241203842
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.414123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.408395
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGA GCAACCGTCG CGGCCTGAGT TGGATCTTTG TCCTGCTGGC GGCCTATTTC 
GTGCTTCAGG TCGGCGTGCG GCTCGCAACC TCGCATTCTC TCGATCTCGA CGAAGCCGAA 
CAGGCCTTCC GCTCGCAATG GCTTGCCGCC GGCTACGGCC CGCAGCCGCC CTTCTACAAC 
TGGCTGCAAT ACACCGTCTT CCAGTTCGCC GGCGTCTCGC TAACCGCCCT TTCGGTGGTG 
AAGAACCTAC TGCTGTTCAG CTCCTACGTG CTCTACAGCC TGACCGCGCG GCTTATCCTG 
CGCGACAAGG CGCTGGTGGC GATCGCCACG CTCGGACTGC TGACCATCCC GCAGATGGCT 
TTCGAGATGC AGCGCGACCT GACGCACACG GTCGCCGTGT TCTTCTCGGC CAGCATCTTC 
TTCTACGGCT TCATCCGCAG CCTGAAGCAG CCGAGCCTTG CCTCCTATCT CATCGCCGGC 
ATCGGCATCG GTTTCGGCCT GCTTGCTAAA TATAATTTCG CGATCCTGCC GGCGGCCGCC 
CTGATTGCCG CGCTTTCGGA TGCGCGCCTG CGGCCGCGGA TCTTCGACTG GCGGCTGGTG 
CTGACGGCGG CGGTAGCGCT CGTCATCATC CTGCCGCATC TCTTCTGGCT GAAGGACAAT 
CTCGATTTCG CCACCGCACG CACCCTGGAG AAGATGACCG CGAGCGGCCA TGCGAGCTAT 
CTCACGCAGG TGGCCATGGG CGTCAGTTCT CTGGCTCTCG CCATCATCAG CTTTGCCGGA 
TTGACTGTGG CGGTGTTCGC GATCGTCTTC GGCAAGAGCC TTCGTCCGGC GCTGACCGCC 
GGTTCGGAAT GGACGCGGCT GTTCGAGCGG ATGATGCTCG TCTTCCTCGC CGGCATTCTG 
CTTCTGATCG TCTTCGGCGG CGCGGCCGGC ATCAAGGATC GCTGGCTGGT GCCGATGCTC 
TTCATCCTGC CGCTCTATTT CTGCCTGAAG ATCGAGGCAG TGGGCGTCGC GACAGACAGG 
GCGTTCAGGC GTTTCATGCC CATCGTCGCC GTCATCATGA TCGGCGTGCC GGCGGCCCTT 
TACGGCAGCG TCGCGGCGGC ACGTATCACC GGTCATTACG AGCGGCTGAA CAGGCCTTAT 
GCCGGAATGC TGGAAACCTT GCGCAAACAG GCCGAACCGG CGGCGATCCT TGCCGGGGAC 
AGCCTGCTCG CCGGCAATCT CAGGCAGGAT ATTCCCGGCG TGCCGATCCT CTCGGTGGAT 
TATCCTGGCT TCCACCCGGA TCTTACCGGC CGGCGACCAC TTCTCCTGGT GTGGTTCCTC 
CCGCAGAGGG GGGGAAGCGA AGCTCTTCCG CCTGATATGG CTGAATGGCT GCAGACCCAT 
CTCGGCGTGT CCGCACCGCA GGCGTCGGTG ATCGACGTGC CCTATCTCTA TGGGCGCGGC 
GACGACCGCT ACCGTTTCGG CTATGCTTGG GTCAACCAGC CGGGCTGA

Protein sequence

MTESNRRGLS WIFVLLAAYF VLQVGVRLAT SHSLDLDEAE QAFRSQWLAA GYGPQPPFYN 
WLQYTVFQFA GVSLTALSVV KNLLLFSSYV LYSLTARLIL RDKALVAIAT LGLLTIPQMA 
FEMQRDLTHT VAVFFSASIF FYGFIRSLKQ PSLASYLIAG IGIGFGLLAK YNFAILPAAA 
LIAALSDARL RPRIFDWRLV LTAAVALVII LPHLFWLKDN LDFATARTLE KMTASGHASY 
LTQVAMGVSS LALAIISFAG LTVAVFAIVF GKSLRPALTA GSEWTRLFER MMLVFLAGIL 
LLIVFGGAAG IKDRWLVPML FILPLYFCLK IEAVGVATDR AFRRFMPIVA VIMIGVPAAL 
YGSVAAARIT GHYERLNRPY AGMLETLRKQ AEPAAILAGD SLLAGNLRQD IPGVPILSVD 
YPGFHPDLTG RRPLLLVWFL PQRGGSEALP PDMAEWLQTH LGVSAPQASV IDVPYLYGRG 
DDRYRFGYAW VNQPG