Gene Rleg_3195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3195
Symbol
ID	8014092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3196674
End bp	3197858
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	60%
IMG OID	644825758
Product	glycosyl transferase family 2
Protein accession	YP_002976985
Protein GI	241205889
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTTG CGGTCCGAGA CATCGACATT CTTGACCTTC CGCCAGATTT TGGGCCGACT 
GGTGACTATC AGGGTGCACT TGTGCTGATC CGGGTCGCCG GTCGTCCGTG CGGCCAAGCT 
GTGATCGCCT TCGACACCGA TGGCGGCAAG ACGCCAATTA AGGATCGGAT TCTGTCTGCG 
GCCAGTTCGT CGGTGTTCGA GGCTTGGCTG AGGCATCGGC TGGCCCTCCC TGACCCGTCG 
CCGACTCCAA ATCAGCTGCC GAAAGCTTCC GTGGTGATCT GCACGCGCGA TCGTACCGAA 
GATCTGGAGC GCTGCCTCAC CGGGCTTTTG GCTATGCCCG ATAAGGCCGA TATTCTAGTC 
GTCGACAATG CCCCATCGAA CGAGGCCACG CGAGATTTAG TCGGGCGCTT CGATACTGTG 
AGATATCTGC GCGAGCCGCG TCCTGGTCTT GACGTCGCGC GCAATACTGC CCTTCGCAAC 
ACAGAAGCAG ACGTCGTCGC CTTCATCGAC GACGATGCGG TCCCCGACCC GCTATGGCTT 
AGAACCTTGC TTCGCAATTT CGAGGACCCC CTGGTGCTGG CCGTAACCGG CCTTACTATG 
GCGTCCGAGC TGGAAACGGA CTCGCAGATC GCCTTTCAAC ATTTTGGCGG TTTTTGCCGT 
GGTTTCAGGC GTCAGGTCTA TGACGCCTAC AACCTGGACC CTTTCACCGG ATGGCATGCG 
GGTGCCGGTG TCAACATGGC ATTGCGCCGA ACGATCGTTG ACGTGGTGGG GTGGTTCGAC 
GAGGCCCTCG ACGCTGGAAC ACTAAGTCTG GCTGGTGGCG ACACAGACAT GTTCCGGCGC 
GTGCTCGAAG CCGGGTATCG GATCATCTAC GATCCCGAAG CTCTGAACTG GCACCGCCAT 
CGTCGCTCAA GCAAGGAACT TCAGCAGCAG ATGTATGGCT ACGAGGCTGC ATCGCTCGCC 
ATCTTGACGA AGGCCCTCGT GTTCGAGGGA AACCCGCGCG CGCTCCCTCG CATGATTCGT 
TCGTACATCA GGCTTTTTCG GCGATTGTTT CAACCTCGAC GGACACACCA ATTCAGCCTG 
CCTTACAACG ACGCCTTAAC CCAGTTCAGA GGGGCTGCGA GCGGCCCGGT TCGTTATCTG 
AGGGCGCGGG CGCGAGCAGT GAAGGCAGGG CATAAGCGTG GTTGA

Protein sequence

MRLAVRDIDI LDLPPDFGPT GDYQGALVLI RVAGRPCGQA VIAFDTDGGK TPIKDRILSA 
ASSSVFEAWL RHRLALPDPS PTPNQLPKAS VVICTRDRTE DLERCLTGLL AMPDKADILV 
VDNAPSNEAT RDLVGRFDTV RYLREPRPGL DVARNTALRN TEADVVAFID DDAVPDPLWL 
RTLLRNFEDP LVLAVTGLTM ASELETDSQI AFQHFGGFCR GFRRQVYDAY NLDPFTGWHA 
GAGVNMALRR TIVDVVGWFD EALDAGTLSL AGGDTDMFRR VLEAGYRIIY DPEALNWHRH 
RRSSKELQQQ MYGYEAASLA ILTKALVFEG NPRALPRMIR SYIRLFRRLF QPRRTHQFSL 
PYNDALTQFR GAASGPVRYL RARARAVKAG HKRG