Gene Rleg2_2737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_2737
Symbol
ID	6981481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	2783027
End bp	2784700
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	60%
IMG OID	643397450
Product	glycosyl transferase family 39
Protein accession	YP_002282234
Protein GI	209550317
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0489967
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAGC CGCCACACGA GCCTTCCAAG CCGCTGCGTA TCGCGCCGGA CGACCCGGAA 
CTGAACCAGG CCGAAGCTCA CCAATATCAG CGGCAGACGG CCGACCGGGA GATGGCTGTT 
CGCAACTACA TGAGCCTCGA TACGGCGATC TTGCTGGGGA TCCTGTTGAT TGCGATCGTC 
TTCAGGTTCC ACAAGATCAC CTTACCGCTG GTCGACGGCT TCAGCTGGCG CGAGATAAGC 
ACCGCAATGA TGGCCGACAA TTTCCGAGAG CGCAGCTGGA ACATCTTCTT TCCGGAGGTC 
AGCTGGACCG GGCCCGGGCC AAGCTATCAG GGCCGCGAGT TCCAGATCGT CAGCTATCTC 
ACAGCCCTGC TCTACCAACT CTTCGGCTGG CACGACTGGT TTGGCCGAGT GGTTGCGGCC 
TGCTTCGGTC TGGTGACGGT GTTTTCGCTG CACAGGCTGA CGGCGCTATG CTGGGACAAG 
ATGCATGCCC ACGCGGCGGC ACTCGCCTAC GCGCTGATGC CGGCGGCGGT CATGATCGAC 
AGCTCGTTTC TTCCCGATCC CGCGATGCTG GCCTTGGTGA CCCTTGGCGT CTGGCTGTTT 
GCCAAATATT GGACCGGCGG CAGCGGCTGG CTTTTGCCGC TCGCCACGGT CAGCTTCTCG 
CTCGGCGTGC TGTCAAAACC ACCAGGCATC GCCGCCGGCG CCATCATCTT CTATCTGATG 
GTCTGCTGGA TTCTGGAGAA CAGGCGAAAG CAGGCGGCCT TGGTCTTCCT GTCGGGGCTT 
TTGAGCCTCG CTATCATCGG CGCTTATTTC AGTTGGGCGA TTTATCTCGC CCGCAGCTAT 
CCGCCGTTTC ATATGGCCGG CAGCGGCGGC TATATCTGGG ATTCCGGCTT CTGGACCTAC 
GTCAGGGAGA GATTCTATTT CAAATCCGCA TGGAACACCT CGGTTTTGTG GTTCTACGGC 
TACCCATTCC TGGTACTGTT CGCGGTCGGC TTATGGATGC CGCCCGAACC TGCCGAAGAC 
GAGAAGCAGC GTACCCTTTC GGCCATTCCC TATGTCTGGC TGACTGCGGC CACGATCCTC 
TATCTGGCGG CGGCGGGCGA GATCACCAGC AATGTGTGGA ACTTCCACAT CTTCCATGTA 
CCGATCGCGA TATTCTCAGG CCATGGCGCG CTTCTTCTGG CAAGGCTTTC ATCGAGAACC 
GTTTCCACGC TGGCGGTCGT GCTTCGCGCA ATATGCATCG TGGCCGTCAC GCTGGCCTGG 
TCGACCTTTC CCCTCGTCAG GACGATGAAG AAGCCAATCG CCATAAAGGG CAAGCTGCTT 
GGCGAGGAAC TGGCGCGGCT GGCGCAACCG GGCGACCTCG TCGTTGCCAT CGCGCCCGAG 
GTTGGCGATC CGGTCGCAGT CTACTATAGC AGGACGCGCG GCTGGGTGTT CCCGCCCGGC 
GGAGGCGATA CCGAATGGTC GAAATTCGTC GCGGATGACG CCACCGCGAT CACGCAGCTC 
GAAGAACTGC GCGCGCAGGG CGCGGATCTG TTCGGCGTCG CCAAGAATGC CACCGACAAG 
CAGGACCTGC TGTTCATCGA GCATCACGAC GGGGTTGCCG ACTATCTGGA CAAGACAGCA 
ACCAAGCTCG TGGATTCGGA CGATCTGCTG GTCTATCGGA TCACCCGTCC ATGA

Protein sequence

MTKPPHEPSK PLRIAPDDPE LNQAEAHQYQ RQTADREMAV RNYMSLDTAI LLGILLIAIV 
FRFHKITLPL VDGFSWREIS TAMMADNFRE RSWNIFFPEV SWTGPGPSYQ GREFQIVSYL 
TALLYQLFGW HDWFGRVVAA CFGLVTVFSL HRLTALCWDK MHAHAAALAY ALMPAAVMID 
SSFLPDPAML ALVTLGVWLF AKYWTGGSGW LLPLATVSFS LGVLSKPPGI AAGAIIFYLM 
VCWILENRRK QAALVFLSGL LSLAIIGAYF SWAIYLARSY PPFHMAGSGG YIWDSGFWTY 
VRERFYFKSA WNTSVLWFYG YPFLVLFAVG LWMPPEPAED EKQRTLSAIP YVWLTAATIL 
YLAAAGEITS NVWNFHIFHV PIAIFSGHGA LLLARLSSRT VSTLAVVLRA ICIVAVTLAW 
STFPLVRTMK KPIAIKGKLL GEELARLAQP GDLVVAIAPE VGDPVAVYYS RTRGWVFPPG 
GGDTEWSKFV ADDATAITQL EELRAQGADL FGVAKNATDK QDLLFIEHHD GVADYLDKTA 
TKLVDSDDLL VYRITRP