Gene Rleg_3654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3654
Symbol
ID	8014501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	3699155
End bp	3701131
Gene Length	1977 bp
Protein Length	658 aa
Translation table	11
GC content	63%
IMG OID	644826217
Product	glycogen debranching enzyme GlgX
Protein accession	YP_002977436
Protein GI	241206340
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1523] Type II secretory pathway, pullulanase PulA and related glycosidases
TIGRFAM ID	[TIGR02100] glycogen debranching enzyme GlgX

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.328672
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGGGA ACAGTTCGGC GCAAGCCGGC GCGATCGTCT TCGAGACCGG CGTCGAATTT 
GCCGTATGGT CGCATCATGC CGCACAGATC GAACTCTGCC TCTTCGAGGA TGACGGCAAC 
AGGGAATTCG CGCGCCTGCC GATGGCGCGC GACAGCAACC ACATCCATCG ACTGTTTGTC 
GACGGATTGA AGGCGGGCGC GCGCTACGGC TATCGCGCCG ACGGTATTTA TGCGCCCGAT 
AACGGCCTCT GGTTCGATCC CTCCAAACTG CTGATCGATC CCTACGCCAA GGAGATCGAT 
AGGCCGTTCC GCTACGATCC CCGCCTCGGC ATCTATGGCG AGGACAGCCA GGATCTGATG 
CCGAAGGCGA TTGTCACCAC CGATACCCGA GCCGCGATCA GCAAGCCGCT CTTCAAACCG 
GGCGGCTTTA TCTATGAGGT GGCGGTACGG CCCTTCACCA TTCTCCATCC CGACGTGCCG 
GAGGCTGAGC GCGGCACGGT CGCAGCGCTT GCCCATCCCT CCGTCGTCGC ACATCTGAAG 
CGGATCGGTG TCGATGCCGT CGAACTGATG CCGATCACCG CCTGGATCGA CGAACGCCAC 
CTTCCGCCGC TCGGCCTCAC CAACGGCTGG GGCTACAATC CCGTCGCCTT CATGGCGCTC 
GACCCGCGGC TCGTGCCTGG CGGCATGACC GAGTTGCGCC AGACGGTCGC GGCCCTCCAT 
GCCGAAGGCA TCGCCGTCAT CCTCGACCTC GTCTTCAACC ATACCGGCGA GAGCGACCGT 
TACGGCGCGA CGCTGTCGCT GCGCGGCCTC GACAACCTGC ATTATTATCG CCACGCCCAG 
AATTGCCCGG GCGAACTCGT CAACGACACA GGCACCGGCA ACACGCTCGC CTGCGATCAT 
CCTGAGGTTC GCCGCCTCGT CATCGACAGC CTACGCCATT TCGTGCTCAA CGCCGGCGTC 
GACGGTTTTC GCTTCGATCT CGCCCCGGTA CTCGGCCGCA CCGCGACGGG CTTCGAACGC 
GACGGAACAC TGGCCTCGAT CCTCTCCGAC GATGTGCTTG CCGACCGGAT CATGATCGCC 
GAACCCTGGG ATATCGGCCC GGGCGGTTAC CAGCTCGGCA ATTTCCCGCC GCCCTTCCTT 
GAATGGAACG ACCGGGTTCG CGATGATCTG CGCTGCTACT GGCGCGGCGA CGATTGGAAG 
ACCGGCGCGC TGGCAACCGC ACTTGCCGGC TCCTCCGACA TCTTCTCCCG CAACGACGGC 
AACGAGACGC GCAGCGTCAA TTTTCTCGCC GCCCATGACG GCTTCACGCT GATCGATCTC 
GTCTCCTATG CCGCAAAGCA CAACGACGCC AACGGCGAAC ACAATCGCGA CGGCCATAAC 
GAGAATCATT CCTGGAACAA CGGCGTCGAG GGGGAAACCG TCTATCCGAC GATCCGCAAG 
CGTCGCCGGG ACGATGTGAT GGCGCTGATC TCAACGCTTT TTGCCACCCG CGGCAGCATC 
ATGCTGACGG CGGGCGACGA GGGCGGCCGC AGCCAGCACG GCAACAACAA CGCCTATTGC 
CAGGACAACG AGATCACCTG GCTGGACTGG AAGGCGTTGG ACGAGGGTCT CATCGCCCAT 
ACCGCCTTCG TTGCAGGGTT ACGTCGCCGT TTCACCGTTT TCTCCGAAAC GGGCTTCCTG 
GCGGGAAATG GCGATGTCGA ATGGATTTCG CTTTCCGGCG AACCGATGAG CGTTGCCGAA 
TGGGAGACGC CGTCGCTCTC CACCCTCGGC ATGCTGTTAT CGACCGGTGA CCGCTCCTCT 
CGCGGCAGGC AGACCAGGCT TGGTGTGCTT TTCAATCGCT CGGGGAGCCG CCAATTTTTC 
ACGCTGCCTT CTCAGAGCGA ACCGGGCTGG CGCCAGTTGA CCCCGGATGG AGCGAAGAAA 
ACCGGTGGCC GTGCAACCGT CGAGCCACGC TCGATTGCCT TTTTCGTAGA AAATTGA

Protein sequence

MRGNSSAQAG AIVFETGVEF AVWSHHAAQI ELCLFEDDGN REFARLPMAR DSNHIHRLFV 
DGLKAGARYG YRADGIYAPD NGLWFDPSKL LIDPYAKEID RPFRYDPRLG IYGEDSQDLM 
PKAIVTTDTR AAISKPLFKP GGFIYEVAVR PFTILHPDVP EAERGTVAAL AHPSVVAHLK 
RIGVDAVELM PITAWIDERH LPPLGLTNGW GYNPVAFMAL DPRLVPGGMT ELRQTVAALH 
AEGIAVILDL VFNHTGESDR YGATLSLRGL DNLHYYRHAQ NCPGELVNDT GTGNTLACDH 
PEVRRLVIDS LRHFVLNAGV DGFRFDLAPV LGRTATGFER DGTLASILSD DVLADRIMIA 
EPWDIGPGGY QLGNFPPPFL EWNDRVRDDL RCYWRGDDWK TGALATALAG SSDIFSRNDG 
NETRSVNFLA AHDGFTLIDL VSYAAKHNDA NGEHNRDGHN ENHSWNNGVE GETVYPTIRK 
RRRDDVMALI STLFATRGSI MLTAGDEGGR SQHGNNNAYC QDNEITWLDW KALDEGLIAH 
TAFVAGLRRR FTVFSETGFL AGNGDVEWIS LSGEPMSVAE WETPSLSTLG MLLSTGDRSS 
RGRQTRLGVL FNRSGSRQFF TLPSQSEPGW RQLTPDGAKK TGGRATVEPR SIAFFVEN