Gene Rleg2_1361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1361
Symbol
ID	6980089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1379692
End bp	1381530
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	64%
IMG OID	643396082
Product	dihydroxy-acid dehydratase
Protein accession	YP_002280881
Protein GI	209548964
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0137226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCCT ACCGTTCCAG AACCACGACC CACGGCCGCA ACATGGCAGG CGCGCGCGGC 
CTTTGGCGCG CCACGGGCAT GAAGGATTCG GATTTCGGCA AGCCGATTAT CGCGGTGGTG 
AATTCTTTCA CCCAGTTCGT ACCCGGCCAC GTGCACCTGA AGGACCTCGG CCAGCTCGTT 
GCCCGCGAAA TCGAGGCGGC CGGCGGTGTC GCCAAGGAAT TCAACACGAT CGCCGTCGAC 
GACGGCATCG CCATGGGCCA TGACGGCATG CTCTATTCGC TGCCCTCGCG CGAACTCATC 
GCCGACAGCG TCGAATACAT GGTCAATGCC CATTGCGCCG ACGCCATGGT CTGCATCTCC 
AATTGCGACA AGATCACCCC CGGCATGCTG ATGGCGTCGT TGCGCCTCAA CATACCCACA 
GTCTTCGTCT CGGGCGGCCC GATGGAAGCG GGCAAGGTGG TGCTGCACGG CAAGACGCAT 
GCACTCGACC TCGTCGATGC CATGGTCGCC GCAGCCGATG AAAAGATCAG TGACGAGGAC 
GTTCAGACCA TCGAGCGCTC GGCCTGTCCG ACCTGCGGCT CCTGCTCCGG CATGTTTACC 
GCCAATTCGA TGAACTGCCT GACCGAGGCG CTCGGCCTGT CGCTGCCCGG CAACGGTTCG 
ACGCTCGCAA CCCACGCCGA CCGCAAGCGC CTCTTCGTCG AGGCCGGTCA TCTGATCGTC 
GATCTCGCCC GCCGTTACTA CGAGCAGGAC GATATCAAGG CGCTGCCGCG CACCATCGCC 
TCCAAGCAGG CCTTCGAGAA TGCCATGGCG CTCGATATCG CCATGGGCGG CTCGACCAAT 
ACGGTCCTGC ACATCCTTGC TGCTGCCCAT GAAGGCGAAA TCGATTTCAC CATGGCCGAT 
ATCGACGCGC TCTCGCGCCG AGTGCCCTGC CTGTCGAAGG TCGCACCCGC CAAGAGCGAT 
GTTCATATGG AAGACGTGCA CCGCGCCGGC GGCATCATGT CGATCCTCGG AGAGCTCGAT 
AAGGGCGGTC TCTTGAACCG CAATTGCCCG ACAGTGCATG CCGAGACGCT GGGCGATGCG 
ATCGACCGCT GGGATATCAC CCGCACCACC AGCGAAACGG TCCGCAACTT CTATCGTGCC 
GCACCCGGCG GCATCCCGAC CCAGGTTGCC TTCAGCCAGG AGGCCCGCTG GGACGAACTC 
GACACCGACC GCCAGAATGG CGTCATCCGC TCGGTCGAAC ATCCTTTCTC TAGGGATGGC 
GGCCTTGCCG TGCTCAAGGG CAATCTCGCG GTCGACGGAT GCATCGTCAA GACGGCCGGC 
GTCGATGAAT CGATCCTGAA ATTTTCAGGC CCGGCCCGTG TCTTCGAAAG CCAGGATGCC 
TCCGTGAAGG CGATCCTCGC CAACGAAGTG AAGGCCGGCG ACGTCGTCGT CATTCGCTAC 
GAAGGCCCGA AGGGCGGCCC CGGCATGCAG GAAATGCTCT ATCCGACGAG CTATCTGAAG 
TCGAAGGGCC TCGGCAAGGC GTGCGCGCTG ATCACCGACG GCCGCTTCTC CGGCGGTACC 
TCCGGCCTCT CGATCGGCCA CGCCTCGCCG GAAGCGGCCA ATGGCGGTAC GATCGGCCTG 
GTGCGCGAAG GCGACATGAT CGACATCGAC ATCCCGAACC GCACGATCAG CCTGCGCGTG 
GATGAGGCCG AACTCGCCGC CCGCCGCGCC GATCAGGACG CCAAGGGCTG GCATCCCGCA 
GAAGTGCGCA AGCGCAACGT CACGACGGCG CTGAAGGCTT ATGCTGCCTT TGCGACGAGC 
GCGGACCGCG GCGCCGTGCG CGATCTGAAC GCCCGCTGA

Protein sequence

MPAYRSRTTT HGRNMAGARG LWRATGMKDS DFGKPIIAVV NSFTQFVPGH VHLKDLGQLV 
AREIEAAGGV AKEFNTIAVD DGIAMGHDGM LYSLPSRELI ADSVEYMVNA HCADAMVCIS 
NCDKITPGML MASLRLNIPT VFVSGGPMEA GKVVLHGKTH ALDLVDAMVA AADEKISDED 
VQTIERSACP TCGSCSGMFT ANSMNCLTEA LGLSLPGNGS TLATHADRKR LFVEAGHLIV 
DLARRYYEQD DIKALPRTIA SKQAFENAMA LDIAMGGSTN TVLHILAAAH EGEIDFTMAD 
IDALSRRVPC LSKVAPAKSD VHMEDVHRAG GIMSILGELD KGGLLNRNCP TVHAETLGDA 
IDRWDITRTT SETVRNFYRA APGGIPTQVA FSQEARWDEL DTDRQNGVIR SVEHPFSRDG 
GLAVLKGNLA VDGCIVKTAG VDESILKFSG PARVFESQDA SVKAILANEV KAGDVVVIRY 
EGPKGGPGMQ EMLYPTSYLK SKGLGKACAL ITDGRFSGGT SGLSIGHASP EAANGGTIGL 
VREGDMIDID IPNRTISLRV DEAELAARRA DQDAKGWHPA EVRKRNVTTA LKAYAAFATS 
ADRGAVRDLN AR