Gene Rleg2_3476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3476
Symbol	araG
ID	6982230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3591167
End bp	3592672
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	62%
IMG OID	643398194
Product	L-arabinose transporter ATP-binding protein
Protein accession	YP_002282969
Protein GI	209551052
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTCC TCGAATTCAA CAATATCTCC AAGGGTTATC CCGGCGTGCA GGCGCTGGCG 
GATGTTTCAT TCTCAGTCGA GAAGGGCGCC GTGCACGGCC TGATGGGCGA GAACGGCGCG 
GGCAAATCGA CGCTGATCCG CGTGCTATCA GGTGATCAGG CCGCCGATAC CGGCAGCATC 
CTGATCGGGG CGGAGGAGCA GAAATACGGA TCCGTGCGTG ACGCCTTTCA TGCTGGTATC 
GTCGTCATCC ATCAGGAATT GCAGCTCGTT CCGGAGCTGA CGGTGGCCGA AAATCTCTGG 
CTCGGGCGTT TTCCGGCCAA GGGCGGCATG ATCCATTCGA GCAGGCTGAT CGAAACGGTG 
CGGGGAAAGC TCGAAGAGAT CGGCATCGAC GTCGATCCGG CGGCCAAGGT CGCCACGCTT 
TCGATCGGCG CGCGGCAGAT GGTCGAGATC GCCAAGGCCG TCATGCTCGA CGCACGGGTG 
ATCGCGCTCG ATGAGCCGAC CTCCTCGCTT TCATCGCGCG AGAGCGAGAT CCTGTTTTCC 
CTGATCGAGA GGCTGAAGGC GAAGGGAACG GTCATTCTCT ACGTCTCGCA TCGTCTCGAC 
GAGATTTTTC GGCTTTGCGA CAGCCTAAGC GTGTTGCGCG ACGGCAAGCT TGCCGCCCAC 
CATCCCGACA TCGCCGAGAC GACACGCGAG CAGATCATCT CGGAAATGGT CGGGCGCGAG 
ATCAGTAATG TCTGGGGATG GCGCGAACGT CCGCTCGGCG ACATCAGGCT GGAGGTCAAG 
GGCCTGTCGG GGCCGAGGCT GCGCAATCCC ATCGGTTTCT CCGTCCGCCA GGGCGAGATC 
CTCGGCTTCT TCGGCCTGAT CGGCGCCGGC CGCAGCGAGA TGGCGCGGCT GCTCTACGGC 
GCCGATGTCA GGCATCAGGG TCAGGTCGCG ATCGATAGCG TTGTCGTCTT GCCGAACAGT 
CCGAAGGCGG CGATCAAGGC CGGCATGGTG CTCTGCCCGG AGGACCGCAA ATTCGACGGC 
ATCGTCCAGG GCCGGTCGAT CGAAGAGAAT ATCGCGATTT CGTCGCGCCG GCATTTCTCG 
CCCTTCGGCA TTCTGAGCCC GAAAAAAGAG GCGGCGCTGG CCGATCGGTT CATCGCCCGG 
CTTCGGGTGC GAACCCCGTC GCGCAAGCAG GACATCATCA ATCTCTCCGG CGGCAACCAG 
CAGAAGGTCA TTCTCGGCCG CTGGCTTTCC GAGCAGGGCA TCAAGGTCCT CGTCATAGAC 
GAACCGACGC GCGGCATCGA CGTCGGGGCG AAATCGGAAA TCTACGAGAT CCTTTACGAA 
CTTGCGGCCG GCGGCATGGC GATCGTGGTC ATATCAAGCG AATTGCCCGA GGTCATGGGC 
ATCTGCGATC GCATCATGGT GATGTGTCAG GGCAAGGTGG CGGCCAATGT CGCCCGCCAG 
GATTTCGACG AGCGCGCCAT CCTCACCGCT GCGCTCCCCG ATAAGAATGC CGCAGGCAGC 
ATTTAG

Protein sequence

MAFLEFNNIS KGYPGVQALA DVSFSVEKGA VHGLMGENGA GKSTLIRVLS GDQAADTGSI 
LIGAEEQKYG SVRDAFHAGI VVIHQELQLV PELTVAENLW LGRFPAKGGM IHSSRLIETV 
RGKLEEIGID VDPAAKVATL SIGARQMVEI AKAVMLDARV IALDEPTSSL SSRESEILFS 
LIERLKAKGT VILYVSHRLD EIFRLCDSLS VLRDGKLAAH HPDIAETTRE QIISEMVGRE 
ISNVWGWRER PLGDIRLEVK GLSGPRLRNP IGFSVRQGEI LGFFGLIGAG RSEMARLLYG 
ADVRHQGQVA IDSVVVLPNS PKAAIKAGMV LCPEDRKFDG IVQGRSIEEN IAISSRRHFS 
PFGILSPKKE AALADRFIAR LRVRTPSRKQ DIINLSGGNQ QKVILGRWLS EQGIKVLVID 
EPTRGIDVGA KSEIYEILYE LAAGGMAIVV ISSELPEVMG ICDRIMVMCQ GKVAANVARQ 
DFDERAILTA ALPDKNAAGS I