Gene Rleg_5221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5221
Symbol
ID	8007116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	633004
End bp	634149
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	61%
IMG OID	644822130
Product	ABC transporter related
Protein accession	YP_002973390
Protein GI	241113555
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.533287
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.501993
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGTGG TTGTACTCGA CAAAATCTGC AAGACCTATG GAAACAGCTA CCATGCGATC 
AAGGATCTGA GCCTGACGAT CCATGATGGC GAGTTTCTGA TTCTGGTCGG GCCGTCCGGA 
TGCGGAAAAT CGACCGCTCT GCGCATGATT GCCGGGCTCG AGGAAATCAG CAGCGGAACA 
TTGAGCATCG GCGGCCAGGA CGTCGTGGAT CTCGCGCCCA AGGACCGGGA CATTGCCATG 
GTCTTTCAGA GCTATGCGCT TTATCCGCAC ATGACCGTCT TCGATAACAT TGCCTTTTCG 
ATGAAGCTGG CCGGAAAGAA CAAGGCCGAA CGCACCAAAC GTGTCCACGA AATCGCCAAG 
ATCCTGCAGC TGGAGCCCTT GCTGGGCAAC AAGCCCGCGC AGCTTTCCGG CGGCCAGCGC 
CAGCGTGTTG CGATGGGCCG CGCCATGGTC CGCGAGCCCG CGGCATTCCT CATGGACGAA 
CCGCTCTCGA ACCTCGATGC GAAGCTGCGT GTTCAGATGC GGGCAGAGAT CGCCAGCCTG 
CAGAGACAGC TGGGCGTGAC GACGATCTAT GTGACGCACG ACCAGACTGA AGCGCTGACC 
ATGGGCGATC GGGTCGCGGT GCTGAAGGGC GGCGTGCTGC AGCAGGTGGA TACGCCCAAG 
GCTCTGTATC ACCGCCCGGT CAATGCGTTT GTCGCCGGCT TTATCGGTTC GCCGTCGATG 
AACCTTTTCG AAGGGCGTCT GGCGGGCGGA CGGATCCATC TGCCGGGCTT CTCCATCCCC 
TTGTCCGGCG GCGCCTTCGA GCGCTCTCCC GGTCTATCCG CTTTCGAGGG AAAGGATGTG 
ATCTTTGGGG TCAGGCCCGA GGACCTCTAC GACAGCCGGT TGCCATCTGG CGCCTCCCAT 
CCGACGATCC CGGTTGTCGT GAAATCGATC GAGGAGCTTG GCTCCGAGCT GATCGTGCAT 
TTGAAGATCG ACGCGGTCCG CATCGACTCG GGCGACCCCG ATGCCGTCGA GGACCTGAGC 
GGGGCCGCCA ATGCCGTCGC GCGGTTCGAA GCGGTCAGCG CGGTCGAGAC AGGCCAATCG 
ATCGACCTGG CCATCGACCC GGCGAAACTG CACTTTTTCC ACCCTCAAAC GCATATGGCG 
CTGTGA

Protein sequence

MAVVVLDKIC KTYGNSYHAI KDLSLTIHDG EFLILVGPSG CGKSTALRMI AGLEEISSGT 
LSIGGQDVVD LAPKDRDIAM VFQSYALYPH MTVFDNIAFS MKLAGKNKAE RTKRVHEIAK 
ILQLEPLLGN KPAQLSGGQR QRVAMGRAMV REPAAFLMDE PLSNLDAKLR VQMRAEIASL 
QRQLGVTTIY VTHDQTEALT MGDRVAVLKG GVLQQVDTPK ALYHRPVNAF VAGFIGSPSM 
NLFEGRLAGG RIHLPGFSIP LSGGAFERSP GLSAFEGKDV IFGVRPEDLY DSRLPSGASH 
PTIPVVVKSI EELGSELIVH LKIDAVRIDS GDPDAVEDLS GAANAVARFE AVSAVETGQS 
IDLAIDPAKL HFFHPQTHMA L