Gene Rleg_4944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4944
Symbol
ID	8007537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	322849
End bp	324015
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	57%
IMG OID	644821861
Product	ABC transporter related
Protein accession	YP_002973121
Protein GI	241113286
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.719486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCCA TGACCTTCGA TGGGATCGGC AAGACCTTTC CGGACGGAAC CGTTGCCGTT 
GCGAATGTAA GTTTTTCGGT CGCCAACGGA GAATTCGTCG TGTTGGTCGG CCCGTCCGGT 
TGTGGCAAGT CGACATTATT GCGGATCGCA GCGGGTCTTG AAACGCTCAA CAGCGGCCGG 
TTGCTCATGG ATGACGCTAA TGTCACCGAG ACTGAGCCCC AGGACCGGGA TATCGCGATG 
GTTTTTCAGA ACTACGCGCT TTACCCCCAT ATGACTGTCT ACGACAATAT GGCCTTCGGT 
CTGCAGCAGC GCAAAATGCC CAAGGACAAG ATCGATAAGC TGGTGCGTGA CGCGGCGGAA 
ATGCTCGACC TTACCCGCTA TCTCGAACGC AAACCAGGGG CGTTGTCGGG TGGCCAGCGC 
CAACGTGTGG CAATGGGTCG GGCGATCGTT CGCCATCCCA TGGCCTTCCT GATGGACGAG 
CCGCTTTCAA ACCTTGATGC CAAGCTCCGC GTACAGATGC GCGGCGAACT GAAGTTGCTC 
AACCAGCGGC TCGGTGTAAC GACGCTCTAC GTAACCCACG ACCAGGTCGA AGCCATGACC 
ATGGGCGATC GTGTCGCTGT GCTGAAGCCA GTATTCAATG GCGAGGAGAG CAATCTTCAG 
CAGATCGACA CCCCGCAAAT GCTCTACGAC AAGCCCGCCA ACCTCTTTGT CGCGGGCTTC 
ATCGGATCGC CGGCGATGAA TTTTGTGCGC GTCGAGTTGA CTGCGGAAGC CGGGTCACTC 
AAAGCTGCGG TAACTGGAAC GCAGATATCC TTCTCCGTCG CCGCCAAGCC GGCACTTTCG 
GAATATATAG GCCGGCAGGT CATCGTTGGA ATTCGCCCGG AGATGTTTCT GGTTTGCCCC 
GCGTCTGAAG CCCTCTTCAA CGAGCAGGTC CCGGTTGCCG AAGCGCTGGG AGCCGACACC 
TTCGTCTTTT TCGACATCGC GTCACCGCCG GTCAACGTAA ACGATGCCGA AGATACCGAA 
GACTTTCCAA ACAAAGGTAA GAACCGACTT GTCGCGCGGA TCCCACCGGC GCTCACACCG 
CGTCCCAACC AACATTTGCC GCTCACTGTC GATCTGGAGA AATTGCACTG GTTCGATCCG 
GTAACCGGAA CTGCGATCCG AGACTGA

Protein sequence

MASMTFDGIG KTFPDGTVAV ANVSFSVANG EFVVLVGPSG CGKSTLLRIA AGLETLNSGR 
LLMDDANVTE TEPQDRDIAM VFQNYALYPH MTVYDNMAFG LQQRKMPKDK IDKLVRDAAE 
MLDLTRYLER KPGALSGGQR QRVAMGRAIV RHPMAFLMDE PLSNLDAKLR VQMRGELKLL 
NQRLGVTTLY VTHDQVEAMT MGDRVAVLKP VFNGEESNLQ QIDTPQMLYD KPANLFVAGF 
IGSPAMNFVR VELTAEAGSL KAAVTGTQIS FSVAAKPALS EYIGRQVIVG IRPEMFLVCP 
ASEALFNEQV PVAEALGADT FVFFDIASPP VNVNDAEDTE DFPNKGKNRL VARIPPALTP 
RPNQHLPLTV DLEKLHWFDP VTGTAIRD