Gene Rleg2_5333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5333
Symbol
ID	6978427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	958100
End bp	959209
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	62%
IMG OID	643394435
Product	ABC transporter related
Protein accession	YP_002279253
Protein GI	209547335
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA TTTCGCTTAA AGAGCTGAAC AAATCCTACG GCGCGCTCAC CGTCGTCCAC 
GATATCGATC TTGAGATCGC CGATAAGGAA TTCATCATCC TGGTCGGCCC CTCCGGCTGC 
GGCAAATCGA CGACGCTCAG GATGATCGCC GGCCTCGAGG AGATCTCCGG AGGAGAACTC 
AAGATCGGCG GCGACGTCAT GAACGACGTC CCCTCCAAGG ACCGGGATAT TGCCATGGTC 
TTTCAGAACT ATGCGCTCTA CCCACATATG ACCGTCTACA AGAACATGGC CTTCGGCCTG 
CAGCTCAGGA AGGTGTCGCG CGACTTCATC GATGCCCAGG TGCAGGACGC CGCCAAGATC 
CTCGACATCA CCCATCTCCT GAACCGCAAG CCGAAGGCGC TTTCGGGCGG TCAGCGTCAG 
CGGGTGGCGC TCGGCCGCGC CATGGTGCGC AATCCGGCCG TCTTCCTCCT CGACGAGCCG 
CTTTCCAACC TCGACGCCAA GCTGCGCGGC ACAATGCGCT CCGAAATCAC CAAGCTGCAC 
AAGCGCCTCA ACGCCACCTT CATCTATGTC ACCCACGACC AGGTGGAGGC CATGACCATG 
GCCGACCGGA TCGTCGTCAT GAAGGATGGC CACATCCAGC AGGTCGACAC GCCGCAGAAC 
CTCTATGACC GTCCCGTCAA CATGTTCGTC GCCGGCTTCA TCGGCGCACC GCAGATGAAC 
ATGCTGCCCT CGACCATTCA GCGCCGCGGC GATGGCTATG TCGCCGTCTT CGACGGCCGG 
GAACTGCCGC TGCCCGATCA TTTCGACAAG AGCAGGATCG CACCCTATGA GGGCCGCGAA 
CTGGTGCTCG GGCTTCGTCC GGAGAATTTC CACGAACTGC CGCCGGCCGA TATCCCGGCC 
GAGAACCTGG CGCCCCTCAA GGCAGTGGTC GAACTTGCCG AACCGATGGG CTCGGAGGTG 
CATCTGAACA TGGTGGCCGG CGGACGCAAT CTCATCGCCC GTGTGTCGCC GCGCTTCCGG 
CCAGCAATCG GCGACGAGGC GACGCTCACC GCCGATATGA GCAACGCGCA GCTGTTCGAC 
AAGGAAACGG AACGCTCGAT TCTTTACTGA

Protein sequence

MASISLKELN KSYGALTVVH DIDLEIADKE FIILVGPSGC GKSTTLRMIA GLEEISGGEL 
KIGGDVMNDV PSKDRDIAMV FQNYALYPHM TVYKNMAFGL QLRKVSRDFI DAQVQDAAKI 
LDITHLLNRK PKALSGGQRQ RVALGRAMVR NPAVFLLDEP LSNLDAKLRG TMRSEITKLH 
KRLNATFIYV THDQVEAMTM ADRIVVMKDG HIQQVDTPQN LYDRPVNMFV AGFIGAPQMN 
MLPSTIQRRG DGYVAVFDGR ELPLPDHFDK SRIAPYEGRE LVLGLRPENF HELPPADIPA 
ENLAPLKAVV ELAEPMGSEV HLNMVAGGRN LIARVSPRFR PAIGDEATLT ADMSNAQLFD 
KETERSILY