Gene Rleg2_4666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4666
Symbol
ID	6977760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	303357
End bp	304427
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	63%
IMG OID	643393840
Product	ABC transporter related
Protein accession	YP_002278658
Protein GI	209546740
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.47492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGCT TGAGCATCAG AAACGTCAAG AAATCCTTCG GCACGGTCGA TATCATTCAT 
GGCGTCGACG TCGAGATCGC CGATGGTGAA TTCACCATCC TGGTCGGCCC CTCCGGCTGC 
GGCAAGTCGA CCTTGCTGCG CATGATCGCC GGACTTGAGG ATATCACCGG CGGCCAGATC 
AGCATCGACG GCCGGGTGGT GAACAATCTG CAGCCGAAGG ATCGCGATAT CGCGATGGTC 
TTCCAGAACT ACGCGCTGTA CCCGCAGATG ACCGTCTCCC AGAACATGGG CTTCGCGTTG 
GAGCTTGCCG GCGCCAAGCG GCCGGAGATC GAAAAGAAAG TCGGCGAGGC CGCCGCCATT 
CTCGGCCTGC AGCCGCTTCT CCACCGCAAG CCGGCCCAGC TTTCCGGCGG GCAGCGCCAG 
CGCGTCGCCA TGGGCCGCGC CATCGTTCGC GATCCCAAAG TCTTCCTCTT CGACGAGCCG 
CTTTCCAATC TCGATGCGAA ACTGCGGGTG AAGATGCGGG CGGAGATCAA GGCGCTGCAT 
CAGCGGCTGA AGACGACCAT CGTCTACGTC ACCCATGACC AGATCGAAGC CATGACCATG 
GCCGACAAGA TCGTCGTGCT GCATGGCGGC CGTGTCGAGC AGATCGGCAG TCCGCTCGAA 
CTCTACGACA GGCCGCGCAA CATTTTCGTC GCCGGTTTCC TCGGCTCCCC CGCCATGAAC 
TTTCTCGAGG GGACGATCGA TGAGGCGGGA AAGCCGGCAT TGGCGCTTTC CAGCGGGTCG 
CGCGTGGCAC TCTCGCGGGC GCCGGCCAAT TCCGCCAACC GGCCGCTGAC CCTCGGCATC 
CGCCCCGAAG ACATCGCCTT CGGCGGCGAG AACGGGGTCG ATGCCGTGGT CAAGGTGGTC 
GAGCCGACGG GATCGGAAAC CCATGTCGCC GTGGAGGTGG ATGGCCGGGA GCTCACATGG 
GTGGTGCGCG AACGTGTCGA GCTCGCCCCG GAACAGCCGG TAAAGCTTTC CTTCGAGACC 
TCCAAGGTTC ATTTTTTCGA CCGGCAGACG CAGCAGCGTT TGAACGCCTG A

Protein sequence

MSGLSIRNVK KSFGTVDIIH GVDVEIADGE FTILVGPSGC GKSTLLRMIA GLEDITGGQI 
SIDGRVVNNL QPKDRDIAMV FQNYALYPQM TVSQNMGFAL ELAGAKRPEI EKKVGEAAAI 
LGLQPLLHRK PAQLSGGQRQ RVAMGRAIVR DPKVFLFDEP LSNLDAKLRV KMRAEIKALH 
QRLKTTIVYV THDQIEAMTM ADKIVVLHGG RVEQIGSPLE LYDRPRNIFV AGFLGSPAMN 
FLEGTIDEAG KPALALSSGS RVALSRAPAN SANRPLTLGI RPEDIAFGGE NGVDAVVKVV 
EPTGSETHVA VEVDGRELTW VVRERVELAP EQPVKLSFET SKVHFFDRQT QQRLNA