Gene Rleg2_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3042
Symbol
ID	6981787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	3101065
End bp	3102192
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	63%
IMG OID	643397752
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_002282535
Protein GI	209550618
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0600] ABC-type nitrate/sulfonate/bicarbonate transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACATC TGACCTTCTC CTGGCAGGGC GTGACCGCCC TTCTCTTCTG CATGGCAGCA 
CTTGTCACCC TGCCGCTTCT GGCCGAAGGT GCGGCGCAGC CCTTCACCGA CGGCACGGCA 
AGCCTCGTTT TCACCATCGT CGTTGCGGCT GCCCTGCTAT CTTTTGCGCC GCAGCCGCCG 
GCCTATCGCG CCACCGTGCT GTTCATCGGC GCGCATGGCG CCGCCTGGAT GCTGCTTTCC 
GCTCTCTCCG GCAATGAGGG CATGGCAACG CGGGCTTATT TCCTGCTGCT GTTTTCCTGC 
TGGCTGCTTG CCTGGCGATG CGTCACCGAG CTGTCGAAAC TGCAGCCCGT CACTGCTTTC 
GGCAAATCTG CGCTCCAACT GCTGATCCCG GCGATCTTCG GCGCCTGGAT CCTCATCCTC 
TGGGAAGCCG CGACGCGCGG CGCCGGCATT CCCTTCATCA TCCTGCCGCC GCCGAGCGCC 
ATCGGTGCCC GTATCATGGC CTCCCTTCCC ATCCTCGGTG CCGACGTCAG GCAGACGATC 
TTCAAGGCGG TGCTGATCGG TTATGTCGTC GGCTGCCTTA GCGGCTTTGC CGTCGCGGTG 
CTGGCCGACC GCATCACCTT CCTGCGGCGC GGTCTCCTGC CGATCGGCAA CATGGTGTCG 
GCCCTGCCGA TCATCGGCGT CGCGCCGGTA ATGGTCATGT GGTTCGGCTT CGACTGGCCG 
TCGAAAGCCG CCGTCGTCAT CATCATGACC TTCTTCCCGA TGCTGGTGAA TACCGTCGCC 
GGCCTTGCCG CCTCCGGCAG CATGGAGCGC GACCTGATGC GCACCTACGC CTCGAGCGAC 
TGGCAGACAC TGCTCAAGCT CAAGCTTCCG GCCGCCATGC CCTTCATTTT CAACGCACTG 
AAGATCAACT CGACGCTGGC GCTGATTGGT GCCATCGTTG CCGAATTCTT CGGGACGCCG 
ATCGTCGGCA TGGGCTTCCG CATCTCCACC GAGATCGGCC GCATGAATGT CGACATGGTT 
TGGGCGGAAA TCGCCATCGC GGCGCTGGCC GGATCGATCT TTTATGGCAT CATCGCCCTG 
AGCGAACGGG CGGTGACGTT TTGGCATCCG TCTATCCGTG GTGGCTAG

Protein sequence

MRHLTFSWQG VTALLFCMAA LVTLPLLAEG AAQPFTDGTA SLVFTIVVAA ALLSFAPQPP 
AYRATVLFIG AHGAAWMLLS ALSGNEGMAT RAYFLLLFSC WLLAWRCVTE LSKLQPVTAF 
GKSALQLLIP AIFGAWILIL WEAATRGAGI PFIILPPPSA IGARIMASLP ILGADVRQTI 
FKAVLIGYVV GCLSGFAVAV LADRITFLRR GLLPIGNMVS ALPIIGVAPV MVMWFGFDWP 
SKAAVVIIMT FFPMLVNTVA GLAASGSMER DLMRTYASSD WQTLLKLKLP AAMPFIFNAL 
KINSTLALIG AIVAEFFGTP IVGMGFRIST EIGRMNVDMV WAEIAIAALA GSIFYGIIAL 
SERAVTFWHP SIRGG