Gene Rleg2_1457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1457
Symbol
ID	6980185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1484020
End bp	1485018
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	61%
IMG OID	643396178
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_002280977
Protein GI	209549060
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.303505
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAATC TCAACCGACG TAATTTCCTG AGGACCGCCG CTCTAACCGG TACGGCGCTT 
GCGGCGCCAG GCTTTGTCCG CACAGCCGCC GCCCGCACGA CGACGATCAC GATCGCCTCT 
CTGCTCGGCG ACGACAAGCC GGAGACGAAG ATCTGGGTGA AAATCGGCGA GCTGGTCGAA 
GCCAAACTTC CCGGCCAGTT CAAGTTCAAT ATCGTCAGGA ACGGCGCGCT CGGCGGCGAG 
AAGGAAGTGG CCGAAGGCGT GCGGCTCGGC TCGATCCAGG CGAGCCTTTC GACGGTGTCG 
TCGCTGTCCG GCTGGGCGCC CGAACTGCAG ATCCTCGATC TGCCTTTCCT CTTTCGCGAT 
GCCGACCATG TGCGCAGAAC TGTCGGCGGC GATGTCGGCG CCGATCTCAA GCAGAAACTG 
CAGGCGCAGA ATTTCGTCGT CGGCGATTTT ATCAATTACG GCGCCCGCCA TCTCCTGACC 
AAGGAGCCGG TGACGCGACC CGAGCAGCTC AAGGGCAAGC GCATCCGCGT CATCCAGAGC 
CCGCTTCACA CCAAGCTTTG GAGCGCATTC GGCACGACGC CGATCGGCAT TCCGATCACC 
GAGACCTACA ATGCGCTGGC AACCGGCGTC GCCGACGCCA TGGACCTGAC CAAATCGGCT 
TACTCAGGCT TCAAGCTTTA TGAGGTCGTG CCCGATATGA CCGAGACAGG CCACATCTGG 
GCATCCGGCG TCATCTATTA TTCCTCGACC TTCTGGGCCG GCCTGAATGA CGAGCAGAAG 
GCGGTTTTCC AGCAGGCTTC CAGCGAAGGA GCCGCCTATT TCAACCAGCT GATCGTCGAC 
GACGAGGTAA AGTCCGTGGA AACGGCGCTT GGCCATGGCG GCAAGCTCTT GAAGCCGGAA 
GCCTTCGAGG AATGGCAGAA GGGCGCGCAG GGCGTCTGGG CCGATTTCGC GCCTGTTGTC 
GGCGGCCTCG ACAGGATCAA AACCGTTCAG GCGGCTTGA

Protein sequence

MNNLNRRNFL RTAALTGTAL AAPGFVRTAA ARTTTITIAS LLGDDKPETK IWVKIGELVE 
AKLPGQFKFN IVRNGALGGE KEVAEGVRLG SIQASLSTVS SLSGWAPELQ ILDLPFLFRD 
ADHVRRTVGG DVGADLKQKL QAQNFVVGDF INYGARHLLT KEPVTRPEQL KGKRIRVIQS 
PLHTKLWSAF GTTPIGIPIT ETYNALATGV ADAMDLTKSA YSGFKLYEVV PDMTETGHIW 
ASGVIYYSST FWAGLNDEQK AVFQQASSEG AAYFNQLIVD DEVKSVETAL GHGGKLLKPE 
AFEEWQKGAQ GVWADFAPVV GGLDRIKTVQ AA