Gene Rleg_6061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6061
Symbol
ID	8016323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	+
Start bp	95850
End bp	96878
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	60%
IMG OID	644827369
Product	extracellular solute-binding protein family 1
Protein accession	YP_002978569
Protein GI	241258685
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGA AGACCCTTTC CCTCATGCTC TTCGCCGGCA CGGCGCTCGG TGCGCTACCG 
GCGCAGGCGG CCGGCGAACT CAACCTCATC TGCTCGGCGG ACGTCGTGAT CTGCGAGCAG 
ATGAAGGGCG ATTTCGAGAA GTCGCATAGC GACATCAAGG TGAACATGGT TCGCCTCTCG 
TCGGGCGAGA CCTATGCCAA GGTGCGCGCC GAGTCTCGTA ACCCGAAGAC CGACATCTGG 
TGGGCTGGCA CAGGCGATCC GCATCTCCAG GCGGCATCGG AAAATTTGAC GCTGGAATAC 
AAGTCGTCGA AACTCGACGA ACTCAACGAC TGGGCGAAGA AGCAGGCAGA AAGCTCCGGT 
TACAAGACCG TCGGCGTTTA TGCCGGCGCG CTCGGCTGGG GCTACAACAC GGAAATCTTC 
AAGACCAAGG GCTACAAGGA GCCAGTCTGC TGGGCCGACC TTTTGGCACC GGAACTGAAG 
GGTGAAATTC AAATCGCGAA CCCGAATTCT TCCGGCACCG CTTACACGGC GCTCGCCTCT 
CTCGTGCAGA TCATGGGCGA GGACCAGGCT TTCGACTACC TGAAGAAGCT GAACGGCAAC 
ATATCGCAAT ATACCAAGTC CGGATCGGCA CCCGTCAAGG CCGCAGCACG CGGCGAGACG 
GCGCTCGGCA TCGTCTTCGT GCACGATGCG GTGGCGCAGA CGGCTGAAGG CTTCCCGGTC 
AAGTCGATCA CGCCTTGCGA AGGTACCGGC TACGAGATCG GCTCCATGTC GATCATCAAG 
GGCGCCCGCA ACCTCGAAAA TGCGAAGGTC TGGTACGACT GGGCGCTGAC GGCGGAAGTC 
CAGTCGCGCA TGAAGGATGC CAAGTCTTTC CAGCTGCCTT CCAACAAGAG CGCCGTAATC 
CCGAAGGAGG CGCCGCGCTT CGAGGACATC AAGCTGATCG ACTACGACTT CAAGACCTAT 
GGCGACCCAG CAAAGCGCAA GGCACTGCTG GAACGCTGGG ATCGGGAAAT CGGCGCCGCC 
GCCAACTGA

Protein sequence

MKMKTLSLML FAGTALGALP AQAAGELNLI CSADVVICEQ MKGDFEKSHS DIKVNMVRLS 
SGETYAKVRA ESRNPKTDIW WAGTGDPHLQ AASENLTLEY KSSKLDELND WAKKQAESSG 
YKTVGVYAGA LGWGYNTEIF KTKGYKEPVC WADLLAPELK GEIQIANPNS SGTAYTALAS 
LVQIMGEDQA FDYLKKLNGN ISQYTKSGSA PVKAAARGET ALGIVFVHDA VAQTAEGFPV 
KSITPCEGTG YEIGSMSIIK GARNLENAKV WYDWALTAEV QSRMKDAKSF QLPSNKSAVI 
PKEAPRFEDI KLIDYDFKTY GDPAKRKALL ERWDREIGAA AN