Gene Rleg_3637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3637
Symbol
ID	8014486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3673711
End bp	3674757
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	63%
IMG OID	644826202
Product	extracellular solute-binding protein family 1
Protein accession	YP_002977421
Protein GI	241206325
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.276394
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTGCTGG CGTTCTGGCC GGGCTTCGCG CTCGCCGATC AGGCCTTCTA TCCGGCGAAG 
TCGGGCAATG CCGATGCGCC GGTGCTGACG GTTTATTCCT CGCTCGACGA GCCCCTGGCG 
CAGCCGATGA TCCGGGGTTT CCTGGACGCC AATCCCGATA TCGCAGTCAA ATATGAGGAC 
ATGCTGACCG GCGACATCTA CGACCGGATC GTCAGGGAGA CGGATGCCGG CAAGAAGACG 
GCGGATTTCG CCTTCTCCTC GGCGATGGAC CTGCAGGTGA AGCTTTCCAA TGACGGATAT 
GCTCAGGTCA GCAACCTGCC GATGAGCGGT GCATGGCCGA AATGGGCGAA CTGGCGCAAC 
ACCGCCTATG CGCTCACCTT CGAGCCGGCG GTGTTCGTCT ATCACAAGCC GAGCTTTGCG 
CATGAGCCGG TGCCGAGCTC GCGGGCTGAA TTCGTCGATT ATCTGAAACG CAAGGGCAAC 
GACGTCTATG GGCGGATTGG CACCTACGAT ATCGAGCGCT CGGGCGTCGG CTTTCTTTTC 
ATGGCGCGCG ACCAGGAGCA GTTCGGCGAC ATCTGGTCGG TGATCGGGGC GATGGGGGCT 
GCCGGCGTCA AGCTTTATTC GACGAGTTCG GCGATCCTCG AACGCGTTGC CGACGGGCGC 
TTCGTGCTCG GCTACAATAT TCTCGGCTCC TATGCGGCCG ACTGGGCGTC GCGCTATCCC 
GATGTCGGCA TCGTGCTGCC GAAGGATTAT ACCGTGGTGA TGTCGCGGAT CGGGCTGGTG 
CCGCAGGCCG CCGCCGATCC GGAACTCGGT CGGCGTTACC TTACCTTCTT CATGTCGAGG 
GAAGGGCAGA CGATCCTGGC GCGCGAGCTG CAGATCCCGG CGGTCAGCCC CGAGGTGGCA 
GGCGAGAATA CCGCCAATAC GCTGCAGGAA CTGCTCGGCG CCCAACTGCG GCCGGTGCCG 
GTCAGCCCCG GATTGATGGT CTATCTCGAC CAGGTGAAGC GGGCGCGGCT GATCGCGCAT 
TGGAACGAGG TTCTGCGGAT GCAGTGA

Protein sequence

MLLAFWPGFA LADQAFYPAK SGNADAPVLT VYSSLDEPLA QPMIRGFLDA NPDIAVKYED 
MLTGDIYDRI VRETDAGKKT ADFAFSSAMD LQVKLSNDGY AQVSNLPMSG AWPKWANWRN 
TAYALTFEPA VFVYHKPSFA HEPVPSSRAE FVDYLKRKGN DVYGRIGTYD IERSGVGFLF 
MARDQEQFGD IWSVIGAMGA AGVKLYSTSS AILERVADGR FVLGYNILGS YAADWASRYP 
DVGIVLPKDY TVVMSRIGLV PQAAADPELG RRYLTFFMSR EGQTILAREL QIPAVSPEVA 
GENTANTLQE LLGAQLRPVP VSPGLMVYLD QVKRARLIAH WNEVLRMQ