Gene Smed_4877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4877
Symbol
ID	5318924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1382989
End bp	1384011
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	60%
IMG OID	640776662
Product	extracellular solute-binding protein
Protein accession	YP_001313594
Protein GI	150376998
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily [TIGR03261] putative 2-aminoethylphosphonate ABC transporter, periplasmic 2-aminoethylphosphonate-binding protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.713524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.38801
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTTCT CAAAGGCCTT TCTGGGCGCC GCGACCGCCT TCCTTCTCGC ATCCACCGCC 
GCCTATGCCG AAGCCGAACT TACGGTCTAC ACGTCTGTCG AGGCGGTTGA CCTCGACCGT 
TACAAGGAGA CTTTCGAGAA GGCTCACCCC GACATCAAGA TCAACTGGGT CCGCGACTCG 
ACAGGCGTGA TGACCGCCAA GCTACTGGCG GAGAAGGATA ATCCGCAGGC GGACGTTGTG 
TGGGGCGTGG CTGCGACATC GCTGCTGCTC CTGAAGTCCG AGGGCATGCT CGAACCCTAT 
GCCCCGAAGA ATGTCGAGGC CCTGGATCCG AGATTCGTCG ATGGCGACAA GCCGCCGAGC 
TGGGTAGGGA TGGACGCATA TGTGGCGGCT CTCTGCTACA ACACGGTGGA GGCCGAGAAG 
CTCGGCCTGA CGCCGCCAAC CAGCTGGAAG GATCTGACCA AGCCCGAATA CAAGGGTCAC 
GTCGTGATGC CCAACCCCAA TTCCTCCGGA ACAGGCTTCC TCGACGTCTC CGCCTGGCTT 
CAGACGTTCG GCGAAGAGGA AGCCTGGTCC TTCATGGACG CCCTGCACGA GAACATTGCC 
GCCTATACCC ATTCGGGTTC CAAGCCTTGC AAGATGGCAG CGTCCGGCGA AACCGTCATC 
GGCGTCTCCT TTGAGTTTCC GGGCGCCAAG GCGAAAACGT CGGGCGCGCC GATCGACATC 
ATTTTTCCCG CTGAAGGATC GGGCTGGGAA GCAGAGGCCA CGGCGATCAT TGCAGGAACG 
GCCAATCTCG AGGCGGCGAA AACGCTGGTC GACTGGTCGA TCAGCAAGGA AGCCAACGAG 
ATGTACAATG TCGGTTATGC AGTCGTGGCT TATCCGGGAG TCGCCAAGCC GATCGAGAAT 
CTTCCCGACG ACGTTGCCGA GAAGATGATC GAGAACGACT TCGAGTGGGC CGCGAACAAC 
CGTGCCCGTA TTCTGAAGGA ATGGCAGAAG CGTTACGACG CAAAGTCCGA GCCCAAGTCC 
TGA

Protein sequence

MPFSKAFLGA ATAFLLASTA AYAEAELTVY TSVEAVDLDR YKETFEKAHP DIKINWVRDS 
TGVMTAKLLA EKDNPQADVV WGVAATSLLL LKSEGMLEPY APKNVEALDP RFVDGDKPPS 
WVGMDAYVAA LCYNTVEAEK LGLTPPTSWK DLTKPEYKGH VVMPNPNSSG TGFLDVSAWL 
QTFGEEEAWS FMDALHENIA AYTHSGSKPC KMAASGETVI GVSFEFPGAK AKTSGAPIDI 
IFPAEGSGWE AEATAIIAGT ANLEAAKTLV DWSISKEANE MYNVGYAVVA YPGVAKPIEN 
LPDDVAEKMI ENDFEWAANN RARILKEWQK RYDAKSEPKS