Gene Smed_5469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5469
Symbol
ID	5319771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	437084
End bp	438169
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	59%
IMG OID	640777230
Product	extracellular solute-binding protein
Protein accession	YP_001314162
Protein GI	150377567
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.27299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGA ACAATGACGG GAACTGGTCG CGCAGGCGGT TCCTGAAAAC CACCGCGATC 
GGAGCTGCAG CACTTTCAAG TCCGGCAATT TGGACCTCGG CGAGGGCGCA GGGCAAGCGC 
ATCATCGTCC GCGACGATGG CGGCATCTAC ACGAAGGCCT ATAACGCCGT GTACTACGGC 
CCCTTCAAGG AAGCGACCGG CATCGAGGTG GTCGGCGTTC AGGCCAATGC CGAACCGACG 
GCGCAAATTA AATCGATGGT CGACGCGGGC TCCTATACCT GGGACATGGC AAAGATCAGC 
GAACCTGCAA TCGAGCTCCT GACCGACGGC GAGAAGAAAT ACCTCGAGCA ACATGGGCTT 
GGCAGTGAAG CGGCGATCGC AAGCCTTCCA AAGCAGTATC TGTCTGACTA CGGCGTCGGA 
ACCAACGTAT ATACCACGGT GCTCGCCTAC CGTTCGGACG CGTTCGAAGG ACAGGACGCG 
CCGAAATCGT GGGCCGATTT CTACGACGTC GCGAAGTATC CGGGCAGGCG CGCTTTGCGC 
AAGCATCCTT TCGATACGAT CGAACAGGCA CTGATGGCAG ATGGCGTGCC GGTGGCGAAC 
GTGTATCCGT GCGACGTCGA CCGCGCGTTC AAAAAGCTCG ACACGATCAA GAGCGACGTA 
GAAGTATTTT GGACGAGTGG CGCTCAGGTC GAGCAGATGC TGATCTCCGG CGAAGTCGAT 
ATGATCCCGA CCTGGGTTTC GCGTGCGCAG GCTGCACGGT CGGCGGGGGC GCCGGTCGAG 
ATCGTCTGGG ATCAGAATAT CTGGGGCCTC GACAGCTGGG CGATCCTTGC CGGTACCCCC 
AACGCGGATG CATGCCGCGA ATTCATCAAG TTCGCATCCG ATCCGAAACG GCAGGCAGCC 
CTTGTGGATT ATTTCCCCGC AGGCGTCACG CAGCCGGCGG CGTTCGACGA CATCGATCCG 
AAGATCGCAA AAGATTGCCC GACGTTCCCG GAACACATCA AGCGCGGTGT GAAGATCGAC 
GCCAAGTACT GGTTTGCAAA TCAGGCACAA GTCATCGAAC GTTACAATTC TTGGCTCGTG 
AGCTGA

Protein sequence

MSMNNDGNWS RRRFLKTTAI GAAALSSPAI WTSARAQGKR IIVRDDGGIY TKAYNAVYYG 
PFKEATGIEV VGVQANAEPT AQIKSMVDAG SYTWDMAKIS EPAIELLTDG EKKYLEQHGL 
GSEAAIASLP KQYLSDYGVG TNVYTTVLAY RSDAFEGQDA PKSWADFYDV AKYPGRRALR 
KHPFDTIEQA LMADGVPVAN VYPCDVDRAF KKLDTIKSDV EVFWTSGAQV EQMLISGEVD 
MIPTWVSRAQ AARSAGAPVE IVWDQNIWGL DSWAILAGTP NADACREFIK FASDPKRQAA 
LVDYFPAGVT QPAAFDDIDP KIAKDCPTFP EHIKRGVKID AKYWFANQAQ VIERYNSWLV 
S