Gene Smed_5886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5886
Symbol
ID	5320188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	849926
End bp	850966
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	62%
IMG OID	640777581
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001314513
Protein GI	150377918
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0513259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.651755
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATTA CGCGCAGGAC GGTGGGCAGA TGGACGTTGG GGCTGTTGGG GGTGGCATTC 
GCCATGCCGT CTCTGGCGGC CGATTTGCCT AAACCTTTCG ATAAGCCCGG CGAGGTGAAA 
ATCGCGCTCG TGCGATACCT GTCGACAGGC GATTTTTTCC AGTCCTACCT TGCGGGCGTC 
GAGGCGCAGG CCAAGGCGCT CGGCGTCGAG CTGCAGGTCT TGGACAGCCG TCAGGACGCT 
GCGCTCCAGG CAGACATGGT CGACCAGGCG ATCGCGCTGG GCGTGCAGGG CATCATTATC 
CAGCACGGTC TGACGGAATC CATGAAGGAA GCCGCCCAGC GCGCGGTCGA CGCCGGCATC 
AAGGTCGTTG CCTTCGACGT GAATGTCGAG AACGAGAATA TTCCGCAGAT CGAACAGTCC 
GACCGCGACC TCGCCCGCCT TGCGCTCGAA CAGGCGGTCA AGGACAACGG CGAGAGCTTT 
AAGGCCGGCT ACGTCTATGT CGCCGGAATT GCGCCGCTTG ACCGTCGCGA CGAGACCTGG 
AAGGCGTTCA AGGCGAAGTA CTCGGGCATC AACGAAGCCG CGCAGTTCGG CACGATGGAC 
AATCCGATCG CCAATTCGGT GGCCAACCAG GCCCGGTCCG TGATTTCCGC CAACCCGGAC 
ATCACCGTGA TGTTCGCCCC TTACGACGAG TTCGCCAAGG GTGTGAAGAT TGCGGTAGAC 
GAGGCGGGAA TGTCCTCCAG CGTGAAGATC TATTCGGCCG ACATCTCGAC CTCGGACATC 
GCGGCCATGC GTGAACCGGA TTCCGCCTGG GTTGCGACCG CGGCAACGAA CCCGGCCGTC 
GTGGGTCAGG TTTCCGTTCG CGCGCTCGCC ATGCTGCTCG CGGGCGAGGA TCCGGGCCGT 
CAGGTCATCG TACCGCCGAC GCTCATCACC CAGAAGGATC TGAACGATCA GGACATCAAG 
AATATGGAAG ATCTCGGTGC AAAGCTGCCG CAGTTCGCCC ATGCCGAAGT CGCGATGCCT 
GGCTGGATGC CCAGGCCCTG A

Protein sequence

MNITRRTVGR WTLGLLGVAF AMPSLAADLP KPFDKPGEVK IALVRYLSTG DFFQSYLAGV 
EAQAKALGVE LQVLDSRQDA ALQADMVDQA IALGVQGIII QHGLTESMKE AAQRAVDAGI 
KVVAFDVNVE NENIPQIEQS DRDLARLALE QAVKDNGESF KAGYVYVAGI APLDRRDETW 
KAFKAKYSGI NEAAQFGTMD NPIANSVANQ ARSVISANPD ITVMFAPYDE FAKGVKIAVD 
EAGMSSSVKI YSADISTSDI AAMREPDSAW VATAATNPAV VGQVSVRALA MLLAGEDPGR 
QVIVPPTLIT QKDLNDQDIK NMEDLGAKLP QFAHAEVAMP GWMPRP