Gene Smed_0343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0343
Symbol
ID	5321176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	370334
End bp	371293
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	63%
IMG OID	640789278
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001326036
Protein GI	150395569
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.158898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.129182
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAGG CTATTGCGAG ACTTTCTATC CTGCTTGCCG CCACGGCGAT TTCGGCAACC 
GCCGCCTCGG CCTCGGACGA TATCAGCGTG TCGCTTGTGC TCGGCCAGCG CAATAGCGGG 
TTTCATGAGG CGATCGCCTG CGGCGCCCGC GCCGCCGCCA AGGAACTGGG CGTGAAGGTC 
AACATCCAGG CCGCACCGAC CTACTCGGCC TCCGAGCAGA TCCCGGTGCT GAACGCCGTC 
ATGGCGACGA GCCCTTCTGC CATCGTGCTC GATCCGACGA GCTCGACCGC GCTGATCGCG 
CCACTGATGG AGGCAGCCGC CAACGGCGCC AAGATCGTCG CCGTCGACAC CACGCTCGAC 
GACCCGTCGG TGCTCTCCGC CGTGGTCGGA ACCGACAATG AAAGCGTCGG CCGCGAAACC 
GCCAAGGCGC TCGCGAAGGC ACTCGACGGA AAGTCCGGCA AGGTGGCGCA GATCAACAGC 
ATTCCCGGCA TTTCCACCGT CGATGCCCGG ATCAAGGGTT TCGAAGAAGA GATCAAGAAG 
TATCCGAATC TCACCTATAT CGGCAACCAG TTTGCAAGTG AGGATATCCC GAAGGCACAG 
CAGGCCTACG TGTCGCTCAT GAGCGCCAAC CCCGACCTCA TCGGCGTCGT CTCCCAATCG 
AACAATCCCG CGATCGGCGT TGCCGGCGGC ATCCGTTCCA CCGAGACGGC CGAGAGCGTC 
GTCGCTATTG CGGTGGATGC CGATGAAGCC GAGATCGAGG CTCTGAATGA GGGGCTGCTC 
GACGCTCTCG TCATCCAGCA GCCCTACGAA ATGGGCTATG TCGGCTTCAA GCAGGCCGTC 
GCTGCCGTCA AGGGCGAGCC CGTCGAGACG CCGATCGGCA CCGGCACGGT AACCGCGACC 
AAGGCGAATA TTGCCGACCC GGACGTGGCC AAATACCTTT ACGAAGGGAA TTGCATCTGA

Protein sequence

MTKAIARLSI LLAATAISAT AASASDDISV SLVLGQRNSG FHEAIACGAR AAAKELGVKV 
NIQAAPTYSA SEQIPVLNAV MATSPSAIVL DPTSSTALIA PLMEAAANGA KIVAVDTTLD 
DPSVLSAVVG TDNESVGRET AKALAKALDG KSGKVAQINS IPGISTVDAR IKGFEEEIKK 
YPNLTYIGNQ FASEDIPKAQ QAYVSLMSAN PDLIGVVSQS NNPAIGVAGG IRSTETAESV 
VAIAVDADEA EIEALNEGLL DALVIQQPYE MGYVGFKQAV AAVKGEPVET PIGTGTVTAT 
KANIADPDVA KYLYEGNCI