Gene Smed_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0101
Symbol
ID	5320929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	111629
End bp	112858
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	64%
IMG OID	640789033
Product	ROK family protein
Protein accession	YP_001325796
Protein GI	150395329
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00205324
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTGA CAGAAGGCCC TCATGCGGGG GTGAACCAGC CTGATGTGAT CGACCCGAGC 
GGCGGGGCGA ACCAGACGCG CGTGCGCGCT TATAATGAAC GGCTCGTCAT GTCGCTGGTG 
CGCCGTCACG GCAGTCTTTC CAAGGCCGAA ATCGCGCGCC GCTCCGGCCT TTCGGCGCAG 
ACCGTATCGG TCATCATGCG ATCGCTCGAA GCCGACGGGC TGCTTGTCCG TGGTGCCCCG 
GTACGCGGCC GCGTCGGTCA GCCATCCATC CCCATGCGGC TCAATCCGGA TGCGGTCTAT 
TCGTTCGGGG TCAAGATCGG GCGGCGTAGC GCCGACCTGG TGCTGATGGA TTTCCTCGGC 
ACCATCCGGC TGCACCTGCA TCAGATCCAC ACCTATCCGC TACCCGAGGA TATCGTCAAC 
TTCATCGTCA ACGGCATCGA CAAGCTCGAG AGAGAGCTTG GCCCCGGCGA GCGCGGGCGC 
ATCGTCGGCG TCGGCGTCGC CACGCCGTTC GAGTTGTGGA ACTGGGCGGA GGAAGTCGGC 
GCACCGCGGA ACGAGATGGA CAGGTGGCGC GACTTCGATC TGCAGGCGGC GGTCTCCTCG 
CGAATCTCAC ATCCCGTCTT TCTGCAGAAT GACGGGACCA GCGCCTGCGG TGCCGAACTC 
GCCTTCGGCG TCGGCGCCAG CTATCCGGAC TTTGTCTATT TCTACATAGG CTCCTTCATC 
GGCGGCGGTG TCGTCATCAA TTCCGCGCTT TTCTCCGGCC GAACCGGAAC CGCCGGTGCG 
GTCGGCCCGC TGCCCGTTGC AGGCAAGGAC GGCAAGTCGA CGCAATTGCT GAAGATCGCC 
TCGGTCTTCG TGCTGGAAAA ACTCCTGCGA GAACGCGGGA TGGACCCCCA GCCGCTCTGG 
TACTCCGCCG ACGACTGGAT CGATTTCGGC GAACCGCTGG AGGTCTGGAT CCAGGATGCG 
GGCGCGGCGC TTGCGCAGGC CGTCGTTTCC GCCGTCTCGA TCGTCGATTT TTCCGCGGTC 
GTGATCGACG GCGGCTTCCC GCCTTGGGTT CGTGTGCGCC TTCTTGCGGC AACGCGCAAG 
GCCCTCAATA CGCTCGACCT GCAGGGCGTC ACGCTTCCGG ACCTCGTGGA AGGCACCGTC 
GGCAGCCACG CCCGTGCGAT CGGCGGTGCC AGCCTGCCGC TCTTTTCCCG CTATCTGCTG 
GACACCAATG TCCTCTTCAA GGAGCTTTGA

Protein sequence

MSLTEGPHAG VNQPDVIDPS GGANQTRVRA YNERLVMSLV RRHGSLSKAE IARRSGLSAQ 
TVSVIMRSLE ADGLLVRGAP VRGRVGQPSI PMRLNPDAVY SFGVKIGRRS ADLVLMDFLG 
TIRLHLHQIH TYPLPEDIVN FIVNGIDKLE RELGPGERGR IVGVGVATPF ELWNWAEEVG 
APRNEMDRWR DFDLQAAVSS RISHPVFLQN DGTSACGAEL AFGVGASYPD FVYFYIGSFI 
GGGVVINSAL FSGRTGTAGA VGPLPVAGKD GKSTQLLKIA SVFVLEKLLR ERGMDPQPLW 
YSADDWIDFG EPLEVWIQDA GAALAQAVVS AVSIVDFSAV VIDGGFPPWV RVRLLAATRK 
ALNTLDLQGV TLPDLVEGTV GSHARAIGGA SLPLFSRYLL DTNVLFKEL