Gene Smed_0116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0116
Symbol
ID	5320945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	129033
End bp	130190
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	66%
IMG OID	640789049
Product	hypothetical protein
Protein accession	YP_001325811
Protein GI	150395344
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.488565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGAC TTGAGACAGC GATCAGAAAT GCGCTGGAAA GATCGGATCG AAGCAGTGCG 
GAGGTCCGGG CGCGCATCTA TCAGTCGGCG CGTCAGGCGC TTGAGAACGG CCTGCAAAAG 
CAGCAGATCG AAGACCCGGA GGTCATCTCG GTGCAGCGCC ACCGGCTGGA AGCGGTCATT 
CGGGCGATCG AGATGGAAGA GCGCGCTGCC TTGAAGGAGC GCGCACAGAC GCCGGTGGTC 
AATCTCGACG AGGTGACGGC GAGGGGACAT GCGGTCGAGC GCGGCCCCGA AGCGCCAACC 
CGAAGGCCCG AGTTGGAAAC GAAGCCGGAG GAACGTAGTC CCGCGCAAAC GGACGGGGGG 
CTTGGGGCCT TGCGTCCCGA ACGCGACGGT CCGCTGGCTG CGACGAGAGC GGAGGGGAGC 
GACGGTCGAT CGGAAGCCAC CGGAAGCACC GTCCCGCCCG CACCCGATCC AGGCCCTGCC 
GACCGGCGGC CGCGCAAGCA CAGGCGCAGG CGCAGCCGTT TCTTCTCCTA TGCGATGATC 
GTCGCGACGC TTGCTGCAGC GGCCGGGGTC GCCGTCTGGT GGATCCAGAC GAACGATCTG 
CTGCGGTCGC CGACGGACAC CGGCGTTGCC AATCCGCCCG CGACGGTGGA TGCAGAGGAT 
TTCGACGGCG CGGCCGGCTT GCAGACCCTG GGTGCCCAGG AAGGCTTTTC CGGTGATTGG 
GTAGAGGTCT TTGCTCCCGG TGAGGCTGCA GCGGTCAAGC CGGGCCCGCG GGCGAGTGCG 
GAACCCTTCG ACGGCGACGC CGGCGAGCGC CTGCGTTTGA TCTCGCAAGC GGCATCGAAG 
GATGGCGACG TGGAAATCGA GATACCCGCC GATGTTCTTG CCCAGCTTTC GGGCAAATCG 
TCGACATTCG CCCTGACGGT GCAGGCTGCC CCGGGCAAAG CGACCGAATT CTCCGTCGAA 
TGCGATTTAG GGGCGCTCGG CGGCTGCGGC CGTCATCGTT TCACCGTACA CGACGAGCGG 
ATCGATATGT TGTTCAAGAT CAATTTCGAT CGCGGTGCCG CACCGAGCGG CCCTGGAAAA 
CTGGTGATCA ACAGCGACGT CGGCGGCGGC GGCAACAGCC TCGATCTCTT CGCGATCCGC 
GTGCAGCCGG GCGGCTGA

Protein sequence

MSGLETAIRN ALERSDRSSA EVRARIYQSA RQALENGLQK QQIEDPEVIS VQRHRLEAVI 
RAIEMEERAA LKERAQTPVV NLDEVTARGH AVERGPEAPT RRPELETKPE ERSPAQTDGG 
LGALRPERDG PLAATRAEGS DGRSEATGST VPPAPDPGPA DRRPRKHRRR RSRFFSYAMI 
VATLAAAAGV AVWWIQTNDL LRSPTDTGVA NPPATVDAED FDGAAGLQTL GAQEGFSGDW 
VEVFAPGEAA AVKPGPRASA EPFDGDAGER LRLISQAASK DGDVEIEIPA DVLAQLSGKS 
STFALTVQAA PGKATEFSVE CDLGALGGCG RHRFTVHDER IDMLFKINFD RGAAPSGPGK 
LVINSDVGGG GNSLDLFAIR VQPGG