Gene Smed_0053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0053
Symbol
ID	5320880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	56040
End bp	57239
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	62%
IMG OID	640788984
Product	hypothetical protein
Protein accession	YP_001325748
Protein GI	150395281
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.720578
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0000240379
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAGCCCA TAGCTTTTTC CTTCGATCAG CCTCTATTCG TCGTCGGGAC CCAGCCTGTT 
ACGGCCGGGT GGCTCGTCAC TGCCGCCGCC CTGCTGGTGG CCTTGCTCTC GGCTATTTTC 
GCTCGCCGTG CCGCTTCGCG TCGAGCGGTC GAGCACGACG AGAGGATGTC GGCGCTCATC 
GTGGCGCAGA CGGAAATGCA GGGACGCGTC GCGGCCATGG CCGAGGTGTT CGGCACCCGG 
CAGGCGGAGT TGAACCAGTC GCTCAGCCAG CGCATCGACG GAATGACGCA CCGGATCGGC 
GCTTCCATCA ACGAGCAGAC GAAGGCGACG CACGAAAACC TGCGACGGCT TCAGGAGCGG 
CTCGCGGTGA TCGACAACGC TCAGAACAAC ATACAGTTGC TGGCCAAGGA CATGGCGGGG 
CTGCAAAGCA TTCTCGCCAA CAAGCAGACG CGCGGCGCCT TCGGCCAATC GCGCATGGAG 
GCGATCGTCG CCGACGGCCT GCCGATGGGC GCCTTCGCCT TCCAACCGAC GCTTTCCAAC 
GGAGCGCGCC CGGATTGCAC CATCCGTATG CCGAAGGATC AGCCGCTATT GGTCATTGAC 
GCAAAGTTTC CGCTCGAAGC CTGGAATTCG ATGCGGGACG CGGAGAGCGC GGAACAGCGG 
CAACAGGCCG CGCAGGCCTT CCGTCGCGAT ATGGAAGTTC ATATCCGTGA CATCGCCAGC 
AAATATCTGC TTGCCGGAGA GACGCAGGAC ACGGCCTTCC TCTTCGTTCC CTCTGAATCG 
ATATTCGCGG AGATCCACGA ACATTTCGAG GCTATCGTCC AGAAGGCGCA TCGACAGCGG 
ATCATCATCG TTTCGCCGTC GCTCCTGCTT CTGTCGATTC AGGTGATCCA AGCTATCCTG 
AAGGACGCCC GGATGCGCGA GCAGGCGCAT CTCATCCAAA GCGAGGTTGT GCGGCTGATG 
GAAGACCTCT CGCGCCTGGA CGAGCGTGTA CGCAAGCTCC AGGGCCATTT CGCCATGACC 
CAGAAGGACG TCGACGAAAT CCTGATCTCC TCGGACAAGC TGACCCGGCG GGGTGCCAAG 
ATCGAGGCGC TTGAATTGCA GGCGGAAGCC GATCCGGGCG CCAAGACGGG CGAAGCAGGC 
GGACGCTCTA TGGACGGCCG CATGGGGCAG TTGAAGCTGA GAGTGGTTGA CGAAGACTGA

Protein sequence

MEPIAFSFDQ PLFVVGTQPV TAGWLVTAAA LLVALLSAIF ARRAASRRAV EHDERMSALI 
VAQTEMQGRV AAMAEVFGTR QAELNQSLSQ RIDGMTHRIG ASINEQTKAT HENLRRLQER 
LAVIDNAQNN IQLLAKDMAG LQSILANKQT RGAFGQSRME AIVADGLPMG AFAFQPTLSN 
GARPDCTIRM PKDQPLLVID AKFPLEAWNS MRDAESAEQR QQAAQAFRRD MEVHIRDIAS 
KYLLAGETQD TAFLFVPSES IFAEIHEHFE AIVQKAHRQR IIIVSPSLLL LSIQVIQAIL 
KDARMREQAH LIQSEVVRLM EDLSRLDERV RKLQGHFAMT QKDVDEILIS SDKLTRRGAK 
IEALELQAEA DPGAKTGEAG GRSMDGRMGQ LKLRVVDED