Gene Smed_1059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1059
Symbol
ID	5321905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1126705
End bp	1127838
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	64%
IMG OID	640790002
Product	hypothetical protein
Protein accession	YP_001326747
Protein GI	150396280
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.835096
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCATAC AAGCATTTCT TTGCTGGGTG GAGACGGCAA AAGCCGGGGA TCGCGCCAGC 
GCTGCCAGTG CGCTTGGCCG CGCCTATGCC AAGGCCGGGA CGAACGGCGT CGATCCACAG 
GCAGTCGAGA TGGCGATGAC CTTTCTCCTC GACGACCCTT CCCCCAAAGT ACGCCTTTCT 
CTGGTCGAGG CGCTGGCCGA TTGCCCAACC GCACCGCGCG CGATCATCAA GGCGCTTGCG 
CAGGACCAGC CGGAAATCGC CTACATCGCC ATTTCGCGTT CCCCTGTTCT GAATGACGAC 
GATCTTGTCT ACATGTCGGC GAACGGCGAC GCGGAGATGC GGGCGCTGAT CGCGTCCCGC 
GCCACGGTCT CGCGCGCGCT TGCGGCGGCA ATCGCTGAAA TCGGCGGCGA GGAAGAGGTG 
CTTATTCTGC TGGAAAATCC AGGTGCCGGG CTTTCGCCCG GGTCGCTGCG GAGAATTGCG 
GACCGTCTCG GGGATTGCGT GGTCACTCGT GGCCTGTTGC TCGAACGCGA TGACCTGCCG 
AGTGACGTTC GCCAAAGCCT TGCGGAGAAA GTAGCCACTG CGCTTGCGGC TTCGGGCTTG 
GTGCGATCCG CTATCGGCCA GGAACGGGCG CGGCGTGTAG CGCAGGAATC TTGCGACGCG 
GCGGCGCTGG CGCTTTCTTC GGATGCGTCG AAGGAGGAAC TGCAGCGGCT GGTTGCCCGT 
CTCCGCAACG CCGGCCGGTT GACGCCGGCC TTGCTGCTGA CGGCGCTCTG CAGCGGCCGG 
ACGGAGCTCT TTTCTGCGGC AATCGTCGAC CTGTCAGGAG TCCCGGAAAA GCGCGTTCGG 
GCGATCCTTT CGGGCGGGCG GTTCCATTCG GTCAGGGCCC TTCTTGAAAG TGCGGGATTG 
GGCCGTGACG TGAGCGGCGT CTTTTCGGAG GCCGTGTTGT TCTGTCAAAG CGAGGCAGAT 
CCGGACCGTG ACGGGGTTTC CCCCTCAGTC GCAGCGAGAC TTTCCGATCG CCTTCGCGAT 
TGCAGCCTCG ATGCATTGCA CGCCGTTGCC GAACTTGCAG AGCGGCTGGC TTTCGCCGAG 
CAGCGGCAGA GGGCGCGCAA CTATGCATCG CGGTTCTCCC GCCAGGCCGC CTGA

Protein sequence

MIIQAFLCWV ETAKAGDRAS AASALGRAYA KAGTNGVDPQ AVEMAMTFLL DDPSPKVRLS 
LVEALADCPT APRAIIKALA QDQPEIAYIA ISRSPVLNDD DLVYMSANGD AEMRALIASR 
ATVSRALAAA IAEIGGEEEV LILLENPGAG LSPGSLRRIA DRLGDCVVTR GLLLERDDLP 
SDVRQSLAEK VATALAASGL VRSAIGQERA RRVAQESCDA AALALSSDAS KEELQRLVAR 
LRNAGRLTPA LLLTALCSGR TELFSAAIVD LSGVPEKRVR AILSGGRFHS VRALLESAGL 
GRDVSGVFSE AVLFCQSEAD PDRDGVSPSV AARLSDRLRD CSLDALHAVA ELAERLAFAE 
QRQRARNYAS RFSRQAA