Gene Smed_1730 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1730
Symbol
ID	5322588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1810668
End bp	1811729
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	62%
IMG OID	640790668
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001327400
Protein GI	150396933
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0821566
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGACA AGACGAAAAA CAGAGCGACG ATGGCGCCGC CGGCCGAAGG CGGCAGGCCG 
ACACTGAAGA CGATCGCTTT CATGACCGGG CTCGGTATTA CCACCGTCTC GCGCGCTCTG 
AAGGACGCTC CCGATATAGG CGCAGAAACC AAGGAACGCG TGCGTCTCGT CGCAAAACAG 
ATCGGCTATC AACCGAATCG CGCGGGCGTT CGCCTCAGAA CGGGCAAGAC GAATGTCATT 
AGTCTGGTGC TGACTCTGGA GGAAGAGATC ATGGGCATCA CCAGCCCCAT GGTCATCGGC 
ATCACCGAAA TCCTTGCCGG CACCCAATAT CACCTGGTTG TGACACCCTA TAGTTCAACC 
AAGGATCCGC TCGGCCCCAT CCGCTATATT CTCGACACCG GCGCAGCCGA TGGCGTGATC 
ATTTCGCGTA CCGAACCCAA CGACCCGCGG GTAACGCTTT TAACCGAGCG TCACCTGCCC 
TTCGCCACCC ACGGGCGTAC CGAGATGGGC CTGATCCATC CCTATCACGA TTTCGACAAT 
GAGCGCTTCG CCTACGAGGC CGTCCGCAAG CTCGTCGACC GCGGCAGGCG GCGGCTGGTG 
CTCCTGGAGC CACCGCCGAA TCTAACTTTC CACACCCATA TGCGCACCGG CTTCGAGCGG 
GGGCTGCGGG ATTTCGGAGC GGAATCGGTG AGCTTTCATC AGGTCAATAT CGACTACAGC 
CTCGTCGCCA TTCGCGATGC GTTCGAGAGG CTTATGCACT CTTCGGATGC CCCGGACGGC 
ATCGTTTCCG GCAGTGGATC CGGCGCCATC GCGCTGATCG CGGGCGTCGA GGCGGCCGGC 
AAGAAGGTCG GCGATGACGC CGACATGGTC TCCAAAGTGC CGAGCGATTT CCTGCGCTGG 
CTCCGGCCGG AGGTGATGAC GATGTATGAG GATATCCGCA TTGCCGGGCG CGAGCTCGCC 
AAGGCAGTGA TCGGCCGCAT CGAAGGCCAC CCGCCGGATA AGCTTCAGAG CCTCAGCCAG 
CCCGAATTCC AGCCGCCGGT GGCGGGGCCG GCGAGATTGT AG

Protein sequence

MDDKTKNRAT MAPPAEGGRP TLKTIAFMTG LGITTVSRAL KDAPDIGAET KERVRLVAKQ 
IGYQPNRAGV RLRTGKTNVI SLVLTLEEEI MGITSPMVIG ITEILAGTQY HLVVTPYSST 
KDPLGPIRYI LDTGAADGVI ISRTEPNDPR VTLLTERHLP FATHGRTEMG LIHPYHDFDN 
ERFAYEAVRK LVDRGRRRLV LLEPPPNLTF HTHMRTGFER GLRDFGAESV SFHQVNIDYS 
LVAIRDAFER LMHSSDAPDG IVSGSGSGAI ALIAGVEAAG KKVGDDADMV SKVPSDFLRW 
LRPEVMTMYE DIRIAGRELA KAVIGRIEGH PPDKLQSLSQ PEFQPPVAGP ARL