Gene Smed_4604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4604
Symbol
ID	5318514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1105052
End bp	1106107
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	64%
IMG OID	640776404
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001313336
Protein GI	150376740
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCACGTT CCGGACCCAA ATTGACGAGG ATAGCCAATA CACTCGGCGT CTCCGCGGCG 
ACCGTCTCCA ACGCGCTTTC CGGCAAGGGA CGGGTTTCGG CGGAACTTAC TGATAGAATT 
CGGTCGATCG CTGCCGACCT CGGCTACGTG CCGAGCCAGG CGGGGAGGGC GCTGAGGACG 
GGCAGGAGCG GCGTCATCGG GCTGGTTCTG CCGGATATCA GCAATCCTCT CTTTCCCCAG 
ATCGCGCAGG CGATCGAGTT TGCGGCTTCT TCGGCAGGCT ATGGTGTTTT GATTGCCGAT 
TCGCGCGGTG ACATCGCCAT CCAGACGAGG GCGATCGAAC GGCTGATAGA ACGCGGCGTG 
GACGGTATGG TCATCGTACC AAGGCGCGGC ACCCGCATCG CCGATGTCGG CTGCCCGGTT 
GCGGTCGTGG ACACCCCGTC CACGCCTGGC AATACGGTGG CCGCGGACCA TTGGGACGGC 
GGAAGGCAGA TAGCCGATCA CCTCGTAGGC CTCGGCCACA GACATTTGCT GATCATCGGC 
AACAATCCAG CCTCGAACGT GCAGAACGAC CGTGTCGGCG GGCTTCGCTC GGCCCTCCGG 
GAAGACGTGT GCGCGGAGAC CCTATGGATC GAGCGGCTGG AAGAGGTGAA TGGCAAGGGC 
TGTTCGCTCG GCCTTGCTGC GAAGGTAGCG GAGGGGGTAA CCGCCTTTGC CGCGATTTCG 
GACCTGCATG CCCTGCGCGC GCTCACGGAA CTGCAGCGTG CCGGCATCCA TGTTCCGGAG 
CAGGCAAGCG TCACCGGCTT CGACGACCTC ATCTGGTCGC CGGTGGTGAC GCCCGCCTTG 
ACCACGATCC GTATGGACAT GGCGCGCATT GCCGCGATCG CGGTCGAGGC TCTGGTTCGG 
GCGATCGGTG CCGAGGAGCC GGAACACCCG TCCGTAGGAG CGCCGGTTTG CGCGCCATTC 
TCGAAAGTGC CCATGCAGCT CGTCGTCCGG CAATCCACCG CGACGCCGCC CACCACCGCG 
ACGCCACCAT TTGTCACTCA AGGAGAACAG CCATGA

Protein sequence

MARSGPKLTR IANTLGVSAA TVSNALSGKG RVSAELTDRI RSIAADLGYV PSQAGRALRT 
GRSGVIGLVL PDISNPLFPQ IAQAIEFAAS SAGYGVLIAD SRGDIAIQTR AIERLIERGV 
DGMVIVPRRG TRIADVGCPV AVVDTPSTPG NTVAADHWDG GRQIADHLVG LGHRHLLIIG 
NNPASNVQND RVGGLRSALR EDVCAETLWI ERLEEVNGKG CSLGLAAKVA EGVTAFAAIS 
DLHALRALTE LQRAGIHVPE QASVTGFDDL IWSPVVTPAL TTIRMDMARI AAIAVEALVR 
AIGAEEPEHP SVGAPVCAPF SKVPMQLVVR QSTATPPTTA TPPFVTQGEQ P