Gene Smed_5554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5554
Symbol
ID	5319856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	519007
End bp	520017
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	58%
IMG OID	640777303
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001314235
Protein GI	150377640
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0347599
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGGA TCACATTGCA GGACATCGCT GATCACACAG GCCTGTCCAA ATTCGCTGTC 
TCCTGCTCCC TTTCGGGAAA GCCGGGGGTC AGCGACACCA CGCGAAAACG CGTGCAGGAT 
GCCGCCGTAC AACTCGGCTA TCAACGCTTA AAACCCGCAG AAGAGCGGCG TGAAGTCACC 
CTGATTTTCC ATGATCAAGT CGACAGTGTC AGCTATGAGC TGCGAACGAT GCTGCAAGAC 
GGGATGCAGC GCGAAGCGCA TCGGCTCGGC CAGCCGGTCA GGCTTCAATG GACGCATGAT 
GCCAATCGGG TGAAAGCCAT GGTCAAGGAT AGTGCCGGGA TCATCCTGGT CGGTCCTCAC 
GAACAGAAAA CGCTCGACAT CCTGAGAGCC TCCGGCGTTC CCGTTGTGCG TCTCGGCTGG 
GTCGCCCCCC TCGAACAGGC CGATCATGTC GGCGGCACCG ACCACGAGGC AGGGATTGCA 
GTTGGCGAAT ACCTGATCGG CCTCGGCCAT CGGGACATCG CCTTTCTCCA AGGGGAGGAA 
GGGTATCGCG GCCGCATGGA GCGATATCAC GGTCTGCGCG AAAGTATCGA ACAGTATCCC 
GATGCGCGGC TGCACAATTT GCACTTCAAG GAGGACGGGG GCTTCATTCC GGCGCTTCAA 
TCTCTCCAGA CGACGGGAAT TGCGCCAACG GCGCTGTTCT GCGCGCATGA CGGACTGGCT 
CTCACCGCCG TTTCGGAGCT CCTAGCGCGG GGTTACCGCA TTCCGGAAGA CATGTCCGTT 
GTCGGCTTCG GTGATTTTTC TGCCGCAACG CAAATATCGC CACAGCTAAC CACCATCAAA 
GTGCAAGGAC TTGAAATGGG GGCGACAGCG TTGCGGCTTC TGCTAGAGCG CATTGAAACA 
CAAGGCAACA CCGTGCCTGC CAGACGCATT CTGATTGCAT CTACCTTCGT TGAGCGTCGA 
TCATCGGGGC CTGCTCCGAA GCACGGAAAG AGCCTTGACA GACGAAAATG A

Protein sequence

MSRITLQDIA DHTGLSKFAV SCSLSGKPGV SDTTRKRVQD AAVQLGYQRL KPAEERREVT 
LIFHDQVDSV SYELRTMLQD GMQREAHRLG QPVRLQWTHD ANRVKAMVKD SAGIILVGPH 
EQKTLDILRA SGVPVVRLGW VAPLEQADHV GGTDHEAGIA VGEYLIGLGH RDIAFLQGEE 
GYRGRMERYH GLRESIEQYP DARLHNLHFK EDGGFIPALQ SLQTTGIAPT ALFCAHDGLA 
LTAVSELLAR GYRIPEDMSV VGFGDFSAAT QISPQLTTIK VQGLEMGATA LRLLLERIET 
QGNTVPARRI LIASTFVERR SSGPAPKHGK SLDRRK