Gene Smed_2172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2172
Symbol
ID	5323032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2242627
End bp	2243616
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	63%
IMG OID	640791110
Product	helix-turn-helix domain-containing protein
Protein accession	YP_001327840
Protein GI	150397373
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0036608
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGGAA GTTTCGGCGT GGACAGCAGC ACTTCGCAAG CGCAGCATCT CGATCTGCTG 
ATATTGCCGG AGACCAATCT CATTCTTGTC GCTTCGGTGG TCGAGCCCTT ACGCGCCGCC 
AATCGGATAG CCGGGCGCCC GCTTTACAGC TGGGCCCTGT TCAGCCCTGA CGGAAATGCG 
ATCGAGACGA AAAGCGGCAT TCCCATTCCG GTGGCCGGGG CCTTCCGTCC GCAGCGCGAG 
ACTGCGCCGC TCTTCGTGCT TTCCAGCTAC CACTGGCAGC GCAGCGCCAC CGTGCAGCTC 
AAGATGTTCC TGTCGCAGAC GGCGCGGCAC AGGGAGACGA TGGCGGGAAT CGAATCCGGC 
TCCTGGCTCC TTGCGGAGGC GAGCCTCCTC GACAATTTCT CGGCCACCAC CCATTGGGAG 
GACTTCGAGG ACTTCTCGGC CGCCTATCCG CAGGTCACGA TGGTGCGCGA CCGGTTCGTC 
ATCGACCGCA AGCGCATTAC CACCGGCGGC TCGCTGCCGA CGCTGGATCT GATGCTGGAA 
CTGATCCGCC GCGCGCACGG CTACTCGCTG GCACTCGAAG TATCCCGCCT CTTCATTTAC 
GAGCAGGAGC GCACGCGCGG GGACCTCCTG CAGGTGCCGG CCATCGGCAA TATGCGCATT 
CTGGATGCGC GGGTCGGTGC AGCGGTAAAG CTTATGGAGG AGACGGTAGA GGCACCGCTG 
ACACTCGCCC GGCTGGCGCG CCGGGCAGGC ATCAGTGCCC GGCATCTGCA GGATCTCTTC 
AAGGAGACGA TGGGTGTCGC TCCGCACGAG CACTATCTGG CGCTCCGGCT CAACGCGGCG 
CGTCGCAAGG TGATCGAGAC GCGGATGGCG TTCGCCGATA TCGCGGCGAT TTCCGGCTTC 
AATTCCTCGT CTTCATTTTC CCGCAGCTAT AGGGCTCATT ATCGAGAAAG CCCAAGTGAG 
ACACGCCGGC GGCTCAAGTT GAAGAACTGA

Protein sequence

MGGSFGVDSS TSQAQHLDLL ILPETNLILV ASVVEPLRAA NRIAGRPLYS WALFSPDGNA 
IETKSGIPIP VAGAFRPQRE TAPLFVLSSY HWQRSATVQL KMFLSQTARH RETMAGIESG 
SWLLAEASLL DNFSATTHWE DFEDFSAAYP QVTMVRDRFV IDRKRITTGG SLPTLDLMLE 
LIRRAHGYSL ALEVSRLFIY EQERTRGDLL QVPAIGNMRI LDARVGAAVK LMEETVEAPL 
TLARLARRAG ISARHLQDLF KETMGVAPHE HYLALRLNAA RRKVIETRMA FADIAAISGF 
NSSSSFSRSY RAHYRESPSE TRRRLKLKN