Gene Smed_3640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3640
Symbol
ID	5318182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	75040
End bp	76107
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	60%
IMG OID	640775453
Product	regulatory protein LacI
Protein accession	YP_001312386
Protein GI	150375790
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACG GTGGCAGGAA AAAGGCGACA ATCTATGATC TCTCGGTGCT ATCCGGGAGT 
TCGCCTTCGA CGGTAAGTGC GGTACTGAAC GGCACGTGGC GCAAGCGGCG GATAAGGGAA 
AGCACCGCAG AGCTCATCCG GAGCCTTGCC GAAACGCATC AGTACACTGC AAATCGTCAG 
GCGCGGGGCT TGCGCAGCTC CCGTTCCGGC CTGGTAGGGC TGCTCCTGCC CGTTCACGAC 
AACCGCTATT TTTCTTCGCT TGCCCAGACC TTCGAAGCGC ATGTGCGAAG CAAGGGTCAG 
TGTCCAATTG TCGTCAGCGC CAGCCGCGAC CCGGAAGAGG AACGCAGGAC GGCCGAAACG 
CTGATCTCCT ATTCCATCGA CGAATTGTTC ATATGCGGCG CGACGGATCC CGACGGCGTT 
CACGAGGTCT GCGAAGCGGC AGGGCTGAAG CACATCAACA TCGATCTGCC GGGGACGAAG 
GTCCCATCCG TCATCAGCGA CAATTTCGAA GGCGGCCGTA TTCTGACCGA AGCAATCATC 
CGCCACTTCC CTGCCGACCG GCCGCTCGCG CCCGAGGATC TCTATTTGTT CGGTGGTCGT 
GATGATCATG CCACCCGCGA GCGCATCCGC GGCTTTCGTG CCGCAAAGAA GGAGTTGCTC 
GGGGGCGATC CGGATGAATG CGTATGGCCC ACCGGTTATG CGGCAGACAA TGCGCGGAAG 
GCCTTCGATG CCTTTTACGA ACAGCGGGGG AAACTTCCGC GCGGGTTCTT CGTCAATTCC 
TCGATCAATC TAGAGGGACT GCTGCGTTTC ATGGCCGAGC ATCCGCTCGA GAATTTCAAG 
GATCTCGTCG TCGGCTGCTA CGACTACGAT CCATTCGCAT CCTTCCTCCC CTTCCCCGTC 
ATCATGATAA GACAAGATGT CGAGGGAATG ATCGCCAGGG CCTTTGAGGT GATCGAGGAG 
CCGCGGGCGT CGGTCCAGAT TCATTTGGTG AAACCGAGGC TCGTGCCCCC GAGAACGGCG 
CTGACCGGCC CCCTCGACGC GCTAATCGAC AGCGACATGC CGCGGTAA

Protein sequence

MTNGGRKKAT IYDLSVLSGS SPSTVSAVLN GTWRKRRIRE STAELIRSLA ETHQYTANRQ 
ARGLRSSRSG LVGLLLPVHD NRYFSSLAQT FEAHVRSKGQ CPIVVSASRD PEEERRTAET 
LISYSIDELF ICGATDPDGV HEVCEAAGLK HINIDLPGTK VPSVISDNFE GGRILTEAII 
RHFPADRPLA PEDLYLFGGR DDHATRERIR GFRAAKKELL GGDPDECVWP TGYAADNARK 
AFDAFYEQRG KLPRGFFVNS SINLEGLLRF MAEHPLENFK DLVVGCYDYD PFASFLPFPV 
IMIRQDVEGM IARAFEVIEE PRASVQIHLV KPRLVPPRTA LTGPLDALID SDMPR