Gene Smed_4137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4137
Symbol
ID	5319279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	606754
End bp	607833
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	61%
IMG OID	640775942
Product	regulatory protein LacI
Protein accession	YP_001312875
Protein GI	150376279
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCACAA TCAAGGAAAT CGCATCGGCC GTCGGCGTGT CGTCAGCAAC CGTCTCCCGG 
GTGCTCAACT ATGATCCGAC ACTGTCCATT TCCACCAGGA AACGCCAGGC GATCATCGAA 
ACGGCCGAGG CTTTGAACTA TGCGACGCCG CGCAACCGCA ACCGTGCCGC GGCTCAGGCA 
GTCGGCAGCG GATTGAAGAT CGCGCTCGTG CACTTCCTAG ACCCGGCCCA GGAACTCGCC 
GACCCCTATT ATGTCGGCGT CCGGCTCGGC ATCGAAAGCC GCTGTCAGGC CCTGAACAGC 
GATGTGGTCA AGGTCTTTCT CACCGGCAAC ACTCCTGAAG CGACGATCCT TGAAGGCGCC 
TCGGGCGTGG TGGCCGTCGG TCACTATTAC GGCGACGAGC TCGAATGGCT GCGCCGCCAC 
AGCCGCCATC TCGTGTTTGC CGATTATGCG CCCGCCGGAG ACATGGAAGA CACGGTACTC 
AGCGACGTCT CCCAGGCGAT GATCCGGCTC CTGGAGGCGG TGCATGCCAT GGGCTATCGC 
CGCATCGGAT TCATCGGTTG GATCGACGCT TTCTACGGGC CGGACAACAT TCATTCGGAG 
CGTCGCTGCC ACACCTATAT CGACTGGATG ACCAAAACCG GGCTCTTTGA TCCGGAATTG 
TGCCTGGTCG ATCCGATGAC TCCGGACAGC GGCTACAGGC TTGCCAAGGC GATGCTGTCG 
AAGCCCAATC CGCCGAAGAT CCTCATCACC TGCAACGACA ATATGGCGCT CGGCGCCTAT 
AGGGCGATCA ACGAGATGGG GCTCAGGATT CCTGATGATG TCGCAGTCGC AAGCTTCAAC 
GACATTCCGG TCGCGCAGTT TCTCGGGCCG CCGCTTTCCA CGGTTAAGAT CCCGGCGGAA 
CTGATCGGCG AAACCGCCGT CGACCTGCTG GTCGAACGCC TGTCCGGCCG CGAGGTCGCC 
AAGAAGGTGG TCTTTGGTAC CGAAATCATC TGGCGCGCAA GCACACCGGC ACCAACCGGG 
GCTGCAAACC CGGCAGAGCA TATGGTGCCC GCAAGTTCCG CCTCAGAAGT CCCAGGGTGA

Protein sequence

MVTIKEIASA VGVSSATVSR VLNYDPTLSI STRKRQAIIE TAEALNYATP RNRNRAAAQA 
VGSGLKIALV HFLDPAQELA DPYYVGVRLG IESRCQALNS DVVKVFLTGN TPEATILEGA 
SGVVAVGHYY GDELEWLRRH SRHLVFADYA PAGDMEDTVL SDVSQAMIRL LEAVHAMGYR 
RIGFIGWIDA FYGPDNIHSE RRCHTYIDWM TKTGLFDPEL CLVDPMTPDS GYRLAKAMLS 
KPNPPKILIT CNDNMALGAY RAINEMGLRI PDDVAVASFN DIPVAQFLGP PLSTVKIPAE 
LIGETAVDLL VERLSGREVA KKVVFGTEII WRASTPAPTG AANPAEHMVP ASSASEVPG