Gene EcSMS35_0346 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0346
Symbol
ID	6144396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	357618
End bp	358706
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	46%
IMG OID	641615242
Product	LuxR-family transcriptional regulator
Protein accession	YP_001742450
Protein GI	170679658
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCAT GTGATTTTCG TGTTTTTCTG CAAGAGTTCG GTACAACGGT TCATTTGTCA 
TTGCCTGGTA GCGTATCCGA GAAAGAACGA CTGCTACTCA AGCTGCTGAT GCAGGGAATG 
TCTGTAACAG AAATATCACA GTACAGAAAT CGCAGTGCAA AGACCATTTC ACATCAAAAG 
AAACAGCTCT TTGAGAAACT GGGGATTCAG AGCGATATTA CTTTCTGGCG GGATATTTTC 
TTTCAGTACA ATCCGGAGAT CATATCCGCC ACGGGTAATA ATAGTCACAA ATATATTAAT 
GATAATCACT ATCACCATAT CGTCACGCCT GAAGCCATCA GTCTGGCGTT GGAAAACCAT 
GAATTTAAAC CGTGGATCCA ACCGGTTTTC TGCGCGCAGA CTGGGGTACT GACGGGCTGT 
GAGGTGCTTG TCCGCTGGGA ACATCCACAA ACGGGAATTA TCCCACCGGA TCAGTTTATT 
CCTCTGGCGG AGTCATCTGG TCTTATCGTC ATAATGACTC GCCAGTTGAT GAAACAGACT 
GCGGATATTC TGATGCCGGT AAAACATTTG CTGCCGGACA ATTTCCATAT TGGCATCAAC 
GTCTCGGCGG GTTGTTTTTT GGCCGCAGGA TTTGAAAAAG AGTGTCTGAA CCTGGTTAAG 
AAATTAGGTA ACGATAAAAT CAAACTGGTT CTTGAGCTGA CGGAACGTAA CCCTATTCCG 
GTAACGCCAG AAGCCAGAGC GATATTTGAC AGCCTTCATC AGCACAACAT TACCTTTGCG 
CTGGATGACT TTGGTACGGG TTATGCGACC TATCGTTACT TGCAGGCGTT CCCGGTCGAT 
TTTATTAAGA TCGATAAGTC ATTTGTGCAA ATGGCGAGCG TGGACGAAAT ATCCGGTCAT 
ATTGTGGACA ATATTGTCGA ACTGGCGCGT AAGCCTGGTC TGAGTATCGT GGCGGAAGGG 
GTAGAAACCC AGGAGCAGGC GGATTTAATG ATCGGCAAAG GAGTTCACTT TTTGCAGGGC 
TATTTGTACT CTCCGCCAGT ACCGGGTAAT AAATTTATCT CTGAATGGGT AATGAAAGCA 
GGTGGTTGA

Protein sequence

MNSCDFRVFL QEFGTTVHLS LPGSVSEKER LLLKLLMQGM SVTEISQYRN RSAKTISHQK 
KQLFEKLGIQ SDITFWRDIF FQYNPEIISA TGNNSHKYIN DNHYHHIVTP EAISLALENH 
EFKPWIQPVF CAQTGVLTGC EVLVRWEHPQ TGIIPPDQFI PLAESSGLIV IMTRQLMKQT 
ADILMPVKHL LPDNFHIGIN VSAGCFLAAG FEKECLNLVK KLGNDKIKLV LELTERNPIP 
VTPEARAIFD SLHQHNITFA LDDFGTGYAT YRYLQAFPVD FIKIDKSFVQ MASVDEISGH 
IVDNIVELAR KPGLSIVAEG VETQEQADLM IGKGVHFLQG YLYSPPVPGN KFISEWVMKA 
GG