Gene EcSMS35_0982 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0982
Symbol	baeS
ID	6144504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	990667
End bp	992070
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	54%
IMG OID	641615869
Product	signal transduction histidine-protein kinase BaeS
Protein accession	YP_001743061
Protein GI	170680059
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.363235
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.539382
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCT GGCGACCCGG TATTACCGGC AAACTGTTTC TGGCGATTTT CGCCACCTGC 
ATTGTCTTAT TGATCACGAT GCACTGGGCG GTACGTATCA GTTTTGAGCG CGGCTTTATC 
GATTACATCA AGCATGGTAA TGAACAACGG CTGCAAATGC TCGGCGATGC GCTTGGTGAG 
CAGTACGCCC AGCACGGGAA CTGGCGCTTC CTGCGTAATA ACGATCGCTT TGTATTTCAG 
ATCCTACGTT CGCTGGAGCA TGATAACAAC GAAGATAAGC CCGGCCCCGG TATGCCGCCA 
CACGGTTGGC GCACGCAATT CTGGGTGGTT GATCAAAACA ACAAAGTGCT GGTTGGCCCG 
CGAGCACCGA TTCCACCCGA CGGCACACGG CGGCCCATTA TGGTCAATGG GGCGGAAGTG 
GGTGCGGTGA TCGCCTCCCC TGTTGAACGA CTGACCCGCA ATACCGATAT CAATTTTGAC 
AGACAACAGA GGCAAACCAG TTGGCTGATT GTCGCTTTAT CTACCTTGTT AGCGGCGCTG 
GCGACATTCC CACTGGCGCG CGGTTTGCTG GCTCCGGTCA AACGACTGGT GGACGGTACA 
CACAAACTGG CAGCGGGCGA TTTCACTACT CGCGTGACGC CCACCAGTGA AGATGAATTG 
GGCAAACTGG CGCAAGACTT CAACCAGCTC GCCAGCACGC TGGAGAAAAA CCAACAGATG 
CGCCGCGATT TTATGGCCGA TATCTCCCAC GAGCTGCGCA CGCCTTTAGC GGTACTGCGC 
GGCGAACTGG AAGCTATTCA GGATGGCGTG CGTAAATTCA CGCCGGAGAC GGTGGCTTCT 
TTACAGGCAG AGGTCGGTAC ACTGACCAAA CTGGTGGATG ATCTTCATCA ATTGTCGATG 
TCTGATGAAG GCGCTCTCGC CTACCAGAAA TCGTCGGTGG ATCTGATCCC GCTACTGGAA 
GTCGCGGGTG GCGCATTTCG TGAGCGTTTC GCCAGCCGCG GGCTGAAACT GCAATTTTCC 
CTGCCAGACA GTATTACCGT ATTTGGCGAT CGCGACCGTT TAATGCAGTT ATTCAATAAC 
TTACTGGAAA ACAGCCTGCG CTACACTGAC AGCGGCGGTA GCCTGAAAAT CTCTGCCGAG 
CAGCACGACA AAACGGTGCG CCTGACCTTT GCCGACAGCG CGCCGGGCGT CAGTGACGAT 
CAGCTACAAA AATTGTTTGA ACGTTTTTAT CGCACCGAAG GCTCCCGCAA CCGAGCCAGC 
GGCGGTTCCG GGCTGGGGCT GGCGATTTGC CTGAACATTG TTGAAGCACA TAATGGTCGC 
ATTATTGCTG CCCATTCGCC TTTTGGCGGG GTAAGCATTA CAGTAGAGTT ACCGCTGGAA 
CGGGATTTAC AGAGAGAAGT ATGA

Protein sequence

MKFWRPGITG KLFLAIFATC IVLLITMHWA VRISFERGFI DYIKHGNEQR LQMLGDALGE 
QYAQHGNWRF LRNNDRFVFQ ILRSLEHDNN EDKPGPGMPP HGWRTQFWVV DQNNKVLVGP 
RAPIPPDGTR RPIMVNGAEV GAVIASPVER LTRNTDINFD RQQRQTSWLI VALSTLLAAL 
ATFPLARGLL APVKRLVDGT HKLAAGDFTT RVTPTSEDEL GKLAQDFNQL ASTLEKNQQM 
RRDFMADISH ELRTPLAVLR GELEAIQDGV RKFTPETVAS LQAEVGTLTK LVDDLHQLSM 
SDEGALAYQK SSVDLIPLLE VAGGAFRERF ASRGLKLQFS LPDSITVFGD RDRLMQLFNN 
LLENSLRYTD SGGSLKISAE QHDKTVRLTF ADSAPGVSDD QLQKLFERFY RTEGSRNRAS 
GGSGLGLAIC LNIVEAHNGR IIAAHSPFGG VSITVELPLE RDLQREV