Gene EcolC_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2021
Symbol
ID	6067965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2232309
End bp	2233610
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	51%
IMG OID	641601433
Product	sensor protein RstB
Protein accession	YP_001724992
Protein GI	170020038
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT TGTTTATCCA GTTTTACCTG TTATTGTTTG TCTGCTTCCT TGTGATGTCT 
CTGCTGGTTG GGCTGGTGTA CAAATTTACC GCCGAACGCG CGGGCAAACA GTCGCTGGAT 
GATTTGATGA ACAGTTCGCT GTATCTGATG CGCAGCGAAT TGCGTGAGAT CCCCCCACAC 
GACTGGGGTA AGACGCTGAA AGAGATGGAT TTAAATCTCT CTTTCGATCT GCGTGTCGAG 
CCACTGAGTA AATACCATCT TGATGATATT TCCATGCACC GACTGCGTGG CGGCGAAATT 
GTCGCCCTGG ACGATCAGTA CACGTTTTTG CAGCGTATCC CGCGCAGCCA CTACGTGCTG 
GCAGTTGGTC CTGTTCCTTA TCTTTATTAC CTCCATCAAA TGCGATTGCT GGATATCGCC 
CTGATCGCTT TTATTGCTAT TTCCCTCGCC TTTCCGGTGT TTATCTGGAT GCGTCCGCAC 
TGGCAGGATA TGTTAAAACT GGAAGCAGCG GCGCAACGAT TTGGCGATGG GCATCTCAAT 
GAACGTATCC ACTTTGATGA GGGTTCGAGC TTTGAACGAC TTGGCGTCGC ATTTAACCAG 
ATGGCGGACA ATATCAACGC CTTAATTGCC AGCAAAAAAC AGCTTATTGA CGGTATCGCT 
CACGAACTGC GAACACCGTT AGTGCGCCTG CGTTATCGAC TGGAGATGAG CGATAACCTG 
AGCGCCGCCG AATCCCAGGC GTTGAATCGT GATATCAGTC AACTTGAAGC TTTAATTGAA 
GAGCTGCTGA CTTATGCCCG ACTCGATCGC CCACAAAACG AGCTTCATCT TAGCGAACCA 
GACCTGCCGT TGTGGCTGTC AACGCATCTG GCAGATATTC AGGCAGTAAC GCCCGATAAA 
ACGGTACGGA TAAAAACGCT CATGCAAGGC CATTATGCGG CGTTGGATAT GCGCTTAATG 
GAGCGCGTGC TGGATAATTT GCTCAATAAC GCCCTGCGCT ACTGCCATTC AACGGTTGAA 
ACCAGCCTGC TACTGTCGGG GAATAAAGCG ACATTAATTG TTGAGGATGA TGGCTCAGGG 
ATTGCCCCAG AAAACCGCGA ACATATCTTT GAACCTTTTG TTCGCCTCGA TCCCAGCCGG 
GGTCGCTCAA CCGGCGGCTG CGGGCTGGGA CTGGCAATTG TCCACTCTAT AGCACTGGCA 
ATGGGCGGTA CGGTTAATTG TGGCACCAGC GAACTGGGTG GTGCCCGCTT CTCGTTTAGC 
TGGCCGTTAT GGCATAACAT CCCGCAATTT ACCTCTGCTT GA

Protein sequence

MKKLFIQFYL LLFVCFLVMS LLVGLVYKFT AERAGKQSLD DLMNSSLYLM RSELREIPPH 
DWGKTLKEMD LNLSFDLRVE PLSKYHLDDI SMHRLRGGEI VALDDQYTFL QRIPRSHYVL 
AVGPVPYLYY LHQMRLLDIA LIAFIAISLA FPVFIWMRPH WQDMLKLEAA AQRFGDGHLN 
ERIHFDEGSS FERLGVAFNQ MADNINALIA SKKQLIDGIA HELRTPLVRL RYRLEMSDNL 
SAAESQALNR DISQLEALIE ELLTYARLDR PQNELHLSEP DLPLWLSTHL ADIQAVTPDK 
TVRIKTLMQG HYAALDMRLM ERVLDNLLNN ALRYCHSTVE TSLLLSGNKA TLIVEDDGSG 
IAPENREHIF EPFVRLDPSR GRSTGGCGLG LAIVHSIALA MGGTVNCGTS ELGGARFSFS 
WPLWHNIPQF TSA