Gene EcolC_2237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2237
Symbol
ID	6067319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2456175
End bp	2457194
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	49%
IMG OID	641601642
Product	LysR family transcriptional regulator
Protein accession	YP_001725201
Protein GI	170020247
COG category	[K] Transcription
COG ID	[COG0583] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.956085
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCTT TAATTGTTAA TAATATTTTG CAATCAAGTT ATCATAATCA AACAACTTCA 
CTTGTCAGCG ACACCGCTTC GTTTTTAACA TCGCTTATGG AAAAAAATAG TCTGTTTAGT 
CAGCGCATCC GTTTGCGCCA CCTTCATACA TTCGTAGCTG TCGCACAACA AGGAACTTTG 
GGGCGCGCGG CTGAAACCCT TAATTTGAGT CAACCTGCGC TCTCTAAGAC ATTGAATGAA 
CTGGAGCAGC TGACGGGCGC TCGCTTGTTT GAGCGTGGTC GTCAGGGGGC GCAACTTACC 
TTACCCGGCG AACAATTTTT AACGCATGCA GTCAGAGTTC TTGACGCCAT CAACACTGCC 
GGACAGTCGC TTCATCGTAA AGAAGGTCTT AATAATGATG TCGTCAGGGT TGGTGCACTA 
CCTACTGCGG CACTGGGGAT ATTACCTTCG GTTATAGGTC AGTTTCATCA GCAACAAAAA 
GAAACGACCT TGCAAGTTGC GACAATGAGT AACCCTATGA TTCTGGCGGG TTTGAAAACC 
GGGGAAATCG ATATCGGCAT TGGTCGGATG TCAGATCCTG AACTGATGAC CGGGCTTAAT 
TACGAACTGC TGTTTCTTGA ATCGCTGAAG CTGGTTGTCC GCCCTAATCA CCCGCTACTT 
CAGGAGAACG TAACGCTAAG CCGGGTGCTG GAATGGCCGG TCGTTGTATC ACCAGAAGGC 
ACTGCGCCAC GCCAGCATTC AGATGCATTA GTACAGAGCC AGGGATGTAA AATTCCTTCG 
GGTTGTATCG AAACGCTGTC TGCTTCGCTA TCTCGTCAAC TTACGGTTGA ATACGACTAC 
GTGTGGTTTG TCCCTTCTGG CGCGGTAAAA GACGACCTGC GTCATGCCAC GCTGGTGGCC 
CTGCCTGTTC CGGGACATGG TGCAGGCGAA CCGATTGGAA TACTGACCCG CGTAGATGCG 
ACGTTCTCTT CTGGTTGCCA GTTGATGATT AACGCTATTC GAAAATCAAT GCCGTTCTGA

Protein sequence

MIALIVNNIL QSSYHNQTTS LVSDTASFLT SLMEKNSLFS QRIRLRHLHT FVAVAQQGTL 
GRAAETLNLS QPALSKTLNE LEQLTGARLF ERGRQGAQLT LPGEQFLTHA VRVLDAINTA 
GQSLHRKEGL NNDVVRVGAL PTAALGILPS VIGQFHQQQK ETTLQVATMS NPMILAGLKT 
GEIDIGIGRM SDPELMTGLN YELLFLESLK LVVRPNHPLL QENVTLSRVL EWPVVVSPEG 
TAPRQHSDAL VQSQGCKIPS GCIETLSASL SRQLTVEYDY VWFVPSGAVK DDLRHATLVA 
LPVPGHGAGE PIGILTRVDA TFSSGCQLMI NAIRKSMPF