Gene EcolC_0145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0145
Symbol
ID	6068299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	158669
End bp	159847
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	49%
IMG OID	641599545
Product	AraC family transcriptional regulator
Protein accession	YP_001723154
Protein GI	170018200
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators [COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTACTA AACGTCACCG CATCACATTA CTGTTCAATG CCAATAAAGC CTATGACCGG 
CAGGTAGTAG AAGGCGTAGG GGAATATTTA CAGGCGTCAC AATCGGAATG GGATATTTTC 
ATTGAAGAAG ATTTCCGCGC CCGCATTGAT AAAATCAAGG ACTGGTTAGG AGATGGCGTC 
ATTGCCGACT TCGACGACAA ACAGATCGAG CAAGCGCTGG CTGATGTCGA CGTCCCCATT 
GTTGGGGTTG GCGGCTCGTA TCACCTTGCA GAAAGTTACC CACCCGTTCA TTACATTGCC 
ACCGATAACT ATGCGCTGGT TGAAAGCGCA TTTTTGCATT TAAAAGAGAA AGGCGTTAAC 
CGCTTTGCTT TTTATGGTCT TCCGGAATCA AGCGGCAAAC GTTGGGCCAC TGAGCGCGAA 
TATGCATTTC GTCAGCTTGT CGCCGAAGAA AAGTATCGCG GAGTGGTTTA TCAGGGGTTA 
GAAACCGCGC CAGAGAACTG GCAACACGCG CAAAATCGGC TGGCAGACTG GCTACAAACG 
CTACCACCGC AAACCGGGAT TATTGCCGTT ACTGACGCCC GAGCGCGGCA TATTCTGCAA 
GTATGTGAAC ATCTACATAT TCCCGTACCG GAAAAATTAT GCGTGATTGG CATCGATAAC 
GAAGAACTGA CCCGCTATCT GTCGCGTGTC GCCCTTTCTT CGGTCGCTCA GGGCGCGCGG 
CAAATGGGCT ATCAGGCGGC AAAACTGTTG CATCGATTAT TAGATAAAGA AGAAATGCCG 
CTACAGCGAA TTTTGGTCCC ACCAGTTCGC GTCATTGAAC GGCGCTCAAC AGATTATCGC 
TCGCTGACCG ATCCCGCCGT TATTCAGGCC ATGCATTACA TTCGTAATCA CGCCTGTAAA 
GGGATTAAAG TGGATCAGGT ACTGGATGCG GTCGGGATCT CGCGCTCCAA TCTTGAGAAG 
CGTTTTAAAG AAGAGGTGGG TGAAACCATC CATGCCATGA TTCATGCCGA GAAGCTGGAG 
AAAGCGCGCA GTCTGCTGAT TTCAACCACC TTGTCGATCA ATGAGATATC GCAAATGTGC 
GGTTATCCAT CGCTGCAATA TTTCTACTCT GTTTTTAAAA AAGCATATGA CACGACGCCA 
AAAGAGTATC GCGATGTAAA TAGCGAGGTC ATGTTGTAG

Protein sequence

MFTKRHRITL LFNANKAYDR QVVEGVGEYL QASQSEWDIF IEEDFRARID KIKDWLGDGV 
IADFDDKQIE QALADVDVPI VGVGGSYHLA ESYPPVHYIA TDNYALVESA FLHLKEKGVN 
RFAFYGLPES SGKRWATERE YAFRQLVAEE KYRGVVYQGL ETAPENWQHA QNRLADWLQT 
LPPQTGIIAV TDARARHILQ VCEHLHIPVP EKLCVIGIDN EELTRYLSRV ALSSVAQGAR 
QMGYQAAKLL HRLLDKEEMP LQRILVPPVR VIERRSTDYR SLTDPAVIQA MHYIRNHACK 
GIKVDQVLDA VGISRSNLEK RFKEEVGETI HAMIHAEKLE KARSLLISTT LSINEISQMC 
GYPSLQYFYS VFKKAYDTTP KEYRDVNSEV ML