Gene EcHS_A3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3000
Symbol
ID	5595440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3010649
End bp	3012025
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	35%
IMG OID	640922121
Product	transcriptional regulator
Protein accession	YP_001459624
Protein GI	157162306
COG category	[K] Transcription
COG ID	[COG3710] DNA-binding winged-HTH domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0000000000507386
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTTAG AAAATAAATT CTCATATCAT TTTCTTGAGG GATTAACGCT CACGGAAGAT 
GGAATTCTTA CTCAAGGAAA TGAGCAAGTT TATATTCCAC AGAAAGAGTT AGGTGTATTA 
ATAGTATTAC TTGAATCCGC TGGTCATGTT GTACTGAAAG ATATGATCAT CGAATCAGTA 
TGGAAAAATA TTATTGTTAG TGACGAGTCC CTGACAAGAT GTATCTATTC TTTGCGCTGC 
ATTTTTGAAA AAATTGGCTA TGATCGTTGC ATAGAAACAA TCTACCGGAA AGGTTATCGT 
TTCAGCGGGC AGGTTTTCAA AACTAAAATT AATGAAGATA ATACTTCAGA CTATTCCATA 
GCTATATTCC CTTTCACTAC TTCATTGAAT ACACTGGATC CATTAATACT TAATCAGGAA 
TTAGTGCAAA TCATTTCAAA TAAAAAAATC GATGGTCTCT ATACCTATCC GATGGCTGCG 
ACAAATTTTT GTAATGATCA CATATCTCAA AATTCATTCT TGAGCAGATT CAAGCCAGAT 
TATTTCGTTA CAGGAAGAAT AAACCAGAAT AATGCAGTGA ACACTTTATA CATTGAGTTG 
ATCGACGCTA AAAACCTTTT CCTCATCGCC AGTAATCATC TCCCTGTTGA TGAACTACAT 
AATACATCAC AATTTATTAT AGATAATATC CTTCAAACGG TACATAAACC AGAACGATCT 
GTAAGATTAG CTAAGCAGGA CCAAGGATAT AAGAATCATT ATTTATCAGA TGAAATGTTA 
GCCGGAAAGA AAGAACTTTA CGACTTCACC CCTGAAAGCA TTTACAGGGC CATGACTATA 
TTTGATAGAT TACAAAATAA AAGTGATATA CAGACGCTAA AAACAGAATG TTATTGCCTT 
CTAGCGGAAT GCCATATGTC TTTGGCACTT CATGGAAAAA GTGAACTTGA ACTTGCTGCT 
CAAAAAGCAT TAGAGCTTTT AGATTATGTA TCAGACATAA CCACTGTCGA TGGAAAAATT 
TTAGCTATTA TGGGACTGAT AACTGGTCTG TCTGGACAAG CAAAAGTATC TCATATCTTA 
TTTGAACAGG CTAAGATACA CTCAACTGAT ATAGCCTCTC TCTACTACTA TAGGGCACTA 
GTCCACTTTC ATAATGAAAA AATTGAAGAG GCAAGGATTT GTATAGACAA ATCACTACAA 
CTCGAACCCA GAAGACGAAA AGCAGTTGTG ATAAAAGAAT GTGTAGATAT GTATGTGCCT 
AACCCGCTCA AAAACAACAT TAAACTCTAC TATAAAGAAA CTGAGAGTGA AAGCCATCGA 
GTTATAATTG ACAACATTTT GAAATTAAAG CAGCTGACGA GAATTTGTAT GCGATAA

Protein sequence

MDLENKFSYH FLEGLTLTED GILTQGNEQV YIPQKELGVL IVLLESAGHV VLKDMIIESV 
WKNIIVSDES LTRCIYSLRC IFEKIGYDRC IETIYRKGYR FSGQVFKTKI NEDNTSDYSI 
AIFPFTTSLN TLDPLILNQE LVQIISNKKI DGLYTYPMAA TNFCNDHISQ NSFLSRFKPD 
YFVTGRINQN NAVNTLYIEL IDAKNLFLIA SNHLPVDELH NTSQFIIDNI LQTVHKPERS 
VRLAKQDQGY KNHYLSDEML AGKKELYDFT PESIYRAMTI FDRLQNKSDI QTLKTECYCL 
LAECHMSLAL HGKSELELAA QKALELLDYV SDITTVDGKI LAIMGLITGL SGQAKVSHIL 
FEQAKIHSTD IASLYYYRAL VHFHNEKIEE ARICIDKSLQ LEPRRRKAVV IKECVDMYVP 
NPLKNNIKLY YKETESESHR VIIDNILKLK QLTRICMR