Gene EcHS_A1523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1523
Symbol
ID	5594939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1530433
End bp	1531839
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID	640920678
Product	GntR family transcriptional regulator
Protein accession	YP_001458234
Protein GI	157160916
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT ACCAGCAGCT TGCAGAACAA TTACGCGAGC AGATTGCGTC GGGTATCTGG 
CAACCCGGCG ATCGTTTGCC TTCGTTGCGT GACCAGGTGG CGCTTTCAGG CATGAGCTTT 
ATGACTGTCA GCCATGCCTA TCAGTTGCTC GAAAGTCAGG GATATATTAT CGCACGACCG 
CAGTCGGGTT ATTACGTTGC GCCACAGGCA ATAAAAATGC CGAAAGCGCC AGTCATTCCA 
GTCACTCGAG ATGAAGCAGT CGATATCAAC ACTTATATTT TTGATATGTT GCAGGCCAGT 
CGCGATCCGT CGGTCGTTCC GTTTGCCTCG GCCTTTCCCG ACCCGCGACT TTTCCCCCTC 
CAACAACTAA ACCGCTCGCT GGCGCAGGTA AGCAAAACCG CCACAGCGAT GAGCGTGATT 
GAAAACTTAC CGCCAGGAAA CGCAGAACTG CGTCAGGCTA TTGCTCGTCG CTATGCCTTA 
CAGGGCATCA CCATTTCTCC TGATGAAATT GTCATTACTG CCGGGGCGTT AGAGGCATTA 
AACCTCAGTT TGCAAGCGGT AACTGAACCG GGCGATTGGG TGATAGTAGA GAATCCTTGT 
TTCTACGGTG CGTTGCAGGC GCTGGAGCGG CTACGGCTGA AGGCGTTATC GGTGGCGACG 
GATGTTAAAG AAGGGATAGA TCTTCAGGCG CTGGAACTGG CGTTGCAGGA GTATCCGGTG 
AAAGCGTGCT GGCTGATGAC TAATAGCCAG AATCCACTCG GATTTACCTT AACGCCGCAA 
AAAAAAGCAC AACTGGTGGC GTTGCTCAAT CAGTACAACG TAACGCTGAT TGAAGATGAC 
GTTTACAGCG AACTTTATTT TGGACGGGAA AAACTGCTGC CTGCGAAAGC GTGGGATCGC 
CACGATGGCG TTTTGCATTG CTCTTCGTTT TCGAAATGTC TGGTGCCTGG TTTTCGTATT 
GGTTGGGTCG CCGCCGGAAA ACATGCACGT AAAATTCAAC GCTTGCAGTT GATGAGTACG 
CTTTCCACCA GCTCACCGAT GCAACTTGCG CTGGTGGATT ACCTTTCCAC GCGCCGATAC 
GACGCCCATC TTCGTCGCCT GCGTCGCCAG CTTGCGGAAC GTAAACAACG TGCCTGGCAG 
GCACTGCTGC GTTATCTGCC TGCGGAAGTG AAAATTCATC ATAATGACAG TGGTTACTTT 
CTCTGGCTGG AGCTCCCCGA GCCGTTAGAT GCCGGCGAAT TAAGCCTGGC GGCACTGACG 
CATCATATCA GTATTGCGCC GGGTAAAATG TTTTCTACCG GTGAAAACTG GTCACGTTTT 
TTCCGTTTTA ATACCGCGTG GCAGTGGGGA GAGCGTGAAG AACAGGCGGT AAAACAATTA 
GGCAAACTTA TTCAAGAACG GCTGTAA

Protein sequence

MKKYQQLAEQ LREQIASGIW QPGDRLPSLR DQVALSGMSF MTVSHAYQLL ESQGYIIARP 
QSGYYVAPQA IKMPKAPVIP VTRDEAVDIN TYIFDMLQAS RDPSVVPFAS AFPDPRLFPL 
QQLNRSLAQV SKTATAMSVI ENLPPGNAEL RQAIARRYAL QGITISPDEI VITAGALEAL 
NLSLQAVTEP GDWVIVENPC FYGALQALER LRLKALSVAT DVKEGIDLQA LELALQEYPV 
KACWLMTNSQ NPLGFTLTPQ KKAQLVALLN QYNVTLIEDD VYSELYFGRE KLLPAKAWDR 
HDGVLHCSSF SKCLVPGFRI GWVAAGKHAR KIQRLQLMST LSTSSPMQLA LVDYLSTRRY 
DAHLRRLRRQ LAERKQRAWQ ALLRYLPAEV KIHHNDSGYF LWLELPEPLD AGELSLAALT 
HHISIAPGKM FSTGENWSRF FRFNTAWQWG EREEQAVKQL GKLIQERL