Gene EcDH1_2207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2207
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2367069
End bp	2368475
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID
Product	transcriptional regulator, GntR family with aminotransferase domain
Protein accession	ACX39857
Protein GI	260449435
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT ACCAGCAGCT TGCAGAACAA TTACGCGAGC AGATTGCGTC GGGTATCTGG 
CAACCCGGCG ATCGTTTGCC TTCGTTGCGT GACCAGGTGG CGCTTTCAGG CATGAGCTTT 
ATGACTGTCA GCCATGCCTA TCAGTTGCTC GAAAGTCAGG GATATATTAT CGCACGACCG 
CAGTCGGGTT ATTACGTTGC GCCACAGGCA ATAAAAATGC CGAAAGCGCC AGTCATTCCA 
GTCACTCGAG ATGAAGCAGT CGATATCAAC ACTTATATTT TTGATATGTT GCAGGCCAGT 
CGCGATCCGT CGGTCGTTCC GTTTGCCTCG GCCTTTCCCG ACCCGCGACT TTTCCCCCTC 
CAACAACTAA ACCGCTCGCT GGCGCAGGTA AGCAAAACCG CCACAGCGAT GAGCGTGATT 
GAAAACTTAC CGCCAGGAAA CGCAGAACTG CGTCAGGCTA TTGCTCGTCG CTATGCCTTA 
CAGGGCATCA CCATTTCTCC TGATGAAATT GTCATTACTG CCGGGGCGTT AGAGGCATTA 
AACCTCAGTT TGCAAGCGGT AACTGAACCG GGCGATTGGG TGATAGTAGA GAATCCTTGT 
TTCTACGGTG CGTTGCAGGC GCTGGAGCGG CTACGGCTGA AGGCGTTATC GGTGGCGACG 
GATGTTAAAG AAGGGATAGA TCTTCAGGCG CTGGAACTGG CGTTGCAGGA GTATCCGGTG 
AAAGCGTGCT GGCTGATGAC TAATAGCCAG AATCCACTCG GATTTACCTT AACGCCGCAA 
AAAAAAGCAC AACTGGTGGC GTTGCTCAAT CAGTACAACG TAACGCTGAT TGAAGATGAC 
GTTTACAGCG AACTTTATTT TGGACGGGAA AAACCGCTGC CTGCGAAAGC GTGGGATCGC 
CACGATGGCG TTTTGCATTG CTCTTCGTTT TCGAAATGTC TGGTGCCTGG TTTTCGTATT 
GGTTGGGTCG CCGCCGGAAA ACATGCACGT AAAATTCAAC GCTTGCAGTT GATGAGTACG 
CTTTCCACCA GCTCACCGAT GCAACTTGCG CTGGTGGATT ACCTTTCCAC GCGCCGATAC 
GACGCCCATC TTCGTCGCCT GCGTCGCCAG CTTGCGGAAC GTAAACAACG TGCCTGGCAG 
GCACTGCTGC GTTATCTGCC TGCGGAAGTG AAAATTCATC ATAATGACAG TGGTTACTTT 
CTCTGGTTGG AGCTCCCCGA GCCGTTAGAT GCCGGCGAAT TAAGCCTGGC GGCACTGACG 
CATCATATCA GTATTGCGCC GGGTAAAATG TTTTCTACCG GTGAAAACTG GTCACGTTTT 
TTCCGTTTTA ATACCGCGTG GCAGTGGGGA GAGCGTGAAG AACAGGCGGT AAAACAATTA 
GGCAAACTTA TTCAAGAACG GCTGTAA

Protein sequence

MKKYQQLAEQ LREQIASGIW QPGDRLPSLR DQVALSGMSF MTVSHAYQLL ESQGYIIARP 
QSGYYVAPQA IKMPKAPVIP VTRDEAVDIN TYIFDMLQAS RDPSVVPFAS AFPDPRLFPL 
QQLNRSLAQV SKTATAMSVI ENLPPGNAEL RQAIARRYAL QGITISPDEI VITAGALEAL 
NLSLQAVTEP GDWVIVENPC FYGALQALER LRLKALSVAT DVKEGIDLQA LELALQEYPV 
KACWLMTNSQ NPLGFTLTPQ KKAQLVALLN QYNVTLIEDD VYSELYFGRE KPLPAKAWDR 
HDGVLHCSSF SKCLVPGFRI GWVAAGKHAR KIQRLQLMST LSTSSPMQLA LVDYLSTRRY 
DAHLRRLRRQ LAERKQRAWQ ALLRYLPAEV KIHHNDSGYF LWLELPEPLD AGELSLAALT 
HHISIAPGKM FSTGENWSRF FRFNTAWQWG EREEQAVKQL GKLIQERL