Gene EcDH1_3989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3989
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4309825
End bp	4311150
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	56%
IMG OID
Product	two component, sigma54 specific, transcriptional regulator, Fis family
Protein accession	ACX41589
Protein GI	260451167
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.716922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCACG ATAATATCGA TATTCTGGTG GTGGATGATG ACATTAGCCA CTGCACTATT 
TTGCAGGCTT TACTGCGCGG CTGGGGCTAT AACGTCGCGC TGGCGAACAG CGGGCGACAG 
GCGTTGGAGC AGGTGCGGGA ACAGGTTTTT GATCTTGTGC TTTGCGATGT GCGAATGGCG 
GAGATGGACG GCATCGCCAC GCTGAAAGAG ATCAAAGCGT TAAACCCGGC AATTCCGGTG 
CTGATTATGA CTGCGTACTC CAGCGTCGAG ACGGCGGTAG AGGCACTGAA AACTGGGGCG 
CTGGATTATC TCATCAAGCC GCTGGATTTC GATAACCTAC AGGCGACGCT GGAAAAAGCG 
CTCGCGCATA CGCACAGTAT TGATGCTGAA ACACCTGCGG TGACTGCCAG CCAGTTCGGT 
ATGGTCGGTA AAAGCCCGGC GATGCAACAC CTGCTCAGTG AAATCGCCCT CGTCGCGCCA 
TCGGAAGCCA CGGTACTGAT CCACGGCGAT TCCGGCACCG GTAAAGAGCT GGTCGCCAGG 
GCGATTCACG CCAGTAGCGC ACGTAGCGAA AAACCGCTGG TAACGCTCAA CTGTGCGGCA 
CTCAACGAAT CCTTGCTGGA ATCTGAATTG TTCGGTCACG AAAAAGGGGC GTTTACTGGA 
GCCGATAAAC GCCGGGAAGG GCGCTTTGTT GAGGCGGACG GCGGCACGCT GTTTCTCGAT 
GAAATTGGCG ATATCTCGCC GATGATGCAG GTGCGTCTGC TGCGTGCGAT TCAGGAGCGC 
GAAGTTCAGC GTGTCGGTAG CAACCAGATT ATCTCGGTTG ATGTCCGGCT GATTGCGGCG 
ACCCATCGCG ATCTTGCCGC AGAGGTGAAT GCCGGGCGTT TTCGCCAGGA TCTCTACTAT 
CGCCTGAATG TGGTGGCGAT TGAAGTACCA TCGCTGCGGC AACGGCGGGA AGATATCCCT 
CTGCTGGCTG GCCATTTTCT GCAGCGCTTT GCCGAGCGTA ATCGCAAGGC GGTAAAAGGT 
TTTACGCCCC AGGCGATGGA TCTGTTGATT CATTACGACT GGCCGGGAAA TATTCGTGAG 
CTGGAAAACG CGGTGGAACG GGCAGTGGTG CTGCTGACCG GGGAATATAT TTCCGAACGC 
GAGCTGCCGC TGGCGATTGC CAGTACGCCG ATCCCGCTGG GACAAAGTCA GGATATTCAG 
CCGTTGGTGG AAGTGGAAAA AGAGGTGATT CTGGCGGCGC TGGAGAAAAC GGGCGGCAAC 
AAAACCGAAG CCGCCCGTCA GTTAGGGATC ACGCGCAAAA CGCTATTGGC AAAACTGTCG 
CGTTAG

Protein sequence

MTHDNIDILV VDDDISHCTI LQALLRGWGY NVALANSGRQ ALEQVREQVF DLVLCDVRMA 
EMDGIATLKE IKALNPAIPV LIMTAYSSVE TAVEALKTGA LDYLIKPLDF DNLQATLEKA 
LAHTHSIDAE TPAVTASQFG MVGKSPAMQH LLSEIALVAP SEATVLIHGD SGTGKELVAR 
AIHASSARSE KPLVTLNCAA LNESLLESEL FGHEKGAFTG ADKRREGRFV EADGGTLFLD 
EIGDISPMMQ VRLLRAIQER EVQRVGSNQI ISVDVRLIAA THRDLAAEVN AGRFRQDLYY 
RLNVVAIEVP SLRQRREDIP LLAGHFLQRF AERNRKAVKG FTPQAMDLLI HYDWPGNIRE 
LENAVERAVV LLTGEYISER ELPLAIASTP IPLGQSQDIQ PLVEVEKEVI LAALEKTGGN 
KTEAARQLGI TRKTLLAKLS R