Gene EcDH1_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2139
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2286302
End bp	2287624
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	48%
IMG OID
Product	HipA N-terminal domain protein
Protein accession	ACX39793
Protein GI	260449371
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00420525
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTAAAC TTGTCACTTG GATGAACAAC CAGCGGGTAG GCGAGTTAAC GAAGTTAGCC 
AACGGCGCGC ACACCTTTAA GTATGCACCG GAGTGGTTAG CAAGCCGTTA TGCCAGACCG 
TTGTCACTTT CGCTGCCATT GCAGAGGGGG AATATCACCT CTGATGCCGT ATTTAACTTC 
TTCGATAACC TGTTACCCGA TAGCCCGATT GTACGTGACC GGATCGTTAA ACGTTATCAT 
GCCAAATCCA GACAACCGTT TGATTTATTG TCAGAAATAG GGCGAGACAG CGTTGGTGCC 
GTGACGTTAA TACCCGAAGA CGAAACCGTA ACGCATCCGA TAATGGCATG GGAAAAGCTT 
ACTGAAGCCA GACTTGAAGA AGTATTAACG GCTTATAAAG CAGATATCCC GCTAGGCATG 
ATTAGAGAAG AAAATGACTT TCGCATCTCG GTTGCTGGCG CACAGGAGAA GACAGCACTG 
CTCAGAATAG GCAATGACTG GTGCATTCCG AAAGGAATAA CGCCGACGAC GCACATCATT 
AAATTACCGA TTGGCGAAAT CAGGCAGCCC AATGCGACGC TCGATCTCAG CCAAAGCGTT 
GATAATGAGT ATTACTGTCT GCTGCTGGCG AAAGAACTTG GGTTGAATGT TCCGGACGCA 
GAAATCATTA AAGCGGGAAA TGTGCGCGCG TTAGCGGTCG AACGTTTTGA CAGGCGTTGG 
AATGCTGAGC GAACGGTTTT ACTTCGCTTG CCACAGGAGG ATATGTGTCA GACATTCGGT 
TTACCTTCAT CGGTGAAATA TGAATCAGAT GGAGGCCCAG GCATCGCGCG GATCATGGCT 
TTTTTGATGG GGTCCAGCGA GGCGCTGAAA GATCGCTATG ATTTTATGAA ATTCCAGGTC 
TTCCAGTGGT TGATTGGCGC AACGGACGGT CATGCAAAAA ACTTCTCCGT ATTTATTCAG 
GCTGGCGGCA GTTATCGACT CACGCCATTT TACGACATCA TTTCAGCATT TCCGGTCCTT 
GGCGGTACGG GAATACACAT CAGCGATCTC AAACTGGCAA TGGGGCTTAA CGCATCCAAA 
GGCAAAAAAA CGGCAATCGA TAAAATTTAT CCGCGACATT TTTTGGCGAC AGCAAAGGTG 
CTGAGATTCC CGGAAGTGCA GATGCATGAA ATCCTGAGTG ACTTTGCCAG AATGATTCCA 
GCAGCACTGG ATAACGTGAA GACTTCATTA CCGACAGATT TTCCGGAGAA CGTGGTGACG 
GCAGTTGAAA GCAATGTGTT GAGGTTGCAT GGACGGTTAA GCCGAGAATA CGGTAGTAAG 
TGA

Protein sequence

MPKLVTWMNN QRVGELTKLA NGAHTFKYAP EWLASRYARP LSLSLPLQRG NITSDAVFNF 
FDNLLPDSPI VRDRIVKRYH AKSRQPFDLL SEIGRDSVGA VTLIPEDETV THPIMAWEKL 
TEARLEEVLT AYKADIPLGM IREENDFRIS VAGAQEKTAL LRIGNDWCIP KGITPTTHII 
KLPIGEIRQP NATLDLSQSV DNEYYCLLLA KELGLNVPDA EIIKAGNVRA LAVERFDRRW 
NAERTVLLRL PQEDMCQTFG LPSSVKYESD GGPGIARIMA FLMGSSEALK DRYDFMKFQV 
FQWLIGATDG HAKNFSVFIQ AGGSYRLTPF YDIISAFPVL GGTGIHISDL KLAMGLNASK 
GKKTAIDKIY PRHFLATAKV LRFPEVQMHE ILSDFARMIP AALDNVKTSL PTDFPENVVT 
AVESNVLRLH GRLSREYGSK