Gene EcDH1_1976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1976
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2132351
End bp	2133607
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	51%
IMG OID
Product	conserved hypothetical protein
Protein accession	ACX39633
Protein GI	260449211
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00000418237
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATCTG ATGCGAAAAA CTTGATGAGC GACGGGAACG TGCAAATTGT TAAGACCGGC 
GAGGTCATTG GCGCGACGCA ACTTACTGAA GGCGAGTTGA TTGTTGAAGC TGGCGGAAGA 
GCCGAAAATA CCGTGGTCAC GGGGGCTGGC TGGTTGAAAG TGGCAACCGG TGGGATCGCC 
AAATGCACAC AGTACGGTAA CAATGGCACG CTATCGGTCA GCGATGGTGC CATTGCCACA 
GATATTGTTC AGTCCGAGGG AGGCGCAATT AGTCTCTCTA CGCTCGCTAC GGTTAATGGC 
CGCCATCCCG AAGGTGAATT CAGCGTTGAT AAAGGTTATG CCTGCGGTTT GTTGCTGGAA 
AATGGCGGTA ACCTGCGTGT ACTGGAAGGA CATCGCGCGG AAAAAATCAT TCTCGATCAA 
GAGGGCGGCC TGTTGGTTAA TGGGACAACC TCAGCGGTCG TGGTAGATGA AGGTGGTGAA 
TTGTTGGTGT ATCCAGGTGG GGAAGCCAGC AATTGTGAGA TTAATCAGGG CGGCGTTTTT 
ATGCTGGCCG GGAAAGCCAG TGATACGTTG CTTGCTGGTG GCACCATGAA TAATCTCGGT 
GGTGAAGACT CTGACACTAT TGTTGAGAAT GGATCCATTT ATCGTCTGGG GACGGATGGC 
CTTCAGCTCT ACAGTTCCGG TAAGACGCAA AACCTGTCCG TGAATGTGGG TGGTCGGGCT 
GAAGTGCATG CCGGTACGCT GGAAAACGCG GTAATACAAG GTGGGACAGT GATCCTGTTG 
TCACCCACCA GCGCGGACGA AAATTTTGTC GTAGAGGAAG ATCGCGCACC GGTTGAACTG 
ACCGGGAGTG TTGCATTACT GGACGGCGCT TCAATGATTA TTGGTTATGG CGCAGAGCTG 
CAACAATCAA CGATTACTGT ACAGCAGGGC GGTGTGTTGA TTCTAGACGG CAGTACGGTA 
AAAGGTGACA GTGTCACTTT CATTGTTGGT AACATCAATC TGAATGGTGG AAAACTGTGG 
CTGATCACTG ATGCGGCAAC GCATGTGCAA CTGAAAGTGA AACGCCTGCG CGGAGAGGGA 
GCGATTTGCC TGCAAACCAG TGCAAAAGAA ATTTCACCTG ACTTCATCAA TGTGAAAGGG 
GAAGTTACCG GGGATATACA CGTTGAGATA ACAGATGCCA GTCGGCAAAC TCTGTGTAAC 
GCTCTGAAAT TACAGCCAGA CGAAGACGGG ATTGGCGCAA CGCTCCAGCC TGCGTAA

Protein sequence

MGSDAKNLMS DGNVQIVKTG EVIGATQLTE GELIVEAGGR AENTVVTGAG WLKVATGGIA 
KCTQYGNNGT LSVSDGAIAT DIVQSEGGAI SLSTLATVNG RHPEGEFSVD KGYACGLLLE 
NGGNLRVLEG HRAEKIILDQ EGGLLVNGTT SAVVVDEGGE LLVYPGGEAS NCEINQGGVF 
MLAGKASDTL LAGGTMNNLG GEDSDTIVEN GSIYRLGTDG LQLYSSGKTQ NLSVNVGGRA 
EVHAGTLENA VIQGGTVILL SPTSADENFV VEEDRAPVEL TGSVALLDGA SMIIGYGAEL 
QQSTITVQQG GVLILDGSTV KGDSVTFIVG NINLNGGKLW LITDAATHVQ LKVKRLRGEG 
AICLQTSAKE ISPDFINVKG EVTGDIHVEI TDASRQTLCN ALKLQPDEDG IGATLQPA