Gene EcDH1_3659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3659
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3945783
End bp	3947063
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	53%
IMG OID
Product	protein of unknown function DUF445
Protein accession	ACX41270
Protein GI	260450848
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAC TCATCGAACT CAGACGCGCC AAAAGGTTGG CGCTCTCTTT ACTGCTTATC 
GCCGCTGCTA CCTTTGTCGT TACGCTGTTT TTGCCGCCCA ATTTTTGGGT GAGCGGCGTG 
AAGGCGATTG CTGAAGCGGC GATGGTCGGC GCGCTGGCGG ACTGGTTTGC GGTGGTGGCG 
CTGTTTCGCC GCGTGCCGAT TCCGATCATT TCTCGCCATA CGGCGATTAT CCCGCGTAAT 
AAAGACCGGA TTGGCGAAAA TCTCGGCCAG TTCGTGCAGG AAAAATTTCT TGATACTCAA 
TCCCTGGTGG CATTGATTCG ACGCCACGAA CCGGCGTTGC TGATTGGCAA CTGGTTTAGC 
CAGCCAGAAA ACGCCCGCCG CGTTGGTCAG CATCTGTTGC AGATCATGAG CGGTTTTCTC 
GAACTTACCG ATGATGCGCG TATTCAGCGC CTGCTTAAGC GCGCGGTCCA TCGGGCGATT 
GATAAGGTCG ATCTTTCCGG CACCAGTGCG TTGATGCTGG AGAGTATGAC CAAAAACGAT 
CGTCATCAGG TGCTGCTGGA TACGCTGATC GCACAGTTGA TCGCCCTTCT CCAGCGCGAT 
AAATCGCGCA AGTTTATCGC CCAGCAAATT GTTCGCTGGC TGGAGAGCGA GCATCCACTG 
AAAGCCAAAA TTCTCCCCAC CGAATGGTTG GGCGAACATA GCGCGGAGTT GGTTTCTGAC 
GCGGTGAATT CTTTGCTTGA TGATATTAGT CGCGATCGTG CGCATCAGAT CCGCCATGCG 
TTTGATCGCG CCACCTTCGC CCTGATCGAC AAGCTGAAAA ACGATCCGGA AATGGCAGCG 
CGAGCCGATG CCGTAAAAAG CTATCTGAAA GAAGATGAAG CTTTTAATCG CTATCTCAGT 
GAATTGTGGG GGGATTTACG GGAATGGCTG AAAGTGGATA TCAACAGTGA AGATTCTCGT 
GTGAAAGAAC GCATCGCACG AGCGGGTCAA TGGTTTGGCG AAACGTTAAT TGCCGATGAT 
GCCTTGCGGG CGTCGTTAAA TGGTCATCTT GAACAAGCCG CGCACCGCGT CGCGCCTGAG 
TTTTCCGCAT TCCTGACGCG CCACATCAGC GATACGGTAA AAAGCTGGGA TGCGCGGGAT 
ATGTCGCGGC AAATAGAGTT AAATATCGGC AAAGATCTGC AGTTTATTCG TGTCAACGGT 
ACGCTGGTTG GCGGTTGTAT TGGGCTAATT TTATATTTGC TGTCGCAGCT CCCGGCCTTG 
TTCCCCCTCG GCAATTTTTA G

Protein sequence

MNKLIELRRA KRLALSLLLI AAATFVVTLF LPPNFWVSGV KAIAEAAMVG ALADWFAVVA 
LFRRVPIPII SRHTAIIPRN KDRIGENLGQ FVQEKFLDTQ SLVALIRRHE PALLIGNWFS 
QPENARRVGQ HLLQIMSGFL ELTDDARIQR LLKRAVHRAI DKVDLSGTSA LMLESMTKND 
RHQVLLDTLI AQLIALLQRD KSRKFIAQQI VRWLESEHPL KAKILPTEWL GEHSAELVSD 
AVNSLLDDIS RDRAHQIRHA FDRATFALID KLKNDPEMAA RADAVKSYLK EDEAFNRYLS 
ELWGDLREWL KVDINSEDSR VKERIARAGQ WFGETLIADD ALRASLNGHL EQAAHRVAPE 
FSAFLTRHIS DTVKSWDARD MSRQIELNIG KDLQFIRVNG TLVGGCIGLI LYLLSQLPAL 
FPLGNF