Gene EcDH1_4147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4147
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4495710
End bp	4497137
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	53%
IMG OID
Product	protein of unknown function DUF195
Protein accession	ACX41747
Protein GI	260451325
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATTTCT CAATCATGGT TTACGCAGTT ATTGCGTTGG TGGGTGTGGC AATTGGCTGG 
CTGTTTGCCA GTTATCAACA TGCGCAGCAA AAAGCCGAGC AATTAGCTGA ACGTGAAGAG 
ATGGTCGCGG AGTTAAGCGC GGCAAAACAA CAAATTACCC AAAGCGAGCA CTGGCGTGCA 
GAGTGCGAGT TACTCAATAA CGAAGTGCGC AGCCTGCAAA GTATTAACAC CTCTCTGGAG 
GCCGATCTGC GTGAAGTAAC CACGCGGATG GAAGCCGCAC AGCAACATGC TGACGATAAA 
ATTCGCCAGA TGATTAACAG CGAGCAGCGC CTCAGTGAGC AGTTTGAAAA CCTCGCCAAC 
CGTATTTTTG AGCACAGCAA TCGCCGGGTT GATGAGCAAA ACCGTCAGAG TCTGAACAGC 
CTGTTGTCGC CGCTACGTGA ACAACTGGAC GGTTTCCGCC GTCAGGTTCA GGACAGCTTC 
GGTAAAGAAG CACAAGAACG CCATACCCTG ACCCACGAAA TTCGCAATCT CCAGCAACTC 
AACGCGCAAA TGGCCCAGGA AGCGATCAAC CTGACGCGCG CGCTGAAAGG CGACAATAAA 
ACCCAGGGCA ACTGGGGCGA GGTAGTATTG ACGCGGGTGC TGGAGGCTTC CGGTCTGCGT 
GAAGGGTATG AATATGAAAC CCAGGTCAGC ATCGAAAATG ACGCCCGCTC GCGGATGCAG 
CCGGATGTCA TCGTGCGCCT GCCGCAGGGA AAAGATGTGG TGATCGACGC CAAAATGACG 
CTGGTCGCCT ATGAACGCTA TTTTAACGCC GAAGACGACT ACACCCGCGA AAGCGCGCTA 
CAGGAACATA TCGCGTCGGT GCGTAACCAT ATCCGTTTGC TGGGACGCAA AGATTATCAA 
CAGCTGCCGG GGCTGCGAAC TCTGGATTAC GTGCTGATGT TTATTCCCGT TGAACCCGCT 
TTTTTACTGG CGCTTGACCG CCAGCCGGAG CTGATCACCG AAGCGTTGAA AAACAACATC 
ATGCTGGTTA GCCCGACTAC GCTGCTGGTG GCGCTGCGCA CTATCGCCAA CCTGTGGCGT 
TATGAGCATC AAAGCCGCAA CGCCCAGCAA ATCGCCGATC GTGCCAGCAA GCTGTACGAC 
AAGATGCGTT TGTTCATCGA TGACATGTCC GCGATTGGTC AAAGTCTCGA CAAAGCGCAG 
GATAATTATC GGCAGGCAAT GAAAAAACTC TCTTCAGGGC GCGGAAATGT GCTGGCGCAG 
GCAGAAGCGT TTCGCGGTTT AGGAGTAGAA ATTAAACGCG AGATTAATCC GGATTTGGCT 
GAACAGGCGG TGAGCCAGGA TGAAGAGTAT CGACTTCGGT CGGTTCCGGA GCAGCCGAAT 
GATGAAGCTT ATCAACGCGA TGATGAATAT AATCAGCAGT CGCGCTAG

Protein sequence

MDFSIMVYAV IALVGVAIGW LFASYQHAQQ KAEQLAEREE MVAELSAAKQ QITQSEHWRA 
ECELLNNEVR SLQSINTSLE ADLREVTTRM EAAQQHADDK IRQMINSEQR LSEQFENLAN 
RIFEHSNRRV DEQNRQSLNS LLSPLREQLD GFRRQVQDSF GKEAQERHTL THEIRNLQQL 
NAQMAQEAIN LTRALKGDNK TQGNWGEVVL TRVLEASGLR EGYEYETQVS IENDARSRMQ 
PDVIVRLPQG KDVVIDAKMT LVAYERYFNA EDDYTRESAL QEHIASVRNH IRLLGRKDYQ 
QLPGLRTLDY VLMFIPVEPA FLLALDRQPE LITEALKNNI MLVSPTTLLV ALRTIANLWR 
YEHQSRNAQQ IADRASKLYD KMRLFIDDMS AIGQSLDKAQ DNYRQAMKKL SSGRGNVLAQ 
AEAFRGLGVE IKREINPDLA EQAVSQDEEY RLRSVPEQPN DEAYQRDDEY NQQSR