Gene EcHS_A3584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3584
Symbol	damX
ID	5595484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3560365
End bp	3561663
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	640922701
Product	hypothetical protein
Protein accession	YP_001460182
Protein GI	157162864
COG category	[S] Function unknown
COG ID	[COG3266] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0000000527215
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGAAT TCAAACCAGA AGACGAGCTG AAACCCGATC CCAGCGATCG TCGTACTGGT 
CGTTCTCGTC AATCTTCTGA ACGTTCTAAG CGTACTGAAC GTGGCGAACC GCAGATCAAT 
TTTGATGATA TTGAACTTGA TGACACTGAC GATCGCCGTC CGACTCGTGC GCAAAAAGAG 
CGCAATGAGG AACCGGAAAT CGAAGAAGAA ATTGACGAAT CCGAAGATGA AACCGTGGAT 
GAAGAGCGCG TAGAGCGTCG TCCGCGTAAG CGCAAAAAAG CAGCCAGTAA ACCCGCTTCT 
CGTCAGTATA TGATGATGGG CGTCGGCATT CTGGTTCTAC TGCTGTTGAT CATCGGTATC 
GGTTCTGCGC TAAAAGCCCC CTCGACCACT TCCAGCGATC AAACCGCGTC TGGCGAGAAG 
AGTATTGATC TTGCTGGCAA TGCGACCGAT CAGGCGAATG GCGTGCAGCC AGCGCCGGGA 
ACCACGTCTG CGGAAAATAC TCAGCAGGAT GTTTCTCTGC CACCGATCTC TTCTACGCCG 
ACTCAAGGGC AAACCCCGGT CGCAACGGAT GGTCAACAAC GTGTTGAAGT GCAGGGTGAC 
CTGAACAATG CGCTGACCCA GCCACAAAAT CAGCAACAGT TGAACAATGT GGCGGTCAAT 
TCTACATTGC CGACTGAACC CGCGACTGTC GCGCCAGTAC GCAATGGCAA TGCATCGCGT 
GACACGGCGA AAACGCAAAC TGCTGAACGT CCGGCCACTA CGCGTCCAGC TCGTCAGCAG 
GCGGTGATTG AACCGAAAAA ACCGCAAGCA ACCGTGAAAA CGGAACCGAA GCCGGTAGCA 
CAGACGCCGA AGCGTACTGA ACCAGCTGCC CCTGTGGCGA GCACGAAGGC ACCGGCTGCG 
ACTTCTACGC CAGCCGCAAC GCCAGCACCA AAAGAGACGG CGACTACGGC TCCAGTACAG 
ACGGCATCCC CGGCGCAAAC CACGGCAACA CCAGCCGCTG GAGGGAAGAC CGCAGGTAAT 
GTTGGTTCGT TGAAATCGGC ACCGTCCAGC CATTACACTC TGCAGCTGAG CAGTTCCTCT 
AACTACGACA ACCTGAACGG TTGGGCGAAG AAAGAGAATC TGAAAAACTA CGTTGTCTAT 
GAAACGACGC GTAATGGTCA GCCGTGGTAT GTCCTGGTTT CTGGCGTGTA CGCTTCGAAA 
GAAGAGGCGA AAAAAGCGGT ATCTACATTG CCAGCAGATG TTCAGGCCAA AAACCCGTGG 
GCGAAACCGC TGCGTCAGGT ACAGGCCGAT CTGAAGTAA

Protein sequence

MDEFKPEDEL KPDPSDRRTG RSRQSSERSK RTERGEPQIN FDDIELDDTD DRRPTRAQKE 
RNEEPEIEEE IDESEDETVD EERVERRPRK RKKAASKPAS RQYMMMGVGI LVLLLLIIGI 
GSALKAPSTT SSDQTASGEK SIDLAGNATD QANGVQPAPG TTSAENTQQD VSLPPISSTP 
TQGQTPVATD GQQRVEVQGD LNNALTQPQN QQQLNNVAVN STLPTEPATV APVRNGNASR 
DTAKTQTAER PATTRPARQQ AVIEPKKPQA TVKTEPKPVA QTPKRTEPAA PVASTKAPAA 
TSTPAATPAP KETATTAPVQ TASPAQTTAT PAAGGKTAGN VGSLKSAPSS HYTLQLSSSS 
NYDNLNGWAK KENLKNYVVY ETTRNGQPWY VLVSGVYASK EEAKKAVSTL PADVQAKNPW 
AKPLRQVQAD LK