Gene EcDH1_1264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1264
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	1361529
End bp	1362641
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	52%
IMG OID
Product	transposase IS4 family protein
Protein accession	ACX38938
Protein GI	260448516
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.67928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTACT CTCACGATAA CTGGTCAGCA ATTCTGGCCC ATATTGGTAA GCCCGAAGAA 
CTGGATACTT CGGCACGTAA TGCCGGGGCT CTAACCCGCC GCCGCGAAAT TCGTGATGCT 
GCAACTCTGC TACGTCTGGG GCTGGCTTAC GGCCCCGGGG GGATGTCATT ACGTGAAGTC 
ACTGCATGGG CTCAGCTCCA TGACGTTGCA ACATTATCTG ACGTGGCTCT CCTGAAGCGG 
CTGCGGAATG CCGCCGACTG GTTTGGCATA CTTGCCGCAC AAACACTTGC TGTACGCGCC 
GCAGTTACGG GTTGTACAAG CGGAAAGAGA TTGCGTCTTG TCGATGGAAC AGCAATCAGT 
GCGCCCGGGG GCGGCAGCGC TGAATGGCGA CTACATATGG GATATGATCC TCATACCTGT 
CAGTTCACTG ATTTTGAGCT AACCGACAGC AGAGACGCTG AACGGCTGGA CCGATTTGCG 
CAAACGGCAG ACGAGATACG CATTGCTGAC CGGGGATTCG GTTCGCGTCC CGAATGTATC 
CGCTCACTTG CTTTTGGAGA AGCTGATTAT ATCGTCCGGG TTCACTGGCG AGGATTGCGC 
TGGTTAACTG CAGAAGGAAT GCGCTTTGAC ATGATGGGTT TTCTGCGCGG GCTGGATTGC 
GGTAAGAACG GTGAAACCAC TGTAATGATA GGCAATTCAG GTAATAAAAA AGCCGGAGCT 
CCCTTTCCGG CACGTCTCAT TGCCGTATCA CTTCCTCCCG AAAAAGCATT AATCAGTAAA 
ACCCGACTGC TCAGCGAGAA TCGTCGAAAA GGACGAGTAG TTCAGGCGGA AACGCTGGAA 
GCAGCGGGCC ATGTGCTATT GCTAACATCA TTACCGGAAG ATGAATATTC AGCAGAGCAA 
GTGGCTGATT GTTACCGTCT GCGATGGCAA ATTGAACTGG CTTTTAAGCG GCTCAAAAGT 
TTGCTGCACC TGGATGCTTT GCGTGCAAAG GAACCTGAAC TCGCGAAAGC GTGGATATTT 
GCTAATCTAC TCGCCGCATT TTTAATTGAC GACATAATCC AGCCATCGCT GGATTTCCCC 
CCCAGAAGTG CCGGATCCGA AAAGAAGAAC TAA

Protein sequence

MNYSHDNWSA ILAHIGKPEE LDTSARNAGA LTRRREIRDA ATLLRLGLAY GPGGMSLREV 
TAWAQLHDVA TLSDVALLKR LRNAADWFGI LAAQTLAVRA AVTGCTSGKR LRLVDGTAIS 
APGGGSAEWR LHMGYDPHTC QFTDFELTDS RDAERLDRFA QTADEIRIAD RGFGSRPECI 
RSLAFGEADY IVRVHWRGLR WLTAEGMRFD MMGFLRGLDC GKNGETTVMI GNSGNKKAGA 
PFPARLIAVS LPPEKALISK TRLLSENRRK GRVVQAETLE AAGHVLLLTS LPEDEYSAEQ 
VADCYRLRWQ IELAFKRLKS LLHLDALRAK EPELAKAWIF ANLLAAFLID DIIQPSLDFP 
PRSAGSEKKN