Gene EcDH1_2187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2187
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2345526
End bp	2346662
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	42%
IMG OID
Product	transposase IS4 family protein
Protein accession	ACX39838
Protein GI	260449416
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00361348
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACTTA AAAAATTGAT GGGACATATT TCTATTATCC CCGATTACAG ACAAGCCTGG 
AAAATGGAAC ATAAGTTATC GGATATTCTA CTGTTGACTA TTTGTGCCGT TATTTCTGGT 
GCAGAAGGCT GGGAAGATAT AGAGGATTTT GGGGAAACAC ATCCCGATTT TTTGAAGCAA 
TATGGTGATT TTGAAAATGG TATTCCTGTT CACGACACCA TTGCCAGAGT TGTATCCTGT 
ATCAGTCCTG CAAAATTTCA CGAGTGCTTT ATTAACTGGA TGCGTGACTG CCATTCTTCA 
GATGATAAAG ACGTCATTGC AATTGATGGA AAAACGCTCC GGCATTCTTA TGATAAGAGT 
CGCCGCAGGG GAGCGATTCA TGTCATTAGT GCGTTCTCAA CAATGCACAG TCTGGTCATC 
GGACAGATCA AGACGGATGA GAAATCTAAT GAGATTACAG CTATCCCAGA ACTTCTTAAC 
ATGCTGGATA TTAAAGGAAA AATCATCACA ACTGATGCGA TGGGTTGCCA GAAAGATATT 
GCAGAGAAGA TACAAAAACA GGGAGGTGAT TATTTATTCG CGGTAAAAGG AAACCAGGGG 
CGGCTAAATA AAGCCTTTGA GGAAAAATTT CCGCTGAAAG AATTAAATAA TCCAGCGCAT 
GACAGTTACG CAATGAGTGA AAAGAGTCAC GGCAGAGAAG AAATCCGTCT TCATATTGTT 
TGCGATGTCC CTGATGAACT TATTGATTTC ACGTTTGAAT GGAAAGGGCT GAAGAAATTA 
TGCGTGGCAG TCTCCTTTCG GTCCATAATA GCAGAACAAA AGAAAGAGCT CGAAATGACG 
GTCAGATATT ATATCAGTTC TGCTGATTTA ACCGCAGAGA AGTTCGCCAC AGCAATCCGA 
AACCACTGGC ATGTGGAGAA TAAGCTGCAC TGGCGTCTGG ACGTGGTAAT GAATGAAGAC 
GACTGCAAAA TAAGAAGAGG AAATGCAGCA GAATTATTTT CAGGGATACG GCACATTGCT 
ATTAATATTT TGACGAATGA TAAGGTATTC AAGGCAGGGT TAAGACGTAA GATGCGAAAA 
GCAGCCATGG ACAGAAACTA CCTGGCGTCA GTCCTTACGG GGAGCGGGCT TTCGTAA

Protein sequence

MELKKLMGHI SIIPDYRQAW KMEHKLSDIL LLTICAVISG AEGWEDIEDF GETHPDFLKQ 
YGDFENGIPV HDTIARVVSC ISPAKFHECF INWMRDCHSS DDKDVIAIDG KTLRHSYDKS 
RRRGAIHVIS AFSTMHSLVI GQIKTDEKSN EITAIPELLN MLDIKGKIIT TDAMGCQKDI 
AEKIQKQGGD YLFAVKGNQG RLNKAFEEKF PLKELNNPAH DSYAMSEKSH GREEIRLHIV 
CDVPDELIDF TFEWKGLKKL CVAVSFRSII AEQKKELEMT VRYYISSADL TAEKFATAIR 
NHWHVENKLH WRLDVVMNED DCKIRRGNAA ELFSGIRHIA INILTNDKVF KAGLRRKMRK 
AAMDRNYLAS VLTGSGLS