Gene ECH74115_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3066
Symbol
ID	6969892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2838310
End bp	2839323
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	44%
IMG OID	643386898
Product	integrase
Protein accession	YP_002271366
Protein GI	209400896
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0315896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.000000103666
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAATCA AAAAACTCGA TGATGGTCGA TATGAAGTGG ACATCCGCCC TACTGGACGT 
AACGGAAAAC GCATCCGTAG GAAGTTTGAT AAGAAAAGCG AAGCTGTCGC TTTCGAAAAA 
TACACGTTGT ACAACCACCA CAATAAAGAA TGGCTATCAA AACCAACAGA CAAACGACGT 
CTGTCGGAAC TGACACAGAT CTGGTGGGAT TTAAAGGGTA AACACGAAGA GCATGGGAAA 
TCTAATCTTG GAAAAATTGA AATCTTCACA AAAATAACGA ATGACCCATG CGCATTTCAA 
ATCACGAAAT CCCTTATCAG CCAGTACTGC GCCACCCGAA GAAGTCAGGG TATTAAACCT 
TCGAGTATCA ATCGTGATTT AACATGTATT AGCGGCATGT TTACAGCCCT GATTGAAGCG 
GAGTTATTCT TTGGTGAGCA TCCTATCAGA GGGACAAAGA GGCTTAAGGA GGAAAAACCA 
GAAACAGGCT ATCTCACACA GGAAGAAATA GCCTTACTGC TTGCAGCACT TGACGGCGAC 
AATAAAAAGA TTGCGATTCT TTGCCTAAGT ACAGGAGCAC GTTGGGGAGA AGCAGCTCGT 
TTGAAAGCAG AAAATATCAT CCATAACCGC GTCACGTTTG TTAAAACGAA AACAAACAAA 
CCACGCACCG TCCCGATCTC AGAGGCTGTT GCCAAAATGA TCGCGGATAA CAAACGAGGT 
TTTTTATTCC CTGATGCTGA TTACCCTCGC TTCAGACGAA CAATGAAAGC AATAAAACCG 
GATTTGCCAA TGGGGCAAGC CACACATGCA CTAAGGCACA GCTTTGCCAC TCATTTCATG 
ATTAATGGAG GAAGTATTAT CACGCTACAA CGGATACTAG GTCACACGCG GATTGAGCAA 
ACTATGGTTT ACGCTCATTT TGCGCCAGAG TACCTTCAGG ACGCCATTTC TCTTAATCCG 
CTAAGAGGTG GTACTGAGGC CGAGAGTGTC CACACAGTGT CCACAGTAGA GTAA

Protein sequence

MAIKKLDDGR YEVDIRPTGR NGKRIRRKFD KKSEAVAFEK YTLYNHHNKE WLSKPTDKRR 
LSELTQIWWD LKGKHEEHGK SNLGKIEIFT KITNDPCAFQ ITKSLISQYC ATRRSQGIKP 
SSINRDLTCI SGMFTALIEA ELFFGEHPIR GTKRLKEEKP ETGYLTQEEI ALLLAALDGD 
NKKIAILCLS TGARWGEAAR LKAENIIHNR VTFVKTKTNK PRTVPISEAV AKMIADNKRG 
FLFPDADYPR FRRTMKAIKP DLPMGQATHA LRHSFATHFM INGGSIITLQ RILGHTRIEQ 
TMVYAHFAPE YLQDAISLNP LRGGTEAESV HTVSTVE