Gene ECH74115_5550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5550
Symbol
ID	6968195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5188838
End bp	5189935
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	42%
IMG OID	643389191
Product	phage integrase family protein
Protein accession	YP_002273588
Protein GI	209397184
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTACT ATAACATAGA GAAACGACTA AAATCCGATG GCACACCACG CTATCGCTGT 
AATGTGATTA TCAAAGAAAA AGGTGTTATC ACTTACAGGG AAAGCAAAAC ATTCCCTAAA 
CATGCTCATG CCAAAACATG GGGCACACAG AAAGTGATGG AATTAGATCT ATATGGCATT 
CCATCATCAA ATGCAGTTGA CGGACTTACA GTCCGTGACT TACTACACAA ATATTTAAAT 
GACCCAAATG CCGGAGGTAA AGCAGGCCGT ACTAAAAGAT ATGTGCTGGA ACTGCTTATG 
GATAGTGACA TATCCGCGAT CAAACTATCT GAACTGACAG AAAATGACGT AATTGAACAT 
TGCAGGCTAA GAAACAACGC TGGTGCAGGC CCAGCAACAG TCAGCCACGA TGTTAGTTAT 
CTTGGCAGTG TTCTGGATGC GGCAAAACCT GTATACGGAA TCAATTACAC ATCAAACCCG 
GCGAAAAGCG CTCGTCCATA TCTACTTAAA CTCGGTTTGA TTGGTAAATC AAACCGTCGT 
AATCGTAGAC CAGCATCTGA TGAACTTGAC ATGCTCATTG AAGGCCTTCA ACAACGATCT 
ACTCATAAAT GCTCAAAAAT TCCGTTCGTT GATATCCTCA AATTTTCTGT GTGGTCCTGT 
ATGCGAATCG GAGAAGTATG CCGGTTACGA TGGGAAGATC TCGACCAAGA ACAAAAATCT 
ATACTAGTAA GAGATAGGAA AGATCCACGT AAAAAGGAAG GTAACCATAT GAAAGTTGCC 
TTGCTTGGGG AAGCCTGGGA TATCGTCCAG CGACAACCAA AAAAATCAGA ATTCATTTTT 
CCATATAACA GCACTTCTGT TACCGCAGGA TTTCAGAGGG TAAGAAGCAA ATTAGGTATT 
AAAGATCTGC GATATCATGA TTTGCGTAGA GAAGGGGCAA GTCGCTTATT TGAGGCTGGT 
TTTAGTATTG AGGAAGTCGC TCAAGTTACA GGGCATCGTT CATTAAACGT GCTATGGCAG 
GTATATACCG AACTGTATCC GAAATCTTTA CATAATCGTT TTGAAGAACT CCAAAAGAGC 
AGAAACAAGA CCTCTTGA

Protein sequence

MAYYNIEKRL KSDGTPRYRC NVIIKEKGVI TYRESKTFPK HAHAKTWGTQ KVMELDLYGI 
PSSNAVDGLT VRDLLHKYLN DPNAGGKAGR TKRYVLELLM DSDISAIKLS ELTENDVIEH 
CRLRNNAGAG PATVSHDVSY LGSVLDAAKP VYGINYTSNP AKSARPYLLK LGLIGKSNRR 
NRRPASDELD MLIEGLQQRS THKCSKIPFV DILKFSVWSC MRIGEVCRLR WEDLDQEQKS 
ILVRDRKDPR KKEGNHMKVA LLGEAWDIVQ RQPKKSEFIF PYNSTSVTAG FQRVRSKLGI 
KDLRYHDLRR EGASRLFEAG FSIEEVAQVT GHRSLNVLWQ VYTELYPKSL HNRFEELQKS 
RNKTS