Gene ECH74115_2013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2013
Symbol
ID	6967915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1909561
End bp	1911318
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	51%
IMG OID	643385930
Product	hypothetical protein
Protein accession	YP_002270419
Protein GI	209397036
COG category	[I] Lipid transport and metabolism
COG ID	[COG2267] Lysophospholipase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.329786
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAATT CACGCATCCC TGGGGAACAT TTTTTTACCA CCAGTGATAA TACAGCGTTG 
TTTTATCGGC ACTGGCCCGC TTTACAGCCA GGGGCGAAAA AGGTCATCGT CTTATTTCAT 
CGCGGTCATG AACATTCTGG TCGTCTACAA CATATCGTTG ATGAACTGGC GATGCCAGAT 
ACTGCTTTTT ATGCATGGGA TGCCCGAGGG CATGGACAAA CTTCGGGGCC CCGTGGTTAT 
AGCCCATCTC TTGCGCGTTC AGTGCGGGAT GTCGATGAGT TTGTCCGTTT TGCTGCCAGC 
GACAGCCAGG TCGGGCTGGA AGAGGTGGTA GTGATCGCGC AGAGCGTCGG CGCAGTGCTG 
GTTGCCACAT GGGTTCATGA TTATGCGCCT GCAATTCGCG GGCTGGTGCT GGCTTCTCCG 
GCCTTTAAGG TTAAATTGTA TGTGCCGCTG GCACGTCCTG CGCTGGCGTT ATGGCATCGT 
CTGCGTGGTC TGTTTTTTAT TAATTCCTAT GTGAAAGGAC GCTATTTGAC CCACGATCGG 
CAACGGGTGG CGAGTTTCAA TAATGATCCG CTGATCACAC GGGCGATTGC CGTTAATATC 
TTGCTCGATC TTTATAAAAC GTCTGAACGT ATTGTTAGCG ATGCGGCGGC GATTACGCTC 
CCCACGCAAC TTCTGATATC AGGCGATGAC TATGTGGTGC ATCGCCAACC GCAGATTGAT 
TTTTATCATA GATTACGTAG CCCTCTGAAA GAGCTGCATC TGCTGCCAGG CTTTTATCAC 
GACACGTTGG GTGAAGAGAA CAGGGCGCAG GCATTTGAAA AAATGCAAAG CTTTATTAGT 
CGTTTATATG CTAACAAGTC ACAAAAATTT GATTATCAGC ATGAAGACCG CACTGGACCA 
TCAGCGGATC GCTGGCGGCT CCTTTCAGGT GGACCCGTGC CATTATCGCC GGTTGATTTG 
GCGTATCGCT TTATGCGTAA AGCGATGAAA TTGTTCGGGA CGCACTCTGC GGGCCTGCAT 
CTCGGAATGA GCACCGGCTT TGATTCAGGC AGTTCGCTGG ATTATGTCTA TCAAAATCAA 
CCGCAAGGTA GTAACGCATT CGGGCGCTTA ATCGACAAAA TCTACCTGAA CAGTGTTGGC 
TGGCGCGGTA TTCGCCAGCG CAAAACCCAT TTACAAATAC TGATTAAACA AGCCGTTGCC 
GATCTCCACG CCAAAGGTTT AGCCGTCCGC GTGGTTGACA TTGCCGCAGG GCATGGGCGC 
TATGTACTGG ATGCGCTGGC AAACGAGCCT GCCGTAAGCG ATATTTTGTT ACGTGATTAC 
AGCGAGTTAA ATGTTGCACA GGGGCAAGAG ATGATTGCTC AACGGGGAAT GTCTGGGCGG 
GTGCGTTTTG AACAGGGCGA TGCGTTTAAC CCGGAGGAAC TCAGCGCGTT AACTCCGCGG 
CCTACGCTGG CGATTGTCTC TGGACTGTAT GAGCTTTTTC CCGGAAATGA GCAGGTAAAA 
AACTCACTCG CAGGTCTTGC CAATGCCATC GAACCGGGCG GCATTCTCCT CTACACCGGG 
CAGCCGTGGC ACCCACAACT GGAGCTGATT GCCGGGGTGT TAACCAGTCA TAAAGATGGT 
AAACCGTGGG TAATGCGCGT GCGTTCGCAA GGGGAGATGG ATTCACTCGT GCGTGATGCC 
GGATTTGATA AATGCACACA ACGGATTGAT GAGTGGGGCA TTTTTACGGT TTCGATGGCG 
GTGCGTCGTG ATAACTGA

Protein sequence

MENSRIPGEH FFTTSDNTAL FYRHWPALQP GAKKVIVLFH RGHEHSGRLQ HIVDELAMPD 
TAFYAWDARG HGQTSGPRGY SPSLARSVRD VDEFVRFAAS DSQVGLEEVV VIAQSVGAVL 
VATWVHDYAP AIRGLVLASP AFKVKLYVPL ARPALALWHR LRGLFFINSY VKGRYLTHDR 
QRVASFNNDP LITRAIAVNI LLDLYKTSER IVSDAAAITL PTQLLISGDD YVVHRQPQID 
FYHRLRSPLK ELHLLPGFYH DTLGEENRAQ AFEKMQSFIS RLYANKSQKF DYQHEDRTGP 
SADRWRLLSG GPVPLSPVDL AYRFMRKAMK LFGTHSAGLH LGMSTGFDSG SSLDYVYQNQ 
PQGSNAFGRL IDKIYLNSVG WRGIRQRKTH LQILIKQAVA DLHAKGLAVR VVDIAAGHGR 
YVLDALANEP AVSDILLRDY SELNVAQGQE MIAQRGMSGR VRFEQGDAFN PEELSALTPR 
PTLAIVSGLY ELFPGNEQVK NSLAGLANAI EPGGILLYTG QPWHPQLELI AGVLTSHKDG 
KPWVMRVRSQ GEMDSLVRDA GFDKCTQRID EWGIFTVSMA VRRDN