Gene ECH74115_1398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1398
Symbol
ID	6969206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1393991
End bp	1395049
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	55%
IMG OID	643385372
Product	phospholipase, patatin family
Protein accession	YP_002269867
Protein GI	209398448
COG category	[R] General function prediction only
COG ID	[COG1752] Predicted esterase of the alpha-beta hydrolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.326586
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGG GGCTGGTGCT GTCCGGTGGC GGGGCGGTGG GCGCTTATCA GGCGGGAGTG 
GTTAAGGCAC TGGCAGAGTG TGGTACACAG ATCAGCATGG TTTCAGGGAC CAGCATTGGC 
GCATTCAATG GTGCCATTAT CGCGGCCTCT CCCGATCTGT CAGAAGCTGC CGTACGCCTG 
GAGGCGCTCT GGGAGCATCT GGGGAATAAT CAGGTGCTGT CGGTAAACAG ATTGGTTTAC 
TTTTCATTGC TGAAAAAATT GTTCCAGGCA ATGAACCTCT GCCAGATCCC CGGACGTGCA 
GGAGCACTGC TTACGACGCT TCTTCGCCAT ATATCGACAA TCAACGGGTT TGACAATCTG 
ATGGCTCAGC CGTTGTTGTC AGATGAGCCC CTGACAGCGC TGATGGATCA TTATCTTGAT 
ACTGATGCTC TGGCAGACGG GCTACCGCTG TATGTGTCGC TGTACCCCAC AGAAGGGGGC 
ATGCAGGATA TTATTGACTG CATTCGTGCT GAACTGGGTG TCGGAACCAC GAAAAACGCC 
GTTTTTCAGC ATATCCAGAG CCTGCCCCGC GGACAGCAGA AAGAGGCTCT GCTTGCGTCA 
GCCGCGCTGC CCCTGCTGTT CCGTCCCCGT GAGGTTCAGG GGACAATGTT CGGTGATGGT 
GGTATGGGAG GATGGCGAAA TATGCAGGGA AATACCCCTG TGACGCCTCT GGTCGATGCC 
GGATGCAATA TGGTGATTGT GACGCATCTG AGTGACGGTT CTTTATGGGA TCGCCAGGCT 
TTTCCGGACA CCACAATCCT TGAGATCCGT CCCCGGAAAA GGCTGAAATA TGCAGGTGAT 
GGTGGCAACA GCGGCGGTCT GCTCAGTTTT ACATCGGCAC ATACCGACGC CTGGCGTCAG 
CAGGGCTATG AAGACACGAT GCTGGCGATG GAGCATATCC GGAAACCGCT GGCAGCACGT 
CAGGCACTGA CCCGGTCAGA GGCGGTATTG CAGAAAAGCC TGGATATAAC GGAAGAGGCA 
GATTTGGCAC TGAGAAACGC GATGGCCCGG ATTAAATAA

Protein sequence

MKTGLVLSGG GAVGAYQAGV VKALAECGTQ ISMVSGTSIG AFNGAIIAAS PDLSEAAVRL 
EALWEHLGNN QVLSVNRLVY FSLLKKLFQA MNLCQIPGRA GALLTTLLRH ISTINGFDNL 
MAQPLLSDEP LTALMDHYLD TDALADGLPL YVSLYPTEGG MQDIIDCIRA ELGVGTTKNA 
VFQHIQSLPR GQQKEALLAS AALPLLFRPR EVQGTMFGDG GMGGWRNMQG NTPVTPLVDA 
GCNMVIVTHL SDGSLWDRQA FPDTTILEIR PRKRLKYAGD GGNSGGLLSF TSAHTDAWRQ 
QGYEDTMLAM EHIRKPLAAR QALTRSEAVL QKSLDITEEA DLALRNAMAR IK