Gene ECH74115_2199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2199
Symbol
ID	6968130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2100044
End bp	2101093
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	54%
IMG OID	643386090
Product	hypothetical protein
Protein accession	YP_002270577
Protein GI	209397705
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000639622
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.000000000128788
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGGGTAT TACTTCGACC TGTTCTAGTT CCGGAACTCG GGCTGGTGGT CCTTAAGCCC 
GGTCGTGAAT CATTGCCAGT TTTTCATCGC GGCAGGGTGC TGGTGGAGCC GGAACCGAAA 
AACATGCGGG CGCTGCCATC TGGAGCGGTT CCTGCTGTTC GCCAGCCGCT GGCGGAAGAT 
AAATCACTGC TGCCATTTTT CAGCGATGAG CGGGTGATTC GTGCAGCTGG CGGCGCTGGT 
GCACTGTCTG ACTGGTTATT ACGTCACGTG AAATCCTGCC AGTGGCCACA CGGCGATTAT 
CATCACAGCG AAACCGTTAT TCACAGTTAC GGTGCTGGCG CAATGGTGTT GTGCTGGCAC 
TGCGACAACC AGCTGCGCGA CCAGACCTCC GAATCACTTG AGCAACTTAC TCAACAAAAT 
CTGACAGCCT GGATGATTGA CGTCATACGC CATGTAATGA ATGGCACGCA GGAGCGGGAA 
TTATCGCTGG CTGAATTATC CTGGTGGGCA GTCTGCAATC AGGTGGTGGA CGCATTACCT 
GAGGCAGTAT CGCGTCGCTC TCTGGGATTA CCGGCGGAAA AAATCCGCTC CGTATACCGT 
GAAAGCGACA TCATACCGGG AGAACAGACC GCCACCAGCA TACTGAAGCA GCGCACAAAA 
AATATTGCGC TACCGCCTCA CACCCACCAG CAACAGAACC CACCACAGGA AAAGACGGTG 
GTCAGCATTG CCGTTGATCC GGAGTCTCCG GAATCCTTCA TGAAACGACC TAAACGTCGC 
CGCTGGGTAA ATGAGAAATA CACACGCTGG GTAAAGACAC AGCCGTGTGC GTGTTGTGGT 
AAGCCAGCGG ACGATCCTCA TCATCTGATT GGTCATGGTC AGGGCGGAAT GGGAACAAAA 
TCCCACGATA TTTTCACGCT ACCGCTGTGT CGGGAGCATC ACAACGAGCT TCATGCGGAT 
CCGCTGGCGT TCGAAGAAAA GCATGGTTCC CAGGTTGATT TAATTTTTCG TTTTCTTGAT 
CACGCCTTTG CAACCGGCGT GCTCGGGTAA

Protein sequence

MRVLLRPVLV PELGLVVLKP GRESLPVFHR GRVLVEPEPK NMRALPSGAV PAVRQPLAED 
KSLLPFFSDE RVIRAAGGAG ALSDWLLRHV KSCQWPHGDY HHSETVIHSY GAGAMVLCWH 
CDNQLRDQTS ESLEQLTQQN LTAWMIDVIR HVMNGTQERE LSLAELSWWA VCNQVVDALP 
EAVSRRSLGL PAEKIRSVYR ESDIIPGEQT ATSILKQRTK NIALPPHTHQ QQNPPQEKTV 
VSIAVDPESP ESFMKRPKRR RWVNEKYTRW VKTQPCACCG KPADDPHHLI GHGQGGMGTK 
SHDIFTLPLC REHHNELHAD PLAFEEKHGS QVDLIFRFLD HAFATGVLG