Gene ECH74115_3118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3118
Symbol
ID	6966927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2892536
End bp	2893849
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	60%
IMG OID	643386944
Product	tail fiber protein
Protein accession	YP_002271412
Protein GI	209395988
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3064] Membrane protein involved in colicin uptake
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.145222
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGTAA AGATTTCAGG TGTACTGAAA GACGGCACAG GAAAACCGGT AGAGAACTGC 
ACCATTCAAC TGAAAGCCAG ACGTAACAGC GCCACGGTGG TGGTGAACAC GGTGGCCTCT 
GAAAATCCGG ATGAAGCCGG TCGTTACAGC ATGGACGTTG AGTACGGTCA GTACAGCGTC 
ATTCTGTTGG TGGAGGGCTT CCCGCCGTCA CATGCCGGGA CCATCACCGT GTATGAAGAT 
TCTCAACCGG GGACGCTGAA TGATTTTCTC GGTGCCATGT CGGAGGATGA CGTCCGGCCG 
GAGGCACTGC GTCGTTTTGA ACTGATGGTG GAAGAAGCGG CGCGTCACGC TGAGGAGGCG 
AAGAAGAATG CCGGAGAGGC GGAGACATCA GCGAGGAATG CCGGCATATC ATCCAGTAAG 
GCGGAAGCGA GCGCGGCAAA TGCTGACACT TCAGCAGGGG ATGCATTGGA GTCAGCCCGG 
CAGGCGGCAG AAAGTGCAGC CGCTGCAAAG CAGTCAGAGG ATGCGTCCTC GTCCTCGGCT 
TCTGCGGCCG CTCAAAAAGC CAGTGAGTCA TCACAAAGTG CAGCAGAAGC TGAATTGTCA 
AGAAAGACGG CAGAAAGTGC AGCCGGTAAT GCAGCCAGGG ATGCAACGAC CGCAACAGAA 
AAAGCCCGGG AGTCAGCAGA AAGCGCACAG TCAGCGGAAC AAAGCAGGAT AGCGGCGGAA 
GAGGCCGTAA ACCGAATCCC CACCGTGGTG GGACCTCCCG GGCCAAAGGG GGAACAGGGG 
CCCGCGGGTC CTCAGGGGCC GAAGGGTGAT AAGGGAGAGC GCGGTGACAC CGGCCCTGTC 
GGGGCAACCG GCGAACGGGG ACCGGCAGGT GATGCTGGTC CGGCAGGCCC GCAGGGGCCG 
AAAGGTGACA GGGGAGAGCG GGGAGAGACC GGTCTGACGG GAAATGCAGG TCCACAGGGT 
CCAAAGGGAG ATACCGGTGC GGCAGGCCCG GCAGGCCCAC AGGGACCGAA AGGAGAAACA 
GGTGCGGCTG GCCCGGTGGG GGCAACCGGA CCTCAGGGAC CGAAGGGCGA CCCGGGGGAG 
GCACAAATCC GTTTTCGTCT GGGGCCGGCG AGCATTATTG AGACAAACAG CAATGGCTGG 
TTCCCGGATA CAGATGGCGC ACTCATCACC GGACTGACCT TTCTTGACCC CAAAGATGCC 
ACACAGGTTC AGGGGCTGTT TCGGCATTTG CAGGTCAGGT TTGGTGACGG GCCGTGGCAG 
GATGTTAAGG GGCTGGATGA AGTGGGCAGT GATACAGGCA GAACAGGAGA ATGA

Protein sequence

MAVKISGVLK DGTGKPVENC TIQLKARRNS ATVVVNTVAS ENPDEAGRYS MDVEYGQYSV 
ILLVEGFPPS HAGTITVYED SQPGTLNDFL GAMSEDDVRP EALRRFELMV EEAARHAEEA 
KKNAGEAETS ARNAGISSSK AEASAANADT SAGDALESAR QAAESAAAAK QSEDASSSSA 
SAAAQKASES SQSAAEAELS RKTAESAAGN AARDATTATE KARESAESAQ SAEQSRIAAE 
EAVNRIPTVV GPPGPKGEQG PAGPQGPKGD KGERGDTGPV GATGERGPAG DAGPAGPQGP 
KGDRGERGET GLTGNAGPQG PKGDTGAAGP AGPQGPKGET GAAGPVGATG PQGPKGDPGE 
AQIRFRLGPA SIIETNSNGW FPDTDGALIT GLTFLDPKDA TQVQGLFRHL QVRFGDGPWQ 
DVKGLDEVGS DTGRTGE