Gene ECH74115_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0235
Symbol
ID	6970478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	248953
End bp	250365
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	57%
IMG OID	643384306
Product	ImpA domain protein
Protein accession	YP_002268822
Protein GI	209399715
COG category	[S] Function unknown
COG ID	[COG3515] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03362] type VI secretion-associated protein, VC_A0119 family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATGG ACTTACGCGA TCCGAATGTC TGGATATCGC ACCTGCTGGA AAACCTGCCG 
GAAGAAAAAC TGGCATCGGC GCTGAAAGAT GACAACCCGG ACTGGGAGTA TATCGACGGC 
GAAATCGTCA AGCTGGGGTC TCTGGCCCAC GCTCAGCTTG ATATTCCCGA ACTACAACGC 
AGGGGGCTAC AGCTTCTGGC TTCTGAAAGC AAAGACTTCA GGCTACTGGC ACACCTGCTC 
AGAACCCTGC AACATGCCGG TGATCCACTG CTGGCACTGC ACCTGCTAAC GCTATACGTG 
GAACATTACT GGACTGTGGC CGCGCCGCAG AATATGGCGC ATAAAAAACG CTTTGCCAGC 
CAGATCATTA AACGTTTTGA AACGGGTATT GAAGGCTTTT CACAAAACGC TGCCACAACG 
CAGCGCGATA CTCTGCTGGG TGAGCTGGCG AAACTGGCGC AGTGCTGGCA GTCACATAAC 
GTCCCGGAAC TGGCACAGGC TACCGATGAT CTTTTTGCCC TGTACCAGCG TACGTTTAAT 
CGTGCGGCTC CTGCTCCGGT CCCCACTCCG GCGGCCTCCG GTAGTTCACC ACAAACCACC 
GTCACGTCTG AAAGCGGCGT GACGCAACCC AGTGCTCCGG CTCCCCAAAT CGCCATCGAC 
AGTCACGACG ACAAAGCCTG GCGCGACACG CTGTTAAAAG TGGCGGCTAT TTTATGTGAA 
CGCCAGCCGG ACTCGCCGCA GGGCTATCGC CTGCGCCGCC ATGCCCTGTG GCAATCCATC 
ACCAGTACAC CCCAGGCGGA AAGCGATGGA CGTACCCCAC TGGCTGCGGT CTCTGCCGAT 
ATGGTGGCGG ATTACCAGTC CCGGCTTGCC AGCGCGGATA TGGCGCTGTG GCAACAGGTT 
GAGAAAAGCG TATTGCTGGC TCCTTACTGG CTGGACGGTC ACTGTCTTTC TGCACAGACG 
GCACTGCGTC TGGGTTACAA ACAGGTGGCA GACACCATCC GCGATGAGGT CATCCGCTTC 
CTTGAGCGTC TGCCCCAGCT TACCGGGCTG CTGTTTAATG ACCGCACACC GTTTCTCAGT 
GAGCAGACGA AACAATGGCT GGCTGCTTCG CCCGACGGCA AAGTTGCACC GGTTGCGCAA 
ATCGGTGAGG AATCGCAGGC AGCCAGAGCC TGTTTTGCTG GGCAGGGTCT GGAGGCGGCG 
CTGCGATATC TGGACATGCT ACCCGAAGGC GATCCCCGCG ATCAGTTTCA CCGCCAGTAC 
CTTGCCGCAC AGTTGACGGA GGAGGCGGGG CTGATACAGC TTGCGCAGCA ACAGTACCGG 
ATGTTGTTGA TGATAGGGAG TCAGATGATG GTGTCTGACT GGGAGCCATC ATTACTTACG 
CAGCTTGAAC AAAAATTCAC GGCAGAACAA TAA

Protein sequence

MAMDLRDPNV WISHLLENLP EEKLASALKD DNPDWEYIDG EIVKLGSLAH AQLDIPELQR 
RGLQLLASES KDFRLLAHLL RTLQHAGDPL LALHLLTLYV EHYWTVAAPQ NMAHKKRFAS 
QIIKRFETGI EGFSQNAATT QRDTLLGELA KLAQCWQSHN VPELAQATDD LFALYQRTFN 
RAAPAPVPTP AASGSSPQTT VTSESGVTQP SAPAPQIAID SHDDKAWRDT LLKVAAILCE 
RQPDSPQGYR LRRHALWQSI TSTPQAESDG RTPLAAVSAD MVADYQSRLA SADMALWQQV 
EKSVLLAPYW LDGHCLSAQT ALRLGYKQVA DTIRDEVIRF LERLPQLTGL LFNDRTPFLS 
EQTKQWLAAS PDGKVAPVAQ IGEESQAARA CFAGQGLEAA LRYLDMLPEG DPRDQFHRQY 
LAAQLTEEAG LIQLAQQQYR MLLMIGSQMM VSDWEPSLLT QLEQKFTAEQ