Gene ECH74115_3331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3331
Symbol
ID	6969192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3066273
End bp	3067325
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	54%
IMG OID	643387143
Product	cytochrome c-type biogenesis family protein
Protein accession	YP_002271606
Protein GI	209396277
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3088] Uncharacterized protein involved in biosynthesis of c-type cytochromes [COG4235] Cytochrome c biogenesis factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGTTTT TATTGGGCGT GCTGATGCTG ATGATCTCCG GCTCAGCGCT GGCGACCATC 
GACGTGTTGC AGTTTAAAGA TGAAGCACAG GAACAACAGT TCCGTCAGCT CACTGAAGAA 
CTGCGCTGCC CGAAATGCCA GAATAACAGC ATTGCCGATT CCAACTCGAT GATTGCCACC 
GACCTGCGCC AGAAAGTGTA TGAACTGATG CAGGAAGGCA AAAGTAAGAA AGAGATTGTC 
GATTATATGG TGGCGCGTTA CGGCAACTTC GTCACTTACG ATCCGCCGTT AACGCCGCTG 
ACCGTGCTGC TGTGGGTGCT TCCGGTAGTG GCTATTGGTA TTGGCGGTTG GGTCATATAC 
GCCCGTTCGC GGCGTCGGGT ACGCGTGGTA CCGGAAGCGT TTCCTGAACA AAGCGTGCCG 
GAAGGTAAGC GTGCCGGATA TGTTGTTTAT CTGCCGGGTA TTGTGGTGGC GTTAATTGTG 
GCTGGCGTCA GCTACTACCA GACTGGCAAT TATCAGCAGG TGAAAATCTG GCAGCAGGCC 
ACGGCACAGG CTCCGGCGTT GCTGGACAGG GCGCTGGATC CGAAAGCCGA TCCGCTCAAC 
GAAGAAGAGA TGTCGCGCCT TGCGCTGGGG ATGCGTACTC AACTGCAAAA AAATCCGGGA 
GATATAGAAG GTTGGATTAT GTTGGGTCGC GTTGGCATGG CGCTGGGTAA CGCCAGTATC 
GCCACCGATG CATACGCTAC TGCGTATCGC CTCGATCCGA AAAACAGCGA TGCCACACTG 
GGTTATGCTG AAGCGTTGAC ACGTTCATCT GATCCCAACG ACAACCGCCT CGGCGGCGAA 
CTGCTGCGCC AGTTGGTGAG AACGGACCAT AGCAATATTC GTGTGTTAAG CATGTATGCG 
TTTAATGCCT TTGAGCAGCA GCGATTTGGC GAAGCCGTTG CCGCGTGGGA GATGATGTTG 
AAACTCTTAC CTGCCAACGA TACTCGCCGT GCGGTGATTG AACGTAGTAT CGCGCAGGCG 
ATGCAACATT TGTCGCCGCA GGAGAGTAAA TAA

Protein sequence

MRFLLGVLML MISGSALATI DVLQFKDEAQ EQQFRQLTEE LRCPKCQNNS IADSNSMIAT 
DLRQKVYELM QEGKSKKEIV DYMVARYGNF VTYDPPLTPL TVLLWVLPVV AIGIGGWVIY 
ARSRRRVRVV PEAFPEQSVP EGKRAGYVVY LPGIVVALIV AGVSYYQTGN YQQVKIWQQA 
TAQAPALLDR ALDPKADPLN EEEMSRLALG MRTQLQKNPG DIEGWIMLGR VGMALGNASI 
ATDAYATAYR LDPKNSDATL GYAEALTRSS DPNDNRLGGE LLRQLVRTDH SNIRVLSMYA 
FNAFEQQRFG EAVAAWEMML KLLPANDTRR AVIERSIAQA MQHLSPQESK