Gene EcSMS35_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0472
Symbol	cyoA
ID	6142834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	478965
End bp	479912
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	51%
IMG OID	641615366
Product	cytochrome o ubiquinol oxidase subunit II
Protein accession	YP_001742573
Protein GI	170683800
COG category	[C] Energy production and conversion
COG ID	[COG1622] Heme/copper-type cytochrome/quinol oxidases, subunit 2
TIGRFAM ID	[TIGR01433] cytochrome o ubiquinol oxidase subunit II

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000304701
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTCA GGAAATACAA TAAAAGTTTG GGATGGTTGT CATTATTTGC AGGCACTGTA 
TTGCTCAGTG GCTGTAATTC TGCGCTGTTA GATCCCAAAG GACAGATTGG TCTGGAGCAA 
CGTTCACTGA TACTGACGGC ATTTGGCCTG ATGTTGATTG TCGTTATTCC CGCAATCTTG 
ATGGCTGTTG GTTTCGCCTG GAAGTACCGT GCGAGCAATA AAGATGCTAA GTACAGCCCG 
AACTGGTCAC ACTCCAATAA AGTGGAAGCT GTGGTCTGGA CGGTACCTAT CTTAATCATC 
ATCTTCCTTG CGGTACTGAC CTGGAAAACC ACTCACGCTC TTGAGCCTAG CAAGCCGCTG 
GCACACGACG AGAAGCCCAT TACCATCGAA GTGGTTTCCA TGGACTGGAA ATGGTTCTTC 
ATCTACCCGG AACAGGGCAT TGCTACCGTG AATGAAATCG CTTTCCCGGC GAACACTCCG 
GTGTACTTCA AAGTGACCTC CAACTCCGTG ATGAACTCCT TCTTCATTCC GCGTCTGGGT 
AGCCAGATTT ATGCCATGGC CGGTATGCAG ACTCGCCTGC ATCTGATCGC CAACGAACCC 
GGTACTTATG ACGGTATCTC CGCCAGCTAC AGCGGCCCGG GCTTCTCAGG CATGAAGTTC 
AAAGCTATTG CAACACCGGA TCGCGCCGCA TTCGACCAAT GGGTCGCAAA AGCGAAACAG 
TCGCCGAACA CCATGTCTGA CATGGCAGCG TTCGAAAAAC TGGCCGCGCC TAGCGAATAC 
AACCAGGTGG AATATTTCTC CAACGTGAAA CCAGACTTGT TTGCTGATGT GATTAACAAG 
TTTATGGCTC ACGGTAAGAG CATGGACATG ACCCAGCCAG AAGGTGAGCA CAGTGCACAC 
GAAGGTATGG AAGGCATGGA CATGAGCCAC GCGGAATCCG CCCATTAA

Protein sequence

MRLRKYNKSL GWLSLFAGTV LLSGCNSALL DPKGQIGLEQ RSLILTAFGL MLIVVIPAIL 
MAVGFAWKYR ASNKDAKYSP NWSHSNKVEA VVWTVPILII IFLAVLTWKT THALEPSKPL 
AHDEKPITIE VVSMDWKWFF IYPEQGIATV NEIAFPANTP VYFKVTSNSV MNSFFIPRLG 
SQIYAMAGMQ TRLHLIANEP GTYDGISASY SGPGFSGMKF KAIATPDRAA FDQWVAKAKQ 
SPNTMSDMAA FEKLAAPSEY NQVEYFSNVK PDLFADVINK FMAHGKSMDM TQPEGEHSAH 
EGMEGMDMSH AESAH