Gene EcSMS35_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2139
Symbol	appC
ID	6142814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2148297
End bp	2149841
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	54%
IMG OID	641617015
Product	cytochrome bd-II oxidase, subunit I
Protein accession	YP_001744190
Protein GI	170680621
COG category	[C] Energy production and conversion
COG ID	[COG1271] Cytochrome bd-type quinol oxidase, subunit 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.996707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGGATG TCATTGATTT ATCGCGCTGG CAGTTTGCAC TGACCGCGCT GTATCACTTT 
TTATTTGTAC CCCTTACCCT GGGGCTGATT TTTTTGCTGG CTATCATGGA AACCATTTAC 
GTGGTCACCG GCAAAACAAT CTACCGCGAT ATGACGCGCT TCTGGGGTAA GCTCTTCGGT 
ATCAACTTTG CTCTTGGCGT GGCTACCGGC CTGACCATGG AGTTTCAGTT TGGTACTAAC 
TGGTCATTCT ATTCCAACTA TGTGGGCGAT ATTTTTGGCG CACCGCTGGC AATGGAAGCA 
TTAATGGCCT TCTTCCTCGA ATCCACCTTT GTCGGGCTGT TCTTCTTCGG CTGGCAGCGG 
CTGAATAAAT ACCAGCACCT GCTGGTGACG TGGCTGGTGG CGTTCGGTTC AAATCTCTCT 
GCATTGTGGA TATTGAATGC CAACGGTTGG ATGCAATACC CGACCGGTGC GCATTTTGAT 
ATCGACACCC TGCGTATGGA GATGACCAGT TTCAGCGAGT TGGTCTTTAA CCCGGTCAGC 
CAGGTGAAAT TTGTGCACAC CGTAATGGCG GGATACGTGA CCGGGGCCAT GTTTATTATG 
GCGATCAGCG CCTGGTATTT ACTGCGCGGA CGGGAGCGCG ATGTCGCATT ACGCTCGTTT 
GCCATCGGTT CCGTCTTCGG TACTCTGGCG ATTATCGGTA CGCTGCAACT CGGAGACAGT 
TCTGCGTATG AAGTCGCGCA AGTACAACCG GTAAAACTGG CGGCGATGGA AGGGGAGTGG 
CAAACAGAAC CTGCACCTGC ACCGTTCCAT GTGGTTGCCT GGCCGGAACA GGATCAAGAG 
CGTAACGCCT TTGCCATCAA AATTCCCGCG CTGCTAGGGA TCCTCGCCAC TCACTCATTA 
GATAAACCCG TGCCGGGTCT GAAGAATTTG ATGGCTGAAA CCTACCCACG CTTGCAACGC 
GGACGTATGG CCTGGCTGTT AATGCAGGAA ATATCGCAAG GCAATCGTGA GCCGCATGTG 
TTGCAGGCAT TCCGGGAGCT GGAAGGCGAC CTGGGTTACG GCATGTTGCT CTCCCGCTAT 
GCGCCGGATA TGAATCATGT CACAGCCACA CAGTACCAGG CGGCGATGCG TGGCGCGATA 
CCTCAGGTTG CGCCGGTATT CTGGAGTTTC CGCATCATGG TAGGCTGTGG TTCCCTGCTG 
TTACTGGTGA TGCTGATTGC GCTTGTCCAG ACGCTGCGTG GCAAAATCGA CCAGCATCGC 
TGGGTGCTGA AAATGGCGCT CTGGAGTTTG CCGCTTCCGT GGATTGCGAT TGAAGCCGGA 
TGGTTTATGA CCGAGTTTGG TCGTCAGCCG TGGGCGATAC AGGACATCTT ACCGACATAC 
TCCGCGCACT CCGCCTTAAC CACAGGACAA CTGGCTTTCT CACTGATCAT GATCGTAGGG 
CTTTACACCC TGTTCTTAAT CGCCGAAGTC TACCTGATGC AGAAATATGC CCGTCTGGGG 
CCGAGCGCGA TGCAGAGTGA ACAACCGACG CAGCAACAGG GGTAA

Protein sequence

MWDVIDLSRW QFALTALYHF LFVPLTLGLI FLLAIMETIY VVTGKTIYRD MTRFWGKLFG 
INFALGVATG LTMEFQFGTN WSFYSNYVGD IFGAPLAMEA LMAFFLESTF VGLFFFGWQR 
LNKYQHLLVT WLVAFGSNLS ALWILNANGW MQYPTGAHFD IDTLRMEMTS FSELVFNPVS 
QVKFVHTVMA GYVTGAMFIM AISAWYLLRG RERDVALRSF AIGSVFGTLA IIGTLQLGDS 
SAYEVAQVQP VKLAAMEGEW QTEPAPAPFH VVAWPEQDQE RNAFAIKIPA LLGILATHSL 
DKPVPGLKNL MAETYPRLQR GRMAWLLMQE ISQGNREPHV LQAFRELEGD LGYGMLLSRY 
APDMNHVTAT QYQAAMRGAI PQVAPVFWSF RIMVGCGSLL LLVMLIALVQ TLRGKIDQHR 
WVLKMALWSL PLPWIAIEAG WFMTEFGRQP WAIQDILPTY SAHSALTTGQ LAFSLIMIVG 
LYTLFLIAEV YLMQKYARLG PSAMQSEQPT QQQG