Gene Sbal223_2217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2217
Symbol
ID	7086344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2631975
End bp	2632943
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	46%
IMG OID	643461115
Product	cytochrome c oxidase, cbb3-type, subunit III
Protein accession	YP_002358139
Protein GI	217973388
COG category	[C] Energy production and conversion
COG ID	[COG2010] Cytochrome c, mono- and diheme variants
TIGRFAM ID	[TIGR00782] cytochrome c oxidase, cbb3-type, subunit III

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000127298
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.441817
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAGCT TCTGGAGTGT TTGGATTACC GTACTCTCGT TAGTCGTGAT CGCGGGTTGT 
TTTCTATTAC TGCGTGTGTG TTCTAAGAAC ACCACGGGCG TAAAAGAAGG CGAATCCATG 
GGTCACAGTT TCGACGGTAT TGAAGAACTC AATAACCCAC TGCCAAAATG GTGGAGTTAT 
ATGTTCTATA TCACTATCGT GTTTGGCTTG ATCTATCTAG CCTTATTTCC TGGTTTAGGT 
AACTACAAAG GCCTTTTAGG CTGGACGAGT TCTAACCAGA GCATTGGTAC TGAACAAGGT 
ATTAAAGCCG ATTCTGCCGC AGCCATTGAG CTTGCAGCAA AAGAAGGCCG TTATGTTCAG 
TATGACCAAG AAGTAAAACA CGCTAGTGAA AAATATGGCC CAATCTTCGC GGCTTACTTG 
GCAACACCAC TAGAAGAATT AGTGAAAAAC CAAGAAGCAT TGAAAGTGGG CGGCCGTTTG 
TTCCTACAAA ACTGCGCACA GTGCCATGGC TCTGACGCAC GTGGTAGCAA AGGCTTCCCT 
AATCTCACCG ATGGTGACTG GTTATATGGT GGCGACTTAG CCACGATTAA AACCACTATC 
ATGGGTGGTC GTCATGGCAT GATGCCGCCG AAAGGTGGTT TGCCAATCGA TGACAGCGAA 
ATTGCGGGTT TAGCTGAATA CGTTGTTAAA TTGTCTGGTC GTGAGCACGA TGAAACACTC 
GCCGCTCAAG GTCAAGGCTC ATTCATGAAA GGTTGTTTCG CGTGTCATGG TATGGACGCT 
AAAGGCAACA AGTTCATGGG TGCTCCTAAT TTAACTGACG ATGTTTGGTT ATATGGCGGT 
AGCCGTGGCG TGATCGAAGA AACCATTAAA CATGGTCGCG CAGGTGTAAT GCCAGCGTGG 
AAAGACGTTC TCGGTGAAGA GAAAGTTCAC GTAATCGCAG CTTATGTTTA TAGCTTGTCA 
AACAAGTAA

Protein sequence

MSSFWSVWIT VLSLVVIAGC FLLLRVCSKN TTGVKEGESM GHSFDGIEEL NNPLPKWWSY 
MFYITIVFGL IYLALFPGLG NYKGLLGWTS SNQSIGTEQG IKADSAAAIE LAAKEGRYVQ 
YDQEVKHASE KYGPIFAAYL ATPLEELVKN QEALKVGGRL FLQNCAQCHG SDARGSKGFP 
NLTDGDWLYG GDLATIKTTI MGGRHGMMPP KGGLPIDDSE IAGLAEYVVK LSGREHDETL 
AAQGQGSFMK GCFACHGMDA KGNKFMGAPN LTDDVWLYGG SRGVIEETIK HGRAGVMPAW 
KDVLGEEKVH VIAAYVYSLS NK