Gene Acid345_2995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2995
Symbol
ID	4071550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3547730
End bp	3549364
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	58%
IMG OID	637985014
Product	cytochrome-c oxidase
Protein accession	YP_592070
Protein GI	94970022
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0459294
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACAA CAGCAATCAA TCAGTCCGTG GAAAAAGAGA CCTACCTCAA TGCAGGGTAC 
GGTCTGAAGT CATGGCTCTT GACGAAGGAC CACAAGCGCA TCGCGATCCT CTACTTGATC 
TCGATCACCG TGTTCTTCGC AATTGGCGGG TTCTTCGCCA TGCTCATCCG TCTTGAGCTG 
CTGACCCCCG CGGGCGACTT GGTCGAAGCC GACACCTACA ACAAGCTCTT CTCGATGCAT 
GGCATCATCA TGGTGTTCTT CTTCCTGATC CCGTCCATCC CTGCGACGCT CGGCAATTTC 
CTCGTGCCCC TCATGGTCGG CGCCAAGGAC TTGGCCTTCC CGCGCATCAA CCTGCTGAGC 
TGGTATCTCT ACATCATTGG CGGAACCATG GCGCTCGTCG CCATGTTCAT GGGCGGCGTT 
GACACCGGCT GGACCTTCTA CACTCCGCTC AGCACCGAGT ACGTCAATAC TAACGTGATC 
CCGGTTGCCC TCGGCGTCTT CGTCGCCGGG TTCTCGTCCA TCTTCACTGG ACTGAATATC 
ATCGTGACCA TCCACCGCAT GCGCGCTCCC GGTATGACCT GGAGCCGCCT GCCACTCTTC 
ATCTGGTCGC ATTATGCCGC CAGCCTGATC ATGGTCCTCG GTACGCCGGT TGTTGCTATC 
ACCCTGGTGC TCGCCGCTCT CGAGCGCGCC TTCCACATCG GCATCTTCAA CCCGCAGCTT 
GGCGGAGACC CGGTGCTCTT CCAGCACCTC TTCTGGTTCT ATTCGCATCC CGCCGTCTAC 
ATCATGATTC TGCCTTCGAT GGCGGTGATC TCCGAGATCG TGCCCTGCTT CACGCGTAAG 
CGCATCTTCG GATATGAATT CGTTGCGCTC TCCTCGATCG GCATCGCCGT CCTCGGCTTC 
CTCGTGTGGG CGCACCACAT GTTCGTCGCC GGAATCTCGG TGTACGCTGC TCTGGTTTTC 
TCGCTTCTGA GCTACCTCGT CGCCATCCCG TCCGCCGTAA AGGTCTTCAA CTGGACGGCT 
ACGATGTTCA AAGGCTCCAT CAGCTTCGAG ACCCCGATGC TCTACGCCTT CGGGTTCATT 
GGACTGTTCA CCATCGGCGG ACTCACCGGC TTGTTCCTCG CCAACCTCGG CGTCGACATC 
CACGTCCACG ACACTTACTT CGTGATCGCG CACTTCCACT ACATCATGGT CGGCGGTGCC 
ATCATGGGTT ATCTCGGCGG ACTCCACTTC TGGTGGCCCA AGATGACCGG CCGCATGTAT 
CCCGAAGCCT GGGCAAAGCT CTCGGCGCTG CTCGTCTTCG TCGGCTTCAA CCTCACCTTC 
TTCCCGCAAT TCGTTCTCGG ATACATGGGC ATGCCGCGTC GCTATCACGC CTACGCCCCT 
GAATTCCAGG TTCTGAACGT GCTCTCCACC GCCGGCGCTT CGGTGCTCGC CGTGGGATAT 
CTGTTCCCGC TCTTCTATTT CCTGTGGTCG CTGAAGTATG GGCAGATCGC ACCCAACAAT 
CCGTACAACG CCGTTGGTTT GGAGTGGATG ACGCAATCGC CGCCACCCGC CCACAACTTC 
GATAAGACAC CTGTTGTCAC CTGGGAAGCC TACGATTACG AGAACCAGCC CCAGGAGGAG 
GTCCCCGTTG TCTAG

Protein sequence

MATTAINQSV EKETYLNAGY GLKSWLLTKD HKRIAILYLI SITVFFAIGG FFAMLIRLEL 
LTPAGDLVEA DTYNKLFSMH GIIMVFFFLI PSIPATLGNF LVPLMVGAKD LAFPRINLLS 
WYLYIIGGTM ALVAMFMGGV DTGWTFYTPL STEYVNTNVI PVALGVFVAG FSSIFTGLNI 
IVTIHRMRAP GMTWSRLPLF IWSHYAASLI MVLGTPVVAI TLVLAALERA FHIGIFNPQL 
GGDPVLFQHL FWFYSHPAVY IMILPSMAVI SEIVPCFTRK RIFGYEFVAL SSIGIAVLGF 
LVWAHHMFVA GISVYAALVF SLLSYLVAIP SAVKVFNWTA TMFKGSISFE TPMLYAFGFI 
GLFTIGGLTG LFLANLGVDI HVHDTYFVIA HFHYIMVGGA IMGYLGGLHF WWPKMTGRMY 
PEAWAKLSAL LVFVGFNLTF FPQFVLGYMG MPRRYHAYAP EFQVLNVLST AGASVLAVGY 
LFPLFYFLWS LKYGQIAPNN PYNAVGLEWM TQSPPPAHNF DKTPVVTWEA YDYENQPQEE 
VPVV