Gene WD0301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD0301
Symbol	coxA
ID	2738695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	+
Start bp	280476
End bp	282026
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	38%
IMG OID	637172514
Product	cytochrome c oxidase, subunit I
Protein accession	NP_966102
Protein GI	42520187
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.249737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGACG TACCAAAGGG CATAAAGCGT TGGTTGTTTT CCACCAATCA TAAAGATATA 
GGGACACTGT ACATTATTTT TTCCATATTA GCTGGAATTA TTGGTGGATT ATTATCGGTG 
ATTATTCGCA CTCAGCTAAT GCACATTAAT ATACTTAACA ATAACTATCA ATTATATAAC 
GTAATGGTTA CAGGGCATGC GTTGATAATG GTGTTTTTTA TGATAATGCC AGCCCTCATG 
GGAGGATTTG GTAACTGGTT TGTACCTCTC ATGATTGGCG CACCAGATAT GGCATTTCCT 
CGTATGAATA ATTTAAGTTT TTGGTTATTA GTGTCATCTT TTATTTTGCT CATTCTCTCA 
GTGTTTATTG GTGAAGGTCC AGGTACAGGT TGGACTTTAT ATCCACCTCT ATCACAGGTA 
ATGTCCCATC CAAGTGCAGG AGTTGACATT GCTATACTTG CACTTCATGT TGCTGGTATG 
TCGTCAATTG TTGGGGCGAT CAACTTTATA GTTACTATAT TTAACATGCG CACAAAAGGA 
ATGTCATTAA CTAAGATGCC ACTGTTTGTT TGGTCTGTCT TGCTAACAGC ATTTATGTTG 
ATTGTTGCCT TACCAGTGCT TGCCGGTGCT ATAACTATGC TTCTTACTGA TCGCAATATT 
GGTACTTCCT TTTTTGATCC TGCCGGTGGC GGCGATCCTG TGTTATTTCA ACATCTATTT 
TGGTTTTTTG GTCATCCAGA AGTTTACGTA ATTATTTTTC CTGCATTTGG CATCATAAGT 
CAGGTTGTAT CAACTTTTTC TCACAGACCT GTATTTGGTT ACATAGGGAT GGTTTATGCA 
ATGATAGGTA TAGCAGTATT TGGCTTTATG GTTTGGGCTC ACCATATGTT CACTGTTGGG 
CTTAGTGCTG ACGCTGCTGC ATTTTTTAGC ACTACCACAA TTTTTATCGG TGTTATAACT 
GGTGTAAAAG TCTTTAGCTG GATTGCAACT ATGTGGGGTG GAGCAATTGA GTTTAAGACC 
CCTATGCTAT TTGCACTAGG TTTTATTTTC ATGTTTGTTG GCGGTGGCAT AACGGGAATA 
ATTCTTTCTC ATGGTGGAAT AGATAAGCTC CTGCACGACA CCTATTATGT TGTTGCTCAC 
TTCCATTATG TCATGTCACT TGCTGCATTA TTTGGAGCTT TTGCTGGCTT TTATTATTGG 
ATTGGTAAAA TGTCGGGTAA ACAATATAAT GAGCGCTTAG GTCAAATCCA CTTTTGGCTT 
ACTTTTATTA GCACCAATAT CACTTTTTTA CCTCAACATT TCTTAGGATT AGCTGGTATG 
CCAAGGCGTA TACCTGATTA TCCTGATGCG TTTATCCCTT GGAATTATAT ATCCTCAATT 
GGTTCGTATA TGTCCTTTGT TTCAGTTATG TTTTTTGTGT TTATAGTTAT ACATCTTTTT 
AAATGGGGCA AGAAAGCTGG AGATAATCCT TGGGAAGGTG ACACCTTGGA ATGGACGGTA 
TCTTCACCAC CGCCTTTTCA TACTTTCGAA AAGCCACCAG TGGTAAAATA G

Protein sequence

MSDVPKGIKR WLFSTNHKDI GTLYIIFSIL AGIIGGLLSV IIRTQLMHIN ILNNNYQLYN 
VMVTGHALIM VFFMIMPALM GGFGNWFVPL MIGAPDMAFP RMNNLSFWLL VSSFILLILS 
VFIGEGPGTG WTLYPPLSQV MSHPSAGVDI AILALHVAGM SSIVGAINFI VTIFNMRTKG 
MSLTKMPLFV WSVLLTAFML IVALPVLAGA ITMLLTDRNI GTSFFDPAGG GDPVLFQHLF 
WFFGHPEVYV IIFPAFGIIS QVVSTFSHRP VFGYIGMVYA MIGIAVFGFM VWAHHMFTVG 
LSADAAAFFS TTTIFIGVIT GVKVFSWIAT MWGGAIEFKT PMLFALGFIF MFVGGGITGI 
ILSHGGIDKL LHDTYYVVAH FHYVMSLAAL FGAFAGFYYW IGKMSGKQYN ERLGQIHFWL 
TFISTNITFL PQHFLGLAGM PRRIPDYPDA FIPWNYISSI GSYMSFVSVM FFVFIVIHLF 
KWGKKAGDNP WEGDTLEWTV SSPPPFHTFE KPPVVK