Gene Dshi_3892 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3892
Symbol
ID	5714421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009956
Strand	-
Start bp	116359
End bp	117396
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	641276805
Product	cytochrome c oxidase subunit II
Protein accession	YP_001542101
Protein GI	159046430
COG category	[C] Energy production and conversion
COG ID	[COG1622] Heme/copper-type cytochrome/quinol oxidases, subunit 2
TIGRFAM ID	[TIGR02866] cytochrome c oxidase, subunit II

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.740774
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.178097
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAG ATCTCGACAT TCTTGGCGGG CGCAGTGTGC GGGACATCGT GGGCGAGGCC 
CCGGATCTCG ACACGTCAGC CGAAGATGCT GCGCTCGAAA GCTTGGGGGA TCGCAGCGCC 
CTCGACATCT GGAATTCGCA ATCCGCGCTG GAACCAAGCG GGCTGGGTGC CGCCGCCGCC 
TATGACCTGA CAATCGGCAT GGTCGTGGGC CTCGGGGCGG TGTTCGTGGT CGTGATGGCG 
ATCGCCTGGT TCGCATGGCA CAGCAAACGC CCAGCAGGCC ATTGGTGGGT GTGGACCGGC 
GGCGTGATCA CGCCGCTCAT AGCAATCTCG ACCGTGATGG TGGCGTCGAC CGCTGCCCTT 
GTGGCGACGA CGCGGCCCGC ACCCGACGCA CTGGTGATCG AGGTGACCGG CTATCAGTTC 
TGGTGGGATG TGGTCTACGA TCCGGACGGG ACACCGTTGC GGGACGCCAA TGAATTGATC 
CTGCCCGAGG GTCGCCCGGT CACCCTGCGT CTGAACTCCA ACGATGTGAT CCATTCCTTC 
TGGGTGCCCT CGATTTCGGG CAAGATGGAC ATGATCCCCG GACGCACCAA CACTCTGACG 
ATAACCGCGA CCGAAACCGG CCAGTTCCGC GGCCAATGCG CCGAGTTCTG CGGGTTGTCC 
CACCCGAAAA TGGCATTCGA GGTAACGGTC CTGCCCCCCG AGGCCTTCGA CAAGTGGCTT 
GCCACCACGC GCGGCGCGGC GCGCGACGTG GCCCGACCCG CGCAAGCCGA GGGACGCGAG 
GTTTTCCTGA GCGCCGGCTG TGCCGCCTGT CACGAAATCC GCGGGGTCGC AGAAGGTGGG 
CGGCTGGGCC CCGACCTGAC CCGTCTGGGC GCGCGCGCCA GCCTCGGCGC GGGCATGTGG 
CGCATGAACC AGGGCAACGT CGCAGGCTGG ATCGCCGATG TGCAGGACAT GAAGCCCGGC 
GCGCAAATGC CCTCCTACAA CCACCTCAGC GGTCCGGATC TGCGCAACCT GTCCGCTTAC 
CTCGTGAGCC TGCAATGA

Protein sequence

MDEDLDILGG RSVRDIVGEA PDLDTSAEDA ALESLGDRSA LDIWNSQSAL EPSGLGAAAA 
YDLTIGMVVG LGAVFVVVMA IAWFAWHSKR PAGHWWVWTG GVITPLIAIS TVMVASTAAL 
VATTRPAPDA LVIEVTGYQF WWDVVYDPDG TPLRDANELI LPEGRPVTLR LNSNDVIHSF 
WVPSISGKMD MIPGRTNTLT ITATETGQFR GQCAEFCGLS HPKMAFEVTV LPPEAFDKWL 
ATTRGAARDV ARPAQAEGRE VFLSAGCAAC HEIRGVAEGG RLGPDLTRLG ARASLGAGMW 
RMNQGNVAGW IADVQDMKPG AQMPSYNHLS GPDLRNLSAY LVSLQ