Gene Sare_3532 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3532
Symbol
ID	5704600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4073008
End bp	4073979
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	66%
IMG OID	641272959
Product	cytochrome c oxidase subunit II
Protein accession	YP_001538325
Protein GI	159039072
COG category	[C] Energy production and conversion
COG ID	[COG1622] Heme/copper-type cytochrome/quinol oxidases, subunit 2
TIGRFAM ID	[TIGR02866] cytochrome c oxidase, subunit II

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.636307
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000170854
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGGTCGCAA GGAGTTCGGA GGTACGGTCG TCGGCCGTAC GGCACAGCGC TTCCCCGGGA 
GTCGGCGGGC GTCGGGCGCG GGGTGTCGGC CGGCTGGCCG GGCTCGGTCT CGGCGGAGCG 
GCGCTGCTGG TCCTGCTCAC GGGCTGCGAC GTCGGCGCCA CGTTCGCCGG CTTCGGATGG 
CCGCAGGGAG GCATCACCCC CGAGGCCAAC CGGATGTACG ACCTGTGGAT CGCGTCGTGC 
ATCGCGGCGC TCGCGGTCGG TGTGTTCGTG TGGGGCCTCA TCTTCTGGTG CGTCGTGCGT 
TACCGGAAGC GGGGTAACGA ACTGCCCGTG CAGACGCGCT ACAACCTGCC GATGGAGTTC 
CTCTACACCA TCGCTCCGAT TCTGATCGTC TCCGTGCTCT TCTACTACAC GGCGATCGTG 
CAGACCGACG TGGGGAAGAC CTCCCGGAAC CCGGACGTCA CCGTCGAGGT GGTCGCCTTC 
AAGTGGAACT GGCAGTTCAA CTACCGCGAC GGGCAGGGCG TGGAGGCGAA CACGATCGCC 
TCGGTTCTCG GTACCAGCGA GGTCATCCCG ATCCTCGTGT TGCCGTCCGA GCGGTCGATC 
CGCTTCGAGG AGACCAGCCG CGACGTCATC CACTCGTTCT GGGTGCCAGA GATGCTGTTC 
AAGCGCGACG TCTTCCCCGG TAGCATCCGC AATGTCTTCG AGGTCTCCGA GCTCGAGGGT 
GAGGGCGCGT ACGTGGGCCG TTGCGCCGAG CTGTGCGGCA CGTACCACGC CTTCATGAAC 
TTCGAACTTC GGGTCGTCTC GCCGGAGAGG TACGACCGTT TCATCGCGCT CAAACAGGAC 
GGCCAGTCCA CGCAGGAGGC GCTGACCGCA ATCGGCGAGA ACCCGTATGC GACGACCACC 
GAACCGTTCG AAACGCGGCG TACCGAAGCG AACTTCAACC CCGACAAGCC GGCAAACGGC 
TCGGGTAACT GA

Protein sequence

MVARSSEVRS SAVRHSASPG VGGRRARGVG RLAGLGLGGA ALLVLLTGCD VGATFAGFGW 
PQGGITPEAN RMYDLWIASC IAALAVGVFV WGLIFWCVVR YRKRGNELPV QTRYNLPMEF 
LYTIAPILIV SVLFYYTAIV QTDVGKTSRN PDVTVEVVAF KWNWQFNYRD GQGVEANTIA 
SVLGTSEVIP ILVLPSERSI RFEETSRDVI HSFWVPEMLF KRDVFPGSIR NVFEVSELEG 
EGAYVGRCAE LCGTYHAFMN FELRVVSPER YDRFIALKQD GQSTQEALTA IGENPYATTT 
EPFETRRTEA NFNPDKPANG SGN