Gene Caul_4505 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4505
Symbol
ID	5901966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4876618
End bp	4878285
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	65%
IMG OID	641565024
Product	cytochrome c oxidase, subunit I
Protein accession	YP_001686123
Protein GI	167648460
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.651872
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCACG CCGCTGACAT CGATCATCAC GACGCGTCTC ACGACGACGC CGACCACAAG 
CCGCCCTTCT TCCAGCGTTG GTTCTTCTCG ACCAACCACA AGGACATCGG CACGCTCTAC 
ATCCTGTTCG CCATCATGGC GGGCCTGGTG GGCGGCGCGC TGTCGGGCCT GATCCGCTGG 
GAACTGGCCG AGCCGGGCAT CCAGATCTTC GGCCCCAACT CGACCATCCA CCTGATGGGC 
CTCGTCGAGC AGTCCAAGCA TGGCTACAAC GCCGTGGTCA CCGCCCACGC CCTGATCATG 
ATCTTCTTCA TGGTCATGCC GGCGATGATC GGCGGGTTCG GCAACTGGTT CGTGCCGATC 
ATGATCGGCG CGCCGGACAT GGCCTTCCCG CGGATGAACA ACATCTCGTT CTGGCTGCTG 
GTCGCCGCCT GGGTGCTGCT GCTGACCTCG ATGTTCTCGC CCGGCGGTCC TGGCCAAGGC 
TTCGGCGGCG GCTGGACGAT CTATCCGCCG CTGTCGACCA CCGGCCACAC CGGCCCGGCG 
ATGGACCTGG CGATCCTGGC CCTCCACCTG GCCGGCGCCT CGTCGATCCT CGGCGCGATC 
AACTTCATCA CCACGATCTT CAACATGCGC GCGCCGGGCA TGACCCTGCA CCGCATGCCG 
CTGTTCGCCT GGTCGGTGCT GATCACCGCC TTCCTGCTGC TGCTGTCGCT GCCCGTGCTG 
GCCGGCGCCA TCACCATGCT GCTGACCGAC CGCAACTTCG GCACCCACTT CTTCGACCCG 
GCCGCCGGCG GCGACCCCGT CATGTTCCAG CACCTGTTCT GGTTCTTCGG TCACCCGGAA 
GTGTACATCC TGATCCTGCC AGGCTTCGGC ATGATCAGCC ACATCGTCTC GACCTTCTCC 
AAGAAGCCGA TCTTCGGCTA TCTGGCGATG GCCTACGCCA TGGTCGCCAT CGGCTTCGTC 
GGCTTCATCG TGTGGGCGCA CCACATGTAC ACGGTCGGCA TGAGCATCAA CCTGCGCGCC 
TATTTCGTGG CCGCCACGAT GGTCATCGCG GTGCCCACCG GCGTGAAGAT CTTCTCGTGG 
ATCGCCACGA TGTGGGGCGG GTCGATCAGC TTCAAGACGC CCATGCTGTG GGCGATCGGC 
TTCATCTTCC TGTTCACCGT CGGCGGCGTG ACCGGCGTGG TCCTGTCGAA CGCCGGCATC 
GACTACAGCC TGCACGACAC CTACTACGTC GTCGCCCACT TCCACTACGT GCTGTCGCTG 
GGCGCCGTGT TCGCCATCTT CGCCGGCTTC TTCTACTGGT TCGAGAAGAT GTGGGGCGTG 
AAGTACAACG AGTTCCTGGG CTGCGTGCAG TTCTGGATCA TGTTCATCGG CGTGAACCTG 
GTGTTCTTCC CGCAGCACTT CCTGGGTCTG CAGGGCATGC CGCGCCGCTA TGTCGACTAC 
CCGCTGGCCT TCGCCCACTG GAACTACGTC TCGTCGGTCG GCTACGCGAT CACCGCCGTG 
GGCGTGCTGG TCTTCCTGGT GATCCTGCTG GAAGCCGCCA TCCGTCGTCG CCCGGCCGAG 
GCCAATCCGT GGGGCGAAGG CGCCACCACC CTGGAATGGA CCCTGTCGTC GCCGCCGCCC 
TTCCACCAGT TCAGCGAGCC GCCGGTCATC AGGGCCGACA GCCACTGA

Protein sequence

MAHAADIDHH DASHDDADHK PPFFQRWFFS TNHKDIGTLY ILFAIMAGLV GGALSGLIRW 
ELAEPGIQIF GPNSTIHLMG LVEQSKHGYN AVVTAHALIM IFFMVMPAMI GGFGNWFVPI 
MIGAPDMAFP RMNNISFWLL VAAWVLLLTS MFSPGGPGQG FGGGWTIYPP LSTTGHTGPA 
MDLAILALHL AGASSILGAI NFITTIFNMR APGMTLHRMP LFAWSVLITA FLLLLSLPVL 
AGAITMLLTD RNFGTHFFDP AAGGDPVMFQ HLFWFFGHPE VYILILPGFG MISHIVSTFS 
KKPIFGYLAM AYAMVAIGFV GFIVWAHHMY TVGMSINLRA YFVAATMVIA VPTGVKIFSW 
IATMWGGSIS FKTPMLWAIG FIFLFTVGGV TGVVLSNAGI DYSLHDTYYV VAHFHYVLSL 
GAVFAIFAGF FYWFEKMWGV KYNEFLGCVQ FWIMFIGVNL VFFPQHFLGL QGMPRRYVDY 
PLAFAHWNYV SSVGYAITAV GVLVFLVILL EAAIRRRPAE ANPWGEGATT LEWTLSSPPP 
FHQFSEPPVI RADSH