Gene Caul_3893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3893
Symbol
ID	5901355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4213426
End bp	4214550
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	74%
IMG OID	641564414
Product	cytochrome c-type biogenesis protein CcmI
Protein accession	YP_001685516
Protein GI	167647853
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4235] Cytochrome c biogenesis factor
TIGRFAM ID	[TIGR03142] cytochrome c-type biogenesis protein CcmI

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0160389
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.633294
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGGTT TCTGGATCGC CGCGGCGGGA TTGTCGGCTT TTGTCGCAGC CTTGATGCTG 
CGCGCGACCG CGCGCGCGGC TCTGGCCTCG GGCGCGGGCG GCGACGACGC CAGCCTGGCG 
GTGCACCGCC GACAGCTTTC CGAGATCGAC GATCTGGCCG AGCGCGGCCT GCTGGCCGAG 
GGCGAGCTCA AGGCCGCGCG GGCCGAAGCC GGGCGCCGGC TGATCGCCGC CGCCGACCAT 
CTGCAAGCTT GGCCGGCCGC CAATCCCAAG GCTCGCCCTC TGGTGTTGGC CTTGGCCGCC 
GCCGCTCCGA TGATCGCCCT GGTCATCTAC ATGCTGGTCG GCGCGCCGGG CGTGGCGGAC 
CAGCCGTTCC TCAAGCGCGT CGCGGCCTGG CGCGAAGCCG ATCCCGCTCA GCTCGATCCG 
CGGAAGATCG CCGCCGTGCT CGAACAGATC GCGATCGCGC GGCCTGCCGA TCCCGAACCG 
CTCAAGCACT TGGCCCTGGC GCGGATGGCC GGCGGCGACC CAACTGGCGC GACCCAGGCC 
CTGCGCCGGG CCGTGACCCT GGACCCGGCC CGCGTCGACC TGTGGATCGA CCTGGGCCAG 
GCCTTGGTGG CCGAGGGCGA CGGCGAGGTT GGCGCCGACG CCCGGCGCGC CTTTTCCGAA 
GCCCTGAAGC GCGACCCCGG CAATGTGGTC GCCCGCTATC ACCTGGCGCG GGGCAGGATC 
GCCGACGGCG ACGTTTCCGG CGGCCTCGCC GACTGGCGCG CCCTGCTGGC CGACCTGCCG 
GCCGGGGATC CGCGCCGCCA GGGCTTCAGC CAGGAGATCG CCCAGGTCCA GGCCAATGGC 
GGCCTGCCGG CCTCCACCGC GCCCACGGGC CAGCCGGGTT CGACCACCGG GGGCGACGTC 
CAGGGCATGA TCCAGGGCAT GGTCGCGGGC CTGGCCGCCC GGCTGGAAAC CGCGCCAGAC 
GATCCCGACG GCTGGGTCAA GCTGGTGCGC GCCTATGCCG TGCTGGGCGC GGCCGCCAAG 
CGTGACGCCG CCCTCGCCAA GGCGACCCAG CGCTACCAGG ACCAGCCCAA GGTGCTGGCC 
GCCCTGCGCC AGGCCGCCCA AACCCCCAAA GCCCAGACGC CATGA

Protein sequence

MIGFWIAAAG LSAFVAALML RATARAALAS GAGGDDASLA VHRRQLSEID DLAERGLLAE 
GELKAARAEA GRRLIAAADH LQAWPAANPK ARPLVLALAA AAPMIALVIY MLVGAPGVAD 
QPFLKRVAAW READPAQLDP RKIAAVLEQI AIARPADPEP LKHLALARMA GGDPTGATQA 
LRRAVTLDPA RVDLWIDLGQ ALVAEGDGEV GADARRAFSE ALKRDPGNVV ARYHLARGRI 
ADGDVSGGLA DWRALLADLP AGDPRRQGFS QEIAQVQANG GLPASTAPTG QPGSTTGGDV 
QGMIQGMVAG LAARLETAPD DPDGWVKLVR AYAVLGAAAK RDAALAKATQ RYQDQPKVLA 
ALRQAAQTPK AQTP