Gene Caul_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1064
Symbol
ID	5898519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1123862
End bp	1125025
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	71%
IMG OID	641561546
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001682692
Protein GI	167645029
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.43547
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACG ACGCGCAACT GCTGGCCGCC CAACCCGACA CCCTGAGGCC GGCCGCCCGG 
GGACGCCCCG AGGGGGCGAA GTTCGGCGAA GGCTTCGTCC TGGACACCTG GTACATGGCG 
GCCCTGTCGC CCGACCTGAA GCCCGGCAAG ATGGAAGGCC GCGAGTTCCT CGGCGAGCCG 
GTGCTGATCG GCCGCACCCG GGCCGGCGCC GTCTACGCCC TGCGCGACGT CTGCCCGCAC 
CGCGCCGCCA AGCTGTCGGC CGGCAAGGTC CACGCCGAGG CCCCCAATGG CGAGAATCGC 
GGCGAGAATG GCCGCCGCGA GACGGTCGAG TGCCCCTATC ATGGCTGGCG ATTCCACACC 
GACGGCGCGT GCGCCAAGAT CCCGTCCCTG ACCGCCGCCG ACCCGCTCGA CGTCTCCAAG 
GTGCGGGTCA AGACCTATCC GCTGGTCGAG AGCCAGGGCC TGGTGTGGAT CTGGATGTCG 
GCCGACCCGC GCTTCGACGG CCAGCCGTCG GAACCGCCCC CGACAATCCC CGGCGTGGTC 
GGCGGCAAGC CCAAGCTGGT CGACCACCTG GACTACGACA TCCATATCGA CCACGCGGTG 
CTAGGCCTGA TCGACCCGGC CCACGGCCCG TTCGTGCACC ATCAGTGGTG GTGGCGCACC 
ACCGCCAGCC AGCACGAGAA GCAGAAGCGG TTCGCCCCGT CCGAGGCCGG CTTCACCATG 
GTGCGGCACG AGCCGTCCAA GAACTCCAAG GCCTACGCAA TCCTGGGCGG CGAGCCCCTG 
ACCGAGATCA CCTTCCGCCT GCCCGGCCTG CGCTGGGAGC ATGTGAAGGT CGGCGACAGG 
CAGGTGCTGG CCCTGTCGGC CATGACCCCG ATCAACGCCG GCAAGACCCG GATGAACCAG 
ATCATCTGGT CCGACCACCC GGCCTTCACC GTCCTCTATC CGGTGATCCG CATGGCCGCC 
CGCGCCTTCC TGCGCCAGGA CGGCCGGATC GTCGCGGCCC AGACCCGCGG CCTGCGGGAC 
AACCCGGCCC TGATGTGGGT GGGCGACGCC GACCAGCAGG GCCGCTGGTA CCACCAGCTC 
AAGCGCGAAT GGGCCGCCAG CCGCCGCGAA CGCCGGCCGT TCAGGAACCC GGTCGAGGCC 
GCGACGCTGC GGTGGCGGAC CTAG

Protein sequence

MADDAQLLAA QPDTLRPAAR GRPEGAKFGE GFVLDTWYMA ALSPDLKPGK MEGREFLGEP 
VLIGRTRAGA VYALRDVCPH RAAKLSAGKV HAEAPNGENR GENGRRETVE CPYHGWRFHT 
DGACAKIPSL TAADPLDVSK VRVKTYPLVE SQGLVWIWMS ADPRFDGQPS EPPPTIPGVV 
GGKPKLVDHL DYDIHIDHAV LGLIDPAHGP FVHHQWWWRT TASQHEKQKR FAPSEAGFTM 
VRHEPSKNSK AYAILGGEPL TEITFRLPGL RWEHVKVGDR QVLALSAMTP INAGKTRMNQ 
IIWSDHPAFT VLYPVIRMAA RAFLRQDGRI VAAQTRGLRD NPALMWVGDA DQQGRWYHQL 
KREWAASRRE RRPFRNPVEA ATLRWRT