Gene Caul_0541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0541
Symbol
ID	5897996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	589533
End bp	591071
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	65%
IMG OID	641561024
Product	hypothetical protein
Protein accession	YP_001682173
Protein GI	167644510
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGATG TTCTGATTGT CGGCGCTGGT CCGGCGGGTC TCACTCTGGC CTGCGATCTG 
CGGCGCCGCG GCGTCGCATT TCGACTGATC GAGAAACTGC CCTCGCCGCT GGTCGGCTCC 
AAGGGCAAGG GCATCCAGCC GCGATCCCTC GAGCTGTTCG ACGATCTCGG GCTGATCGAC 
AGGGTCTTCG CCAACAGCTC AAACTATCCG CCGATGCGCA TCTACAAGGG CCCCGATCCG 
GTGGCGACCC ACATCATGAT GCCCATCCTC GAGCCGACGC CGGATGTTCC CTATCCCAAT 
ATCCGGATGC AGCCGCAGTG GAAGACGGAG GCGCTGCTGC GCGAGCGCCT TGCGGAATTG 
GGTGGCCAGG TGGAGTTCAA CACCAGCTTC AAAAGCCTCG AACAGACGCC CCAAGCAGTC 
GTCGTCAAGG TTCTCTCACC GGCGGGCGAA GAGACGGTGA GCGCACGGTA TGTCGTCGCC 
GCCGACGGCG GGCGAGGGAC GATCCGCAAG GCGATCGGCG TGACCTTCGA GGGTGAGAAT 
CCCAGCCTCG ACGGCATCTT GATCGCCGAC GTGAAGGTCG AGGGGCTGGG CCGTGATGTC 
TGGCACGTCT GGACCACGCC GGCCGGACAG AAGGTCACGC TATGTCCTCT GCCCCCAACC 
GACGGCTTCC AGTTCGCCGC CTTTGTAACA GAGGGCGCCG AGCCCGTGCA GGAACTCGAA 
ACCCTCCAGG CGCTGCTCGA CGAGGCGGCG GGACCTCGGT CCGGCCCGGC CCGCAAGGGC 
CTGTCCAAGC TGTTGGGACG CCGGGCCTCC CTGAAAGGGT CAGGCTATCG CGTCAGCGAC 
ATGACCTGGA TTTCGCTGTT CCGCCCCAAT GTCAGGATGG CCAATGCATT CCGCAAAGGC 
CGGGTCTTCC TGGTCGGCGA CGCCGCCCAC ATCCACACCC CGGCCGGGGC CCAAGGGCTC 
AACACCTCCA TCCAGGACGC CTACAACCTG GGCTGGAAGC TAGGCTGGGT CATCAAGGGC 
GTCTCCGACG CCCGCCTGCT GGACACTTAT GAAGAAGAGC GGCTGCCGAT CGCCGCGGCG 
GTGCTGCGGC GCAGCGACGA GCTTTACAAG GACATCGTCA AGCAGGACGG CAAGGAAGAT 
CGAAACGAGG ACGACGGGCA GTTGACCCTC AACTACCGCG GATCTTCGCT CTGTGGTCCC 
GCCAACGTGG AGACCCTCCT GCAGCCGGGC GACAGGATGC CGAACATCCT GTTGCGCTCG 
CCCTCAGGCG CGACCCTGAA CCTGTTCGAT CTGATGCGGG GCCCGCAGGC GTCGGAATTT 
CACATCGATC GCGTTCGCCC CGAGGGCGCA TCGACCAAGG ATATTCGCGT CGCGTCGATC 
GGGTCCGAGG CTGGAGCCCG AGGCTTCGAC TACCACGGCG ACGGACCGGC AATGAAGGAC 
CTTGCCGGAC GGATCGTCTC GGTGCGGCCA GACGGTTATA TTCAGAGCAT CGGGGACAAG 
GGGTCTTTGC CCCGATCCAT TCATGCGAGC GCAGCATGA

Protein sequence

MIDVLIVGAG PAGLTLACDL RRRGVAFRLI EKLPSPLVGS KGKGIQPRSL ELFDDLGLID 
RVFANSSNYP PMRIYKGPDP VATHIMMPIL EPTPDVPYPN IRMQPQWKTE ALLRERLAEL 
GGQVEFNTSF KSLEQTPQAV VVKVLSPAGE ETVSARYVVA ADGGRGTIRK AIGVTFEGEN 
PSLDGILIAD VKVEGLGRDV WHVWTTPAGQ KVTLCPLPPT DGFQFAAFVT EGAEPVQELE 
TLQALLDEAA GPRSGPARKG LSKLLGRRAS LKGSGYRVSD MTWISLFRPN VRMANAFRKG 
RVFLVGDAAH IHTPAGAQGL NTSIQDAYNL GWKLGWVIKG VSDARLLDTY EEERLPIAAA 
VLRRSDELYK DIVKQDGKED RNEDDGQLTL NYRGSSLCGP ANVETLLQPG DRMPNILLRS 
PSGATLNLFD LMRGPQASEF HIDRVRPEGA STKDIRVASI GSEAGARGFD YHGDGPAMKD 
LAGRIVSVRP DGYIQSIGDK GSLPRSIHAS AA