Gene Caul_0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0354
Symbol
ID	5897628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	395262
End bp	396800
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	68%
IMG OID	641560839
Product	UbiD family decarboxylase
Protein accession	YP_001681989
Protein GI	167644326
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTACC GCAGTCTGCG CGAATTCATC GACGTCCTCG AGGCCAAGGG CGAGCTGGTG 
CGGGTGACCG AGCCGGTCTC GACCGTGCTG GAGATGACCG AGATCCAGAC CCGCCTGCTG 
GCCACCGGCG GGCCGGCGGT GCTGTTCGAG CACGTGATCC TGCCCGACGG CGCGCGCTCG 
CCGATGCCGG CGCTCGCCAA CCTGTTCGGC ACGGTCAAGC GCGTGGCCAT GGGCGTCACC 
CTGGGCGGCG AGCCGCGCAC CACGGCCGGC GAACTGCGCG AGGTCGGCGA GTTGCTGGCC 
TTCCTGCGCC AGCCCCAGCC GCCCAAGGGC CTCAAGGACG CCCTGGACAT GCTGCCCCTG 
GCCAGGACCG TGATGGCCAT GCGGCCGGGC ACGGTCAGGA AGGCCCCGGT GCAGGAGGTG 
GTGCTGACCG GCGACCAGAT CGATCTCTCC AAACTGCCCG TCCAGACCTG CTGGCCGGGC 
GAGCCGGCGC CGCTGATCAC CTGGCCGCTG GTGGTCACCA AGGGTCCTGG CAAGGACCGC 
GAGGACGACT TCAACCTGGG CATCTACCGC ATGCAGGTGA TTGGCAAGGA TCGCTGCATC 
ATGCGCTGGC TGGCCCATCG CGGCGGGGCG CAGCACTATG CCCGCCACAA ACAAGCCGGT 
CGAAGAGAGC CCCTGCCCGC CTGCGCCGTG CTGGGCGCCG ATCCCGGCAC CATCCTGGCC 
GCAGTGACGC CCGTGCCCGA CACCCTGAGC GAATACCAGT TCGCCGGCCT GCTGCGCGGG 
GCCAAGGTCG ATCTCGTGCC GGCCAAGACC GTGCCGCTGA TGGTGCCGGC CCACGCCGAG 
ATCGTGCTCG AAGGCCACGT CCTGCTCGAT GAATATGCCG ACGAAGGCCC CTACGGCGAC 
CACACCGGCT ATTACAACAG CGTCGAGAAG TTCCCGGTCT TCCAGGTGAC GGCGATCACC 
ATGCGCAAGG ACCCGATCTA CCTGACCACC TTCACCGGCC GGCCGCCGGA CGAGCCGTCG 
GTGCTGGGCG AGGCGCTGAA CGAGGTGTTC ATCCCGCTGC TGCGCCAGCA GTTCCCCGAG 
ATCGTCGACT TCTGGCTCCC GCCCGAGGGC TGTTCCTACC GCATCGCCGT GGTGTCGATG 
AAGAAGGCCT ATCCGGGCCA CGCCAAGCGG GTGATGCTGG GCGTCTGGAG CTATCTGCGC 
CAGTTCATGT ACACCAAGTG GGTGATCGTC GTGGACCACG ACATCAACGC CCGCGACTGG 
AAGGACGTGA TGTGGGCGAT CAGCACCAAG ATGGACCCGG CGCGGGACAT CACGGTGATC 
GAGAACACCC CCATCGACTA TCTCGACTTC GCCTCGCCCG AGAGCGGCTT GGGCAGCAAG 
ATCGGTCTGG ACGCCACCGA CAAGCTGTCC CCCGAAACCC ATCGCGAATG GGGGAACGAG 
ATCCGCATGG ACCAGGCGGT GATCGACACC GTCAGCGAGA AGTGGGCGCG GCTGGGCCTG 
CCGGGGGATG GGAAGCCGAT CTGGAAACCC AAGCCGTAA

Protein sequence

MAYRSLREFI DVLEAKGELV RVTEPVSTVL EMTEIQTRLL ATGGPAVLFE HVILPDGARS 
PMPALANLFG TVKRVAMGVT LGGEPRTTAG ELREVGELLA FLRQPQPPKG LKDALDMLPL 
ARTVMAMRPG TVRKAPVQEV VLTGDQIDLS KLPVQTCWPG EPAPLITWPL VVTKGPGKDR 
EDDFNLGIYR MQVIGKDRCI MRWLAHRGGA QHYARHKQAG RREPLPACAV LGADPGTILA 
AVTPVPDTLS EYQFAGLLRG AKVDLVPAKT VPLMVPAHAE IVLEGHVLLD EYADEGPYGD 
HTGYYNSVEK FPVFQVTAIT MRKDPIYLTT FTGRPPDEPS VLGEALNEVF IPLLRQQFPE 
IVDFWLPPEG CSYRIAVVSM KKAYPGHAKR VMLGVWSYLR QFMYTKWVIV VDHDINARDW 
KDVMWAISTK MDPARDITVI ENTPIDYLDF ASPESGLGSK IGLDATDKLS PETHREWGNE 
IRMDQAVIDT VSEKWARLGL PGDGKPIWKP KP