Gene Caul_1347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1347
Symbol
ID	5898802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1430399
End bp	1431937
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	67%
IMG OID	641561834
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_001682975
Protein GI	167645312
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCCTT TCATCCACGC CCAGACCCAA CCCGACAAGC CCGCCTACAT CATGGCCGGC 
TCCGGCGAGA CGGTGACCTA CGGCCAGCTG GACGCCCGCT CCAACCAGGG CGCCCAGCTG 
TTCCGCTCGC TGGGCTTGAA GGCCGGCGAC GTGATCGCCA TCCTGATGGA CAACAGCCCG 
CGGTTCTTCG AGATCGCCTG GGCGGCGCAG CGCGCGGGGC TCTACTACAC CTGCGTCTCG 
ACCAAGCTGA CGCCGGCCGA GGTCGAGTAC ATCGTCAAGG ACTGCGGGGC CCAGGTGCTG 
ATCGTCAGCC CGGCCTTGGA CGATGTCGCC CAAGCCGTCG CGCCGCTGAT CCCCGGCGTG 
CGCCTGTTCC GGGTTGGCGG CGGCAAGGGC GCGTTCGAGG ACTTCGAGGC CGCGCGCGAC 
GCCATGCCGG CCACGCCGAT CGCCGACGAG ACCTCGGGTT CGGACATGCT CTATTCCTCC 
GGCACCACCG GCCGGCCCAA GGGGGTCAAG CCGGCGCTGA CCGGCGGGCC GATCGACGCG 
CCCCACGCCC TGCAGATGAT GGCCATGGGC CTGTTCGGCT TCAGCGGCGA CAGTGTCTAC 
CTGTCCCCCG CCCCGCTCTA TCACGCCGCG CCGCTGCGCT GGTGCATGAC CGTCCAGAAG 
CTGGGCGGCA CGGTGATCGT GATGGAGAAG TTCGATCCCG AGGCGGCCTT GGCCCTGATC 
GAGAAATACA AGGTGACTTG CGGCCAGTTC GTGCCCACCC ACTTCGTGCG GATGCTGAAA 
CTGCCCGAGG CGGTTCGGGC CAAGTACGAC GTGTCGTCGA TCAAGTCCGC CGTCCACGCC 
GCCGCCCCCT GCCCCGTGCC GGTCAAGGAA CAGATGATCG CCTGGTGGGG GCCGGTGATC 
TTCGAATATT ACGCCGGCAC CGAGGGCAAT GGCTTCTGCT GGATCAATTC GCAGAACTGG 
CTGACCCATA AGGGCAGCGT CGGCCAGGCG GTGCTGGGCG AACTGCGGAT CTGCGACGAG 
GACGGCAATC CGGTTCCGCC GCGCACCGAG GGCACGGTCT ATTTCGCCAA CGGCCCCGCG 
GTGAACTACC ATAACGCCCC CGACAAGACC GCCGAGAGCT ACAACCAGCA TGGCTGGACC 
ACCCTGGGCG ACGTGGGCTG GGTCGACGAG GAGGGCTATC TCTACCTGAC CGACCGCAAG 
AGCTTCATGA TCATCTCGGG TGGGGTGAAC ATCTACCCTC AGGAGATCGA GAACCTGCTG 
ATCACCCACC CCAAGGTGGC CGACGCCGCC GTGGTCGGCG CCCCGCACGA GGAAATGGGC 
GAGCAGGTGG TGGCGGTGAT CCAGCCGATG GACTGGGCCG AGGATCAGAC GGACCTGGCC 
CAGGAACTGG CCGCCTTCTG CCGCGCCAAT CTCAGCCACG TGAAGTCGCC GCGCCGAATC 
GACTTCATGC AGGAACTGCC CCGCCACGCG ACGGGCAAGC TCTACAAGCG GCTGATCCGG 
GATGCGTACT GGGCGCAGGG CGAGAGCCGG ATCGGGTAG

Protein sequence

MHPFIHAQTQ PDKPAYIMAG SGETVTYGQL DARSNQGAQL FRSLGLKAGD VIAILMDNSP 
RFFEIAWAAQ RAGLYYTCVS TKLTPAEVEY IVKDCGAQVL IVSPALDDVA QAVAPLIPGV 
RLFRVGGGKG AFEDFEAARD AMPATPIADE TSGSDMLYSS GTTGRPKGVK PALTGGPIDA 
PHALQMMAMG LFGFSGDSVY LSPAPLYHAA PLRWCMTVQK LGGTVIVMEK FDPEAALALI 
EKYKVTCGQF VPTHFVRMLK LPEAVRAKYD VSSIKSAVHA AAPCPVPVKE QMIAWWGPVI 
FEYYAGTEGN GFCWINSQNW LTHKGSVGQA VLGELRICDE DGNPVPPRTE GTVYFANGPA 
VNYHNAPDKT AESYNQHGWT TLGDVGWVDE EGYLYLTDRK SFMIISGGVN IYPQEIENLL 
ITHPKVADAA VVGAPHEEMG EQVVAVIQPM DWAEDQTDLA QELAAFCRAN LSHVKSPRRI 
DFMQELPRHA TGKLYKRLIR DAYWAQGESR IG