Gene Caul_3034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3034
Symbol
ID	5900489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3298404
End bp	3299471
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	69%
IMG OID	641563536
Product	putative glycerol-3-phosphate acyltransferase PlsX
Protein accession	YP_001684659
Protein GI	167646996
COG category	[I] Lipid transport and metabolism
COG ID	[COG0416] Fatty acid/phospholipid biosynthesis enzyme
TIGRFAM ID	[TIGR00182] fatty acid/phospholipid synthesis protein PlsX

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.829882
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGGGG ATCACGGCCC GTCCGTGATC GTTCCCGCCG TGGCGCTCGC CGCCAAAAGC 
CTTCCCGACG TCCGTTTCCT GCTGCACGGC GACGAAGCCC AGCTGAACGC CCAACTGGCC 
AAATCCCCGG ACGCGCGCGC CGTCAGCGAG GTGCGTCACA CCGACAAGGC CATCTCGATG 
GAAGAAAAGC CCGCCCAGGC GATGCGCCGG GGCAAGGGCA CCAGCCTGTG GAACGCCGTC 
GAGGCCCTGC GCAACAACGA GGCCGCCGCC GTCGTCTCGG CCGGCAACAC CGGCGCTCTG 
ATGGCGATCT CCAAGCTGAT CCTGCGCATG GGGGCCAATC TGGAGCGCCC GGCGATCGTC 
GCCAGCTGGC CGACCATGCG GGGCGTCTCG GCCGTGCTCG ACGTCGGCGC CAATGTCGAG 
AGCGACGCGG GCCAGTTGAT CGAGTTCGCG ATCATGGGCG CGGCCTTCCA CCACGCGGTG 
CACGGTTCCG AGCGTCCGAC CGTCGGCCTG CTCAATGTCG GCTCCGAGGA CCAGAAGGGT 
CACGAGGAGG TGCGCGAGGC GCACGCCATC CTCAAGGAGA CCAAGCTCGA CTTCGACTAT 
CGCGGCTTCG TCGAGGGCAC CGACATCGCC AAGGGCACGG TCGACGTGGT CGTCACCGAC 
GGCTTCACCG GCAATGTCGC CCTGAAGACC GCCGAGGGTC TGGCGCGGTT CTTCGCGGCC 
GAGATCAAGG CCACCCTGAC CTCCGGTCCG CTCGCCATGC TGGGGGCGGT GATCGCCTCC 
GGCGCCCTGA AGAAGATGCG TCGACGCCTG GATCCGGGCC GAGTCAACGG CGGGCCGCTG 
CTGGGCCTCA ACGGCATCGT GGTCAAGAGC CACGGCGGGG CCGACCCTAT CGGTTACGCC 
TCGGCCATCC GCGTGGCCGT CGATCTGGCG CGCAGCGACT TCCAGGCCGA GATCGACCGT 
AATCTGAAAC GTCTGACAGA AACCGGCCTG AAATCCGGCG CGGATCAAGC GGCCAATCCC 
AGCCATGGGG GCGCGTCGGG CGCCGAGGGC CAAGGAGCTT CCGAGTGA

Protein sequence

MGGDHGPSVI VPAVALAAKS LPDVRFLLHG DEAQLNAQLA KSPDARAVSE VRHTDKAISM 
EEKPAQAMRR GKGTSLWNAV EALRNNEAAA VVSAGNTGAL MAISKLILRM GANLERPAIV 
ASWPTMRGVS AVLDVGANVE SDAGQLIEFA IMGAAFHHAV HGSERPTVGL LNVGSEDQKG 
HEEVREAHAI LKETKLDFDY RGFVEGTDIA KGTVDVVVTD GFTGNVALKT AEGLARFFAA 
EIKATLTSGP LAMLGAVIAS GALKKMRRRL DPGRVNGGPL LGLNGIVVKS HGGADPIGYA 
SAIRVAVDLA RSDFQAEIDR NLKRLTETGL KSGADQAANP SHGGASGAEG QGASE