Gene Caul_4542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4542
Symbol
ID	5902003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4916069
End bp	4917076
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	73%
IMG OID	641565061
Product	tetraacyldisaccharide 4'-kinase
Protein accession	YP_001686160
Protein GI	167648497
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1663] Tetraacyldisaccharide-1-P 4'-kinase
TIGRFAM ID	[TIGR00682] tetraacyldisaccharide 4'-kinase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.187603
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGG CCACGCCGCG CTGGTGGTAT CTTCGCGAGG GCGCGCCCAG CCCGATCACC 
CGCGCCCTGC TGACCCCGCT GTCGTGGATC TGGGCCGCCC AGACCGCCCG GCGCATCGCC 
CGCACCACGC CGCGCGGCGC CGACTGCGCG GTGATCTGCG TCGGCAACTT CACGGTCGGC 
GGGGTGGGCA AGACCCCGAT CGTCCGCGAG CTGCTGCTGA CCCTGACGAA GCGGGGCCGC 
CGCGCCCACG GCCTGGCGCG CGGCTATGGC GGCAAGCTGA AAGGGCCGGT GCGGGTCGAG 
CCGTCGCGCC ACACCGTCGC CGAGGTCGGC GACGAGCCGC TGATGCTGGC CCAGGACTTT 
CCGATGTGGG TGTCGCGCGA CCGGGTGCTG GGCGCGCGCA AGGCCGCCGC GTCCGGCGCC 
GAGGTGGTGG TCATGGACGA CGGCCACCAG AACCCCGACC TGCGCAAGAC CCTGTCGCTG 
GTGGTGGTCG ATGGCGAGAC CCGCGAGGAC GAGTGGCCGT TCGGCGACGG TCGGGTGTTC 
CCCGCCGGTC CGATGCGCGA GCCGCTGAAC GTCAGCCTGG GGCGCACCGA CGCGGTGATC 
GTGCTGCTGC CGGCCGACCT GCCAGAGGCT GATCCGCGGC TGCTGGCGCT GTTTGGCGAC 
ACCCCGGTGC TGATCGCCCG GCTGGAGCCC GCCGCCCCGC CGCCCAAGGG CCGCCAGGTC 
GGCTTCGCCG GCATCGGCAA GCCCTGGAAG GTCGAGCGCG CCCTGAAGGC CGCCGGCTGC 
CACCTGGTCG ACTTCGCGCC CTATCCCGAT CATGGCCAAT ATGACGAGGC GACGCTGAAC 
TTCCTTTGGG AGCGGGCCCA GACCTACAGC GCCGGGCTGG TCACGACCGA GAAGGACTGG 
GTGCGGCTGC CCCAGGCCTG GCGGGATCGG GTGACGCCTT GGCCGGTGCG GGCGCGGTTC 
GAGGATGAAG GGGCGTTGGG GGCGTTGTTG GAGTCAGTGG GGCTGTAG

Protein sequence

MKLATPRWWY LREGAPSPIT RALLTPLSWI WAAQTARRIA RTTPRGADCA VICVGNFTVG 
GVGKTPIVRE LLLTLTKRGR RAHGLARGYG GKLKGPVRVE PSRHTVAEVG DEPLMLAQDF 
PMWVSRDRVL GARKAAASGA EVVVMDDGHQ NPDLRKTLSL VVVDGETRED EWPFGDGRVF 
PAGPMREPLN VSLGRTDAVI VLLPADLPEA DPRLLALFGD TPVLIARLEP AAPPPKGRQV 
GFAGIGKPWK VERALKAAGC HLVDFAPYPD HGQYDEATLN FLWERAQTYS AGLVTTEKDW 
VRLPQAWRDR VTPWPVRARF EDEGALGALL ESVGL