Gene Caul_4359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4359
Symbol
ID	5901820
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4737579
End bp	4738724
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	70%
IMG OID	641564877
Product	glycosyl transferase family protein
Protein accession	YP_001685977
Protein GI	167648314
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.114677
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAGC GGGCCTTCCC GATTCTCTTC ATCACCGCCA CGCGTATCGG CGACGCCGTG 
CTGTCGTCCG GCCTGATCAA ATTTCTCGCC GACCAGATCC CCAACGCCCG TTTCACCATC 
GTTTCCGGCC CGCTCGCCGC GCCGCTGTTC GCCCATGTCC CGGGGCTCGA CCGGGTGATC 
GTCATGGAGA AGGGCAAGGG CAAGGGCCAC TGGTTCAAGC TGTGGAACCA GGTGCGTCAC 
CGCAAGTGGG GCCTGGTCGT CGATCTGCGC GGGTCGGGCA CGGCGCTGTT CCTGCGCCGC 
GAGAAGCGGG CGATCTGGAA GAAGTCCAGC GAGACGATGC ACAAGGTCGT CGACGCGGCC 
CGCGTGCTCA AGCTGGAAGG CGATCCGCCG GCTCCGCATC TCTATATCAC CCCCGAGGTC 
CAGGCCCTGG CCGACCAACT GCTGGCCCCG CGGCCGGGCG AGTCGGCGGG CCCGATCCTG 
GCCGTCGGCC CGGCCTCCAA CTGGGTGGGC AAGATCTGGC CGATCGAGCG CTTCGCCCAG 
ACGTCGCAAC AGCTTCTGGG TCCCGGCGGC GCGATGGCGG GCGGGCGGCT GCTGATCCTG 
GGCGGTCCCG GCGACCAGCG GATGGTCGAG GAACTGCGCA TGGCCTCGGC CCGAGGGCGC 
TATATCGACC TGACCGGCAA GGTGGATCTG CTGACCGCCT ATGCGGTGCT GAAGCGGGCC 
GACCTGTTCA TCGGCAACGA CAGCGGCCTG ATGCACATCG CCGCCGCCGC CGGCGTCCCC 
ACGCTCGGCC TGTTCGGCCC GTCCGACGAG CGCCGCTATG GCCCGTGGGG CGCGCTGACC 
AAGGCCGTGC GCGGCCCGCG CACGTTCGAG CAGTTCCTGG CGGTGGATCC GGATCTCTCG 
CAAGCCATCC GCCACATGAG CGACCTGCCG GTGGCCACGG TGGTGCGCGC GGCCAAGGCG 
CTGCTGGTGG AGGCCAAGGC TGCGAGGGCT GCTGCGGCGG CGGTGGTCGA AGAGAGCGCG 
CCCGAGACGA CGGTCGAGGA CGCGGCGGTC ACGCCGGAGC TTCAGCCCGT GCTCGAGGAC 
GCGGCGCCGC TCGAAGACGC CTTCCCCACC CCCGCTCATC CCGACGAAAG TCGGGACCCA 
AGCTGA

Protein sequence

MTQRAFPILF ITATRIGDAV LSSGLIKFLA DQIPNARFTI VSGPLAAPLF AHVPGLDRVI 
VMEKGKGKGH WFKLWNQVRH RKWGLVVDLR GSGTALFLRR EKRAIWKKSS ETMHKVVDAA 
RVLKLEGDPP APHLYITPEV QALADQLLAP RPGESAGPIL AVGPASNWVG KIWPIERFAQ 
TSQQLLGPGG AMAGGRLLIL GGPGDQRMVE ELRMASARGR YIDLTGKVDL LTAYAVLKRA 
DLFIGNDSGL MHIAAAAGVP TLGLFGPSDE RRYGPWGALT KAVRGPRTFE QFLAVDPDLS 
QAIRHMSDLP VATVVRAAKA LLVEAKAARA AAAAVVEESA PETTVEDAAV TPELQPVLED 
AAPLEDAFPT PAHPDESRDP S