Gene Caul_1351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1351
Symbol
ID	5898806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1435345
End bp	1436475
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	70%
IMG OID	641561838
Product	hypothetical protein
Protein accession	YP_001682979
Protein GI	167645316
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGACG TTGAGACCCT TCACCCGCGC GATCTCGCCG AGGCCGACCT GCGGCTGTGG 
CGCGACATGG CGGCGGCCGA GCCGGCCTTC GACAGTCCGT TGCTGGGTCC GGACTTCGCC 
CGAGCGGTCG GCGTCGTGCG CGACGACGCC CGCGTGGCGG TGATCCGCCG GGGTGGCCAG 
ACCGTGGGCT TCCTGCCGCA TCACCGTCGC GCCGGCGCGA TGGCCCGGGC CATCGGCGCG 
CCGCTGTCGG ACTATCACGG CCTGGTTTCG CGCGCCGACG CCGGGCTGAC CGCGGCCCAG 
GTGCTGGGCG CCGCCGACCT GACCGCGTTC CGCTACACCG GCCTGATCGA CCCCCACGGC 
GTGTTCGGCC GGGGCGAGCA GAAGACCGCT CACGTCATCA GCCTGGCCGG GACCGACGCC 
GAGACCTATC TGGAGGCGGT CCGCGCGGCC AGCCCCAAGA AGATCAAGAA CTGGCGTCGC 
CTGGACAGCA AGCTGGAACG CGAGATGGGG ACCGTCGAAC TGGTCGCCGC CGACCGCTCG 
CGCCAGGCCT TCGACCAACT GATCGCCTGG AAACGCGAGC AGTTGGAGCG CACCGGCGTC 
CACGATTTCC TGCGTCCCGA CTGGACCCGC AACCTGATGC TGGATCTGTT CCAGAAGCAG 
ACCGGCCCGT TCCAGGGCCT AATGATCAAC CTTTATGCCG GCGGCGAGCT GGTCAGCGGC 
CACTTCGGCG TGCGGCTGAA CGGCGTCTAT CACCCGTGGA TCGCCTCGAC CAATCCGGCC 
TATGGCGAAT GGTCGCCCGG TCAGATCTTC TTCATGCGGG CCATCGCCGC CATGCCGGGC 
CTGGGCCTGC ATCGCTACGA CCTGGGTCCC GGTCACGACC ACTACAAGGG CGCCTACGCC 
CTGGGCCAAG TCCAGATCGG CGAAGGCACG GCCACGGCCG CGACCATGGC TGGCCGCATG 
GCCAGTTCGC TGGACGGGAT CATGACCCTG GCCGGATCGC GCGGCGCGGG GCCGGTCGGG 
CGGCTGAGCC GACGCATGGA CGCCATCACC AGCGTCGAAC TGACCCTGGG CGGGCAGGTG 
CGAGGCCTGG TCGACGCCTT CGCTAACCAA GCGCAAAGGC GGGGCGGCTA A

Protein sequence

MLDVETLHPR DLAEADLRLW RDMAAAEPAF DSPLLGPDFA RAVGVVRDDA RVAVIRRGGQ 
TVGFLPHHRR AGAMARAIGA PLSDYHGLVS RADAGLTAAQ VLGAADLTAF RYTGLIDPHG 
VFGRGEQKTA HVISLAGTDA ETYLEAVRAA SPKKIKNWRR LDSKLEREMG TVELVAADRS 
RQAFDQLIAW KREQLERTGV HDFLRPDWTR NLMLDLFQKQ TGPFQGLMIN LYAGGELVSG 
HFGVRLNGVY HPWIASTNPA YGEWSPGQIF FMRAIAAMPG LGLHRYDLGP GHDHYKGAYA 
LGQVQIGEGT ATAATMAGRM ASSLDGIMTL AGSRGAGPVG RLSRRMDAIT SVELTLGGQV 
RGLVDAFANQ AQRRGG