Gene Caul_1198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1198
Symbol
ID	5898653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1261185
End bp	1262351
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	71%
IMG OID	641561681
Product	glycosyl transferase group 1
Protein accession	YP_001682826
Protein GI	167645163
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCATCC TTCCCGACGA TTTCACCCTT CTGCAGGTGA CCCCCGAGCT GGAAACGGGC 
GGGGCCGAGC AGACGACGAT CGACGTGGCC CACGGCGTGA TCGCCCAGGG CGGCAGGGCT 
CTGGTCGCCA CCAAGGGCGG CCGCATGGCC GCGCGGCTGG AGGCCGACGG CGGGCGCCTG 
GCCCAGATGC CGGCCCAGTC GAAGAACCCC CTGGTGATGC TAGGCAACGC CGCCCGGCTG 
GTCGACCTTA TCCGCCGCGA AAAGGTGAGC CTGGTCCACG CCCGCTCGCG CGCCCCGGCC 
TTCTCGGCGC TCTGGGCGGC GCACGCCACC AAGGTGCCGT TCGTGGCCAC CTATCATGGG 
GTCTACAACG CCAAGTCCAA CCTCAAGCGC TGGTACAACG CGGTGATGAC CAAGGGCGAC 
CTGGTGATCG CCAATTCGGA ATATACCCGC GCCCATGTCG TCGCCGAGCA CGGGATCTCG 
CCCGACCGCG TGGTGGCCAT CCCGCGCGGC GTGGACCTGA CCCGTTTCGA GCCCGGCCTG 
GTCTCGGCCG ACCGGATCAA GGCGCTGCGC GACGCCTGGG GCGTTTTGCC CGAGGACCGC 
CGGCTGAAGG TGCTGCTGGC CGGCCGCCTG ACCCGCTGGA AGGGCCAGGC CCTGGTCATC 
GAGGCGATGG CGCGGCTGAA GGCGGTGGCC GACACGCGCA TCCTGCTGCT GCTGGTCGGT 
GATGACCAGG GCCGCAAGGC CTATCGCGCC GAGCTCGAGC ACATGATCGC CCAGGCCGGA 
CTGCAGGACA GCGTCAAGCT GGTGGGTCAC TGCGACGACA TGCCGGCCGC CTACCTGGTC 
GCCGACCTGG CCATCGCCCC GTCGCTGGAG CCCGAGGCCT TCGGGCGCAC GGCCGTCGAG 
CCGCAGGTGA TGGGCAAGCC GGTGATGGCC GCCGATCACG GCGCGGCGCG CGAGACGGTG 
GTCGACCGCG AAACCGGCTG GCTGGTCGCC CCCGGCGACG CCGAGGCCTG GGCCCAGGCC 
CTGTCCAACG CCTGCGACGC GGGGGCCGCG CGACGCCAGG CCATGGGCGC CGCGGCCCGG 
GCGCGCGCCA GAAAACTGTA TTCTGTTGAC GCGATGGTCG AAGCCACGCT CAAGGTCTAC 
GCACGCGTTC TGGAGACGAA GACTTGA

Protein sequence

MSILPDDFTL LQVTPELETG GAEQTTIDVA HGVIAQGGRA LVATKGGRMA ARLEADGGRL 
AQMPAQSKNP LVMLGNAARL VDLIRREKVS LVHARSRAPA FSALWAAHAT KVPFVATYHG 
VYNAKSNLKR WYNAVMTKGD LVIANSEYTR AHVVAEHGIS PDRVVAIPRG VDLTRFEPGL 
VSADRIKALR DAWGVLPEDR RLKVLLAGRL TRWKGQALVI EAMARLKAVA DTRILLLLVG 
DDQGRKAYRA ELEHMIAQAG LQDSVKLVGH CDDMPAAYLV ADLAIAPSLE PEAFGRTAVE 
PQVMGKPVMA ADHGAARETV VDRETGWLVA PGDAEAWAQA LSNACDAGAA RRQAMGAAAR 
ARARKLYSVD AMVEATLKVY ARVLETKT