Gene Caul_1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1689
Symbol
ID	5899144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1777475
End bp	1778833
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	70%
IMG OID	641562179
Product	polysaccharide biosynthesis protein
Protein accession	YP_001683316
Protein GI	167645653
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.267444
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCACG ATTCCAAGGT CTTGAAGCGG GTTGTGGCCA ATGCCGGAAC ACTGCTCGGC 
GGCCGGACGG TCAACGCCCT GGTCAGCCTG GCCTATATCG CCCTGACCGC GCGAGGCCTC 
GGCGCGGTGC AGATGGGCGT GCTGGTGCTG ATCAACGCCT ACGCCCAGTT CCTGGGCGAC 
GTGGCCAAGT TCCAGTCCTG GCAGACGGTG CTGCAATACG GCGCCGGTCC GTTGCTGACC 
GGCGACCGGC CACGCTTCCA GCAGGTGCTG CGCTTCACTC TGCTGCTCGA CCTGATCGGC 
GCCAGCTGCG GCGTGGCCCT GGGAGTCGGC GGCGCCCTGC TGCTGGGCTC GATGTTCGGT 
TGGCCGCGCG AACTGGGGCC GGCGGCGGCG CTCTACGCCC TGTCGATCGC CATGATGACC 
TCGGCCACCT CGGTAGGGCT GCTACGCCTG TTCGACCGCT TCCGCTTCCT CGCCGGCGAG 
CAGGCGGTCA GCTCGATCGT GCGCCTGGCA GGCTGCGCCC TGGCCTTCGC CTTCGACGCG 
CCGATCGGCT GGTTCCTGGC CGCCTGGGCG GCGGGCACGG TGGCCTCGTT CTTCTACGTG 
ATGGGCGTGG CGTGGTGGGA CCTGGCCCGT CGCGACCTGT TGAAGGGCTT CACCATAGCT 
GGTCCGTTGA GCGAGGGTCT GCCCGGCGTC TGGCGCTTCG CCTGGGCGAC CAATTTCAGC 
GGCACCCTGG ACACCGCCTT CACCCACGTC ATCACCCTGG TGGTCGGCGG CGTGCTGGGC 
CCCGCCCAGG CGGCGCTGTG GCGGGTCGGA CGCCAGGTGG CCGACGGCAT GGCCAAGCCC 
GCCAAGCTGC TGACCCCCGC CCTCTATCCA GAACTGGCCA AGATGCGCGC CGTCGGCGGC 
GAGGAGGCCA TGCGCAAGCT GGCCGGTCAG ATCGGCGTGA TGGGCGGCGC CGTGGCCGGG 
GTGCTGCTGC TGGTTTCGAT CCTGTTTGGC GCCCCCATCC TGGCCCTGGT GATGGGCAAG 
CCGTTCGCCG CCGCCGCTCC GATCATGACC TGGCAAGTGG CCGCCGCCGC GATCGGGGTG 
CTGGCCCTGC CGCTGGAACC GATGCTGGTC TCGCTGAACC AAGCGGGAGT CGCCCTGCGG 
GTCCGCGTCG TGGTCTGCGC CGTCTACCTG GCCGCGCTGG TTCCGGTGAT CAAGGCCTTT 
GGCCTGGCCG GCGCCGGCGC CGCCCTGGTC GGAGCCGCCG CGGCCATGGC GGTGGGCATG 
TTCTGGACCC TGCGGCGAAG CCTGGCCCGG CCCACCACCG CCCAAAGCGA TGAACAAACT 
TGCGCCGACA GTAAAAACGG CGCCAAAGGC GTTTCCTGA

Protein sequence

MTHDSKVLKR VVANAGTLLG GRTVNALVSL AYIALTARGL GAVQMGVLVL INAYAQFLGD 
VAKFQSWQTV LQYGAGPLLT GDRPRFQQVL RFTLLLDLIG ASCGVALGVG GALLLGSMFG 
WPRELGPAAA LYALSIAMMT SATSVGLLRL FDRFRFLAGE QAVSSIVRLA GCALAFAFDA 
PIGWFLAAWA AGTVASFFYV MGVAWWDLAR RDLLKGFTIA GPLSEGLPGV WRFAWATNFS 
GTLDTAFTHV ITLVVGGVLG PAQAALWRVG RQVADGMAKP AKLLTPALYP ELAKMRAVGG 
EEAMRKLAGQ IGVMGGAVAG VLLLVSILFG APILALVMGK PFAAAAPIMT WQVAAAAIGV 
LALPLEPMLV SLNQAGVALR VRVVVCAVYL AALVPVIKAF GLAGAGAALV GAAAAMAVGM 
FWTLRRSLAR PTTAQSDEQT CADSKNGAKG VS