Gene Caul_0295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0295
Symbol
ID	5897569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	329841
End bp	331646
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	71%
IMG OID	641560779
Product	PTS system, N-acetylglucosamine-specific IIBC subunit
Protein accession	YP_001681930
Protein GI	167644267
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific [COG1264] Phosphotransferase system IIB components
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR01998] PTS system, N-acetylglucosamine-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.116012
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTCGC CGCTCGAATT CCTCCAGCCC CTGGGCCGCG CGCTGATGCT GCCGATCGCC 
GTCCTGCCGG TGGCGGCGCT GCTGCTGCGG ATCGGCCAGG ACGACCTGCT GGGCCGCGCC 
GCCCTGGCGG CGATGTCCGG CGGTGTGACG CTGCTGGTCG CCAACGTCTT CGCCGCCGCC 
GGCGGGGCGA TCTTCGGCAA TCTGGGCCTG ATCTTCGCCA TCGGCGTCGC CGTCGGCCTG 
GCGCGCGAGA ATAACGGCGC GGCCGGCCTG GCCGGGGTGG TGGCCTATCT GGTGGCGACG 
AAGGGCGTCG AGGCCCTGAT CGTCGTGCCG CCGGACGTGG TCGCCGCCGC GGCCGTCGAC 
ACCGTGAAGG GCGCGTCGGA CCTAGTCGTC GCGGCCTGGA AGGCCAAGGC GATCAGCAAG 
CTTTCGATCC CGGTCGGCAT CCTGTCGGGC CTGATCGGCG GGGTGTTCTA CAACCGCTAC 
AGCACGATCA AGCTGCCCGA ATACCTGGCC TTCTTCGGCG GCCGTCGCTT CGTGCCCATC 
GCCGCCGGCC TGGCCGGGGT GCTGCTGGCC CTGGTGTTCG GCTTCGGCTG GCATTGGCTG 
GAGGCCGGCG TCGACGGCCT GACCCACATA GTCACCGTCT CGGGCAATCT CGGCCTGTTC 
GTCTATGGCG TCCTCAATCG CCTGCTGATC GTCACCGGCC TGCACCACAT CCTCAACAAC 
GTGGTCTGGT TCATCCTGGG CGACTTCCAC GGCGCGACCG GCGACCTGAA CCGTTTCGCG 
GCCGGCGACC CGACCGCCGG GGCGTTCATG AGCGGCTTCT TTCCAGTGAT GATGTTCGGC 
CTGCCGGCCG CGTGCCTGGC GATGTTCCAC ACCGCCCGTC CCGAGCGGAA GAAGGCGGTC 
GGCGGCATGC TGACCTCGCT GGCCCTGACC TCGTTCCTGA CCGGCGTGAC CGAGCCGATC 
GAGTTCAGCT TCATGTTCCT GGCCCCGGTG CTCTACGCCG TACACGCCGT GCTGACCGGC 
CTGTCGATGG CCCTGATGAA CATGCTGGAC GCCAAGCTGG GCTTCGGCTT CTCGGCGGGG 
CTGTTCGACT ATGTTCTCAA CTTCAACAAG GCCACCCGCC CGCTGTGGCT GATCCCGATC 
GGGGCGATCT ATTTCGGCGT CTATTACGGC CTGTTCCGCT TCTTCATCCA GAAGTTCGAC 
CTGAAGACCC CGGGCCGCGA GCCGGCCGAG GACCTGATCG TCGAGGCCGT CGCCCCCAGC 
GCGGGCGGAC GCGGGGCCGA CTTTCTCGCC GCCCTGGGTG GGGCGGGAAA CCTGGTGTCG 
GTCGACGCCT GCACCACCCG CCTGCGCCTG ATCGTCGTCG AGCAGTCGGC GGTCAGCGAA 
CCGGCCCTCA AGGTCCTGGG CGCGCGGGGC GTGGTCAAGC CGTCGGACAA GGCCCTGCAG 
GTGGTGCTCG GCCCGATCGC CGACCAGGTG GCGGGGGAGA TTCGCGCCGC CATGGGCGCG 
CCGGCGCCCG CCCAGCTGGT GACGACGGCC GCCACGGCTC CCGCCGCCCT GCCGACCGCC 
GCCGACGACG GCCGGGCAGA GGCCCTGGTG TCGGCCCTGG GCGGCTCGAC CAATGTCGAG 
GCTGTCGGCG CCTGCTCCAG CCGCCTGCGT TTGGTGGTCC GCGACAGCGC CGCCGTCGAC 
GAGGCGGCGC TGCTGGCCGT GGACTCGAGG GGCGTGGTCC GGGTCGGCGA GCGCGCCGTG 
CACGTGGTGC TGGGTCCCGA CGCCGAGCGG ATCGGCGAGG CGGTGCGCTG CCTGTTGCCG 
GGATGA

Protein sequence

MKSPLEFLQP LGRALMLPIA VLPVAALLLR IGQDDLLGRA ALAAMSGGVT LLVANVFAAA 
GGAIFGNLGL IFAIGVAVGL ARENNGAAGL AGVVAYLVAT KGVEALIVVP PDVVAAAAVD 
TVKGASDLVV AAWKAKAISK LSIPVGILSG LIGGVFYNRY STIKLPEYLA FFGGRRFVPI 
AAGLAGVLLA LVFGFGWHWL EAGVDGLTHI VTVSGNLGLF VYGVLNRLLI VTGLHHILNN 
VVWFILGDFH GATGDLNRFA AGDPTAGAFM SGFFPVMMFG LPAACLAMFH TARPERKKAV 
GGMLTSLALT SFLTGVTEPI EFSFMFLAPV LYAVHAVLTG LSMALMNMLD AKLGFGFSAG 
LFDYVLNFNK ATRPLWLIPI GAIYFGVYYG LFRFFIQKFD LKTPGREPAE DLIVEAVAPS 
AGGRGADFLA ALGGAGNLVS VDACTTRLRL IVVEQSAVSE PALKVLGARG VVKPSDKALQ 
VVLGPIADQV AGEIRAAMGA PAPAQLVTTA ATAPAALPTA ADDGRAEALV SALGGSTNVE 
AVGACSSRLR LVVRDSAAVD EAALLAVDSR GVVRVGERAV HVVLGPDAER IGEAVRCLLP 
G