Gene Caul_0149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0149
Symbol
ID	5897861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	165940
End bp	167196
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	70%
IMG OID	641560634
Product	ROK family protein
Protein accession	YP_001681785
Protein GI	167644122
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.421428
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAGGGA AGGCCCTTGT CGAAGATCAT CGGGCGCCGT CCTTGGAAAC CTCGCGGAAG 
TCGAACCGGA AGCGCACCTC GGGCGCGAGC CTGTCGGGCG CCAATCTGGA GCGGGTCGGC 
GACCACAATC AGCGGGTCAT CCTGCAGGCC ATCCGGCTGG GCGCCCCGAT CACCCGCGTG 
GCCTTGGCGA AGATCAGCGG CCTGACGCCG CCCGCCGTCG CCAACATCAC TAAGCGGCTG 
CTGGACGACG GGCTGATCCT CGAGGCCGGA CGGGTGCAGG GCGCGCGCGG CCAGCCGGCC 
ATGAACCTGA CGATCAATCC CGACGGCTGC CTGTCGATCG GCGTCAATAT CGACCGCGAC 
CACATCACCG TCGTCATGCT CGACCTGCTG GGCGCGGTGC GGGCCCGGGC CAGCCAGGAG 
ATCGAGTTCC CCCTGCCCGC CGACGTGGCC CGGTTCTGCA AGACCCAGAT CCGCAAGATG 
CTGGCGGCCT GGAAGGGCGA TCCGCCGCGC CTGTCGGGGA TCGGCGTGGC CCTGCCCGAC 
GACCTGGGCC GGGTGGACCT GCCGCACCGG CCAGGCAACT ACGACGTCTG GAGCTCGGCC 
GATGTCGGCA AGCTGCTGGC CGACATCCTG CCCCTGCCGG TGTTCCTCGA GAACGACGCC 
GCCGCCGCCG CCCTCGGCGA GCTGCAGTTC GGCCATGGCC TGCGCAAGCC TAGCTTCTTC 
TATGTCCTGG TCTCGTCGGG CCTGGGCGGC GGCATGGTGG TCGAGGGCGA CTATTTCCGC 
GGAGCCCAGG GCCGTAGCGG CGAGATCGGC TTCCTGCCCG TCCGCTCGCC CAAGACCAAG 
GCCCGGTCGC TGCAGGAGGT GGTGTCGCTC AGCGCCCTCT ACGCCCATCT GGAGGCGGGC 
GGGATCACGG TCGATCGGCC AGACCAGCTG ACCGCGCTGA CCGCCAAGGG CCAGGCCCTG 
GTCGCCGACT GGATCGCCCT GTCCGCCAAG CTGCTGGTCC AGCCGTTCGT GGCGATCAGC 
TGCCTGTTCA ATCCCGAGGC CATCTATATC GGCGGACGCC TGCCCACCAA CCTGATCGAC 
AGCCTCGTCG CGGCGGTCAA CGACCGGCTG GCGCGGGTCG AGGACGTGCC CGCCCTGGCC 
CGCGTCGAAC GCGCCGCCAC CTCGGCCGAC GGACCGGCGG TCGGGGCGGC CCTGCTGCCG 
TTCATGGCCC AGCTCCTGCC CTCGCGAGCG GCGCTGATGA AGACCGGCAG GGCGTGA

Protein sequence

MLGKALVEDH RAPSLETSRK SNRKRTSGAS LSGANLERVG DHNQRVILQA IRLGAPITRV 
ALAKISGLTP PAVANITKRL LDDGLILEAG RVQGARGQPA MNLTINPDGC LSIGVNIDRD 
HITVVMLDLL GAVRARASQE IEFPLPADVA RFCKTQIRKM LAAWKGDPPR LSGIGVALPD 
DLGRVDLPHR PGNYDVWSSA DVGKLLADIL PLPVFLENDA AAAALGELQF GHGLRKPSFF 
YVLVSSGLGG GMVVEGDYFR GAQGRSGEIG FLPVRSPKTK ARSLQEVVSL SALYAHLEAG 
GITVDRPDQL TALTAKGQAL VADWIALSAK LLVQPFVAIS CLFNPEAIYI GGRLPTNLID 
SLVAAVNDRL ARVEDVPALA RVERAATSAD GPAVGAALLP FMAQLLPSRA ALMKTGRA