Gene Caul_2062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2062
Symbol
ID	5899517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2199804
End bp	2200850
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	641562551
Product	LacI family transcription regulator
Protein accession	YP_001683688
Protein GI	167646025
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0513684
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACGCTCA AAAAGCCGAC TATCGACGAT GTTGCTCGGC TTTCCGGCGT TGCGCGCGTT 
ACGGTTTCCC GAGTCCTCAA CGGCGGTCCC AACGTGCGTG ACGAGGTCCG TGACAAGGTC 
ATGAAGGCCG TTCGCGCCCT GGACTACAAG GTCAATGTGC AGGCGCGGAC CCTCGCCGGG 
GGCGGCAGCC GGTTGATCGC GTTCATCTTC GCGTCCGACC TCGATGCCGA ACCGAACTCC 
TTCTACCAGT CGGCGCTTGA GTTGGGCGCG CTGCGCGGCT GCCTGGCCTT GGGCTATCAG 
CTGCTGACCC ACCACATTCC CGAACAGGGC GCTGATCGGG TTCGCCTATT GACGGAACTG 
ATCGTGACGC AGCGCTGCGA GGGCCTGATC CTGACGCCGC CGTTCTCCGA CGACGTGGCG 
ATGATCGAGG CGGCCTTGGT CCTGAAGTGC AAGGTTGCGG CCATATCCCC TGGGGGCGCG 
GGCCGCGACC TCGTCGACAG CATCGGCATC GACGACGAGA AGGGCGGCTA CGACATCGCG 
CGTCATCTGC TGGCGCTCGG CCATCGGCGG TTCGCGCTGA TCGCGGGCAT CGCCGGGCAC 
CTTTCCGCCG ATCGCCGCCA TGACGGCGTG ATGCGGGCCC TCGCCGAAAA CGGTCTGGGC 
GAGAAGGACA TCGTCTGGCG GCGCGGCGAC TTCACGTTCC GTTCGGGCGT GGAGCTGGCT 
CCAGGCCTGT TCGACGACCC GCTGGGGGCG ACGGCGCTGA TCTGCGCCAA TGACGACATG 
GCCGCCGGCG CCCTGTCGGC CGCGCATGCC CGCGGGATCG CCGTGCCCAA CGGTCTGTCG 
ATCACGGGCT TTGACGATAC ACCGGTCTCG GCCATCGTCT GGCCGCCGCT CACCACCGTC 
CATCAGCCGT TGAAGGCGAT GGGCGAGCGC GCGGTCGCGC GCCTGGTCCG AAGCCTGGCC 
GGAGGGGCGG GCGTGGAGCT TCTCCCTGCG CACGTCGAGC GGCTGGACCA CCTCGTGGTC 
GCCCGGCGAT CGTCGTCGGC GCCCTGA

Protein sequence

MTLKKPTIDD VARLSGVARV TVSRVLNGGP NVRDEVRDKV MKAVRALDYK VNVQARTLAG 
GGSRLIAFIF ASDLDAEPNS FYQSALELGA LRGCLALGYQ LLTHHIPEQG ADRVRLLTEL 
IVTQRCEGLI LTPPFSDDVA MIEAALVLKC KVAAISPGGA GRDLVDSIGI DDEKGGYDIA 
RHLLALGHRR FALIAGIAGH LSADRRHDGV MRALAENGLG EKDIVWRRGD FTFRSGVELA 
PGLFDDPLGA TALICANDDM AAGALSAAHA RGIAVPNGLS ITGFDDTPVS AIVWPPLTTV 
HQPLKAMGER AVARLVRSLA GGAGVELLPA HVERLDHLVV ARRSSSAP