Gene Caul_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2074
Symbol
ID	5899529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2220431
End bp	2221444
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	70%
IMG OID	641562563
Product	LacI family transcription regulator
Protein accession	YP_001683700
Protein GI	167646037
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.243502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.538933
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTGT CGCGAGTGAT CAATGATGGC GCCACGGTCC GGGAATCGAC GCGCATGGCG 
GTCCTGGCCG CGATCCGCGA ACTGAACTAC GAACCAAACC TCGCGGCCCG CAACCTCGTC 
ATGGCCGGAG AACTGCGGAT CGGGGTGATC TATTCCAACC CCAGCGCCGC TTTCATGAGC 
GACTTCCTGG TCGGTGTGTT CGAGGAGGCC ACCAGCGCCG GGGCCAGGCT GATCCTGGTG 
CGAGGCGAAA GGGGCCAGGT CCCGACGCCC GAGGAACTGC AGAGGCTCCT GGCGTCCGGC 
GTCCACGGCG TGGTCCTGGC GCCCCCCCTG GGCGATTCAG CCCTCGTGCG CGACATGTTC 
CGCGCCGCCA ATCTGCCCGT CGCCGTGGTC GCCGCGGGAC GGCCGCCGGC CGACGCGATC 
AACGTCCGCA TCGACGACCA CCAGGCCAGC CAGGCCATGG TGCAGCATCT GCTGAATCTC 
GGCCATCGAA GGATCGGTTT CATCGCCGGC AACCCTGACC AGAGCGCCAG CGCCGAGCGC 
CTTGAGGGCG CGCGCGCGGC GATCGCGGCG GTCGAGGGGG CTGAACTCGT CCTGGCCCAG 
GGCACCTTCA CCTACGGTTC GGGTTTGCGC GCCGCCGAGT GGTTGCTCGA TTCCGATCCG 
CCGCCCACCG CGATCTTCGC CAGCAACGAC GACATGGCCG CCGCGGCCGT GTCGGTGGCC 
CACCGTCGGC ACCTCGACGT GCCGCGCGAC CTGACCGTGG TCGGGTTCGA TGACACCACC 
GTGGCCACCA CCCTTTGGCC GCCGCTGACC ACCATACGCC AGCCGGTGCG GCAGATGGCG 
GCCGTGGCCC TGGACCGGCT GATGCGCGCC TTGCGATCGG CCGAGCCCAT GGCCGAAGCT 
TCCGCCGACT ATGTCCTGGG CCACGCTCTC ATCGAGCGCG AGTCCACCGC CCCGCCCCGG 
CGCGCCACCC GGATCGCGGG CGCGAAAACT CACCAGAGGT CATCGCATGC CTGA

Protein sequence

MTVSRVINDG ATVRESTRMA VLAAIRELNY EPNLAARNLV MAGELRIGVI YSNPSAAFMS 
DFLVGVFEEA TSAGARLILV RGERGQVPTP EELQRLLASG VHGVVLAPPL GDSALVRDMF 
RAANLPVAVV AAGRPPADAI NVRIDDHQAS QAMVQHLLNL GHRRIGFIAG NPDQSASAER 
LEGARAAIAA VEGAELVLAQ GTFTYGSGLR AAEWLLDSDP PPTAIFASND DMAAAAVSVA 
HRRHLDVPRD LTVVGFDDTT VATTLWPPLT TIRQPVRQMA AVALDRLMRA LRSAEPMAEA 
SADYVLGHAL IERESTAPPR RATRIAGAKT HQRSSHA