Gene Caci_5761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5761
Symbol
ID	8337122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	6659007
End bp	6660098
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	71%
IMG OID	644958865
Product	transcriptional regulator, LacI family
Protein accession	YP_003116460
Protein GI	256394896
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.230872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.079116
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGG CCGATTCCGA CGGCGCTGTC CTGATGCCGC GCATCGATCA GACCGGAGCC 
GCTGTGGGCG ACAGCAGCCT CACCGACGTC GCCGTGCGCG CGGGGGTCTC GACGGCGACG 
GTCTCGCGGG CGCTGCGCGG GCTGCCGTCG GTGACCGAGG AGACGCGGGC GCGGATCAAG 
GCGGTCGCCG ACGAACTGGG CTATGTGGTC TCCCCCAGCG CGTCGCGGCT GGCCACCGGG 
CGCACGCACA CCGTCGGCGT CATCGTGCCC TCCATCGACC GCTGGTTCTC CGGCCAGGTC 
ATCAAAGGAG TCGAGCAGGT CCTCCGCGCC GCCGGCTACG ACCTCCTGTT CTACAACCTC 
GGCGACGACG AAGGCCGCGC CCGCTTCTTC GAGGCGATGC CCCTGCGCCG CCGCGTGGAC 
GCGGTCCTGG TACTTTCCGT GCCCCTGCAG GACCCCGAAG TCGCCAAACT GCGCTCCCTG 
CACCTGCCGA TCGGCCTGGT GGGCGCCTCA GCCGACACCT TCTCCAGCGT CCGCATAGAC 
GACCTCGCCG GCGCCGCCAC CGCCGTCCGC CACCTGATCG GCCTCGGCCA CCGCGACATC 
GCCCTGATCT CCGGCGGCAC CGACGTCCCC CCGCACTTCA CCACCCCCAC CGACCGCCGC 
CGCGGCTACC TGGACGCCCT GGCCGCATCA GGCATCGGCT ACGACCCCGC CCTCGAAGCC 
GCCGGCGATT TCACCATCAC CGGCGGCGAA CGCGCCATGA GCCACCTCCT GGGCCGCCCC 
CACCACCCCA CCGCCGTCTT CGCCCTCTGC GATGAAATGG CCTTCGGCGC CATGCGCGTC 
CTGCGCACAT CAGGCCTCCG CATCCCCCGC GACATCTCCG TCATCGGCTT CGACGACCAC 
GAAATGTCCG ACCTCCTCGA CCTGACCACC ATCAGGCAGC CGGTGGTGGA ACAGGGCGCG 
ACAATCGCCC GCCTCCTCCT GGACCGCCTA TCAGCAGAGG CACACACCCG CCCGCACCAG 
AACGAGGTCT CGCTGCCGAC ACAGTTGGTA GTGCGCGGCA GCACGGCGCC GAGGCGCGCC 
CGACGCGCCT GA

Protein sequence

MSTADSDGAV LMPRIDQTGA AVGDSSLTDV AVRAGVSTAT VSRALRGLPS VTEETRARIK 
AVADELGYVV SPSASRLATG RTHTVGVIVP SIDRWFSGQV IKGVEQVLRA AGYDLLFYNL 
GDDEGRARFF EAMPLRRRVD AVLVLSVPLQ DPEVAKLRSL HLPIGLVGAS ADTFSSVRID 
DLAGAATAVR HLIGLGHRDI ALISGGTDVP PHFTTPTDRR RGYLDALAAS GIGYDPALEA 
AGDFTITGGE RAMSHLLGRP HHPTAVFALC DEMAFGAMRV LRTSGLRIPR DISVIGFDDH 
EMSDLLDLTT IRQPVVEQGA TIARLLLDRL SAEAHTRPHQ NEVSLPTQLV VRGSTAPRRA 
RRA