Gene Caci_4997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4997
Symbol
ID	8336351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5720796
End bp	5721914
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	74%
IMG OID	644958096
Product	transcriptional regulator, LacI family
Protein accession	YP_003115698
Protein GI	256394134
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.385337
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCGT CCGGCGCCGC GCAGACCTGC TCCCGCAAGG CAGGCTCGCC GAACCCGGCG 
CCCACGAACC AGGAGGGTGG AGCCGCCTTG GCCGCACGGC CCGCACGCAC GCCGGCGTCG 
CAGACTCCGA CCATGGCCGA CGTCGCGCTG GTGGCCGGGG TGTCGCACCA GACGGTGTCC 
CGGGTGCTCA ACGACCAGCC GAACGTCCGC GCCGAGACGC GCGCCCGGGT GGTGGACGCG 
ATCCGCGAGC TGGGCTACCG GCCCAACTCC GCGGCGCGGC AACTGGTGAC CCGGCGCTCG 
CAGACCCTCG GCGTCATCAG CTTCGACACC ACGCTCTACG GTCCGGCTTC CATGCTTTAC 
GGCATCGAGC AGGCGGCGCG CGACGCCGAC TACTTCATCA GCATCGTGAG TCTGCGGGCG 
ATGAACCGGA GCTCGGTGCT GGAGGCCGTG GACCGGCTGC GCGACCAGGC CGTGGAGGGC 
ATCGTGGTGA TAGCGCCGCA GACCTCCGCG GCCGGCGTGC TGGCCCAGGC CGCGGCCGGG 
GTGCCGCTGG TCGGCGCCGG CTGCGGCCCG GCCGAGCAGG TCCCGATGGC CGCCATCGAC 
CAGCGCGAGG GCGCCGCCAT GGCCACCCGC CACCTGCTCG ACCTCGGCCA CCGCACGGTG 
CACCACGTCG CCGGCCCGGT CGGCTGGTTC GACGCCACCG GCCGCGCCGA GGGCTGGCGC 
GCCGAACTGG AACAGGCCGA CCGACCGGTC CCGCCGCCCC TGCGCGGCGA CTGGAGCGCC 
CGCTCCGGCT ACGCCGCCGG CCGCGCCCTG GCCGCCGAGC CCGACCTCAC GGCCGTGTTC 
TGCGCCAACG ACCACATGGC CCTCGGCCTG CTCCGCGCCT TCCACGAAGC CGGCCGCCAG 
GTCCCGGCCG AGGTGAGCGT CGTAGGGTTC GACGACATCC CGGAATCGTC GTACTTCACT 
CCCCCGCTGT CCACGGTCCG CCAGGACTTC AGCGAACTGG GACGCCGAAG CCTGGAGCTG 
CTGCTCGAAC GGCTGGAGAA CCCCGCGGCG CCCCCGGCGG AGCAGGTGCT GATCACCCCG 
GACTTGATAG TGCGGGCGAG CGCGCGACCG CCGGCCTGA

Protein sequence

MGASGAAQTC SRKAGSPNPA PTNQEGGAAL AARPARTPAS QTPTMADVAL VAGVSHQTVS 
RVLNDQPNVR AETRARVVDA IRELGYRPNS AARQLVTRRS QTLGVISFDT TLYGPASMLY 
GIEQAARDAD YFISIVSLRA MNRSSVLEAV DRLRDQAVEG IVVIAPQTSA AGVLAQAAAG 
VPLVGAGCGP AEQVPMAAID QREGAAMATR HLLDLGHRTV HHVAGPVGWF DATGRAEGWR 
AELEQADRPV PPPLRGDWSA RSGYAAGRAL AAEPDLTAVF CANDHMALGL LRAFHEAGRQ 
VPAEVSVVGF DDIPESSYFT PPLSTVRQDF SELGRRSLEL LLERLENPAA PPAEQVLITP 
DLIVRASARP PA