Gene Caci_4142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4142
Symbol
ID	8335496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	4682230
End bp	4683186
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	72%
IMG OID	644957245
Product	transcriptional regulator, AraC family
Protein accession	YP_003114847
Protein GI	256393283
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00637596
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.887483
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGACGG CCCGCCTGCG CCGCATCGCC GTCCTCGTCC TGGAAGGTGC CAAGCCGCTG 
GATGTCGGCA TTCCCGCGCA GGTGTTCACC ACGCGCGCGA GCATGCCGTA CGAGGTCCGG 
GTGTGCGGTG CCGCGCCCGG GCTGGTGACC GGCGGCGACG GGTTGGCGTA CCACGTCGCG 
CATGGTCTGG AGGCGCTGGC GTGGGCGGAC ATCGCCTTCA TCCCCGGCTA CCGCGCTCCC 
GACCGCGACG ATCCGCCGCC GGCCGTCGTG GCGGCACTGA TCGCCGCGCA CGAAGGGGGC 
ACGCGGCTCG CCGCGATCTC CACCGGGGCG TTCGCTCTGG CCGCGACCGG GCTGCTCGAC 
GGCAAGCGCG CCACGACCCA CTGGCACTAC ACGCGCACAC TCGCGCAGAA GCATCCGCAG 
ATCCGCGTCG ATGAGAACGT CCTGTTCGTC GACGAAGGCA GTGTCCTGAC ATCGGCCGGC 
GCCGCGTCGG GCATCGACCT GTGTCTGCAC ATCCTGCGCG GCGACCTCGG GGTGTCGGCG 
GCGAACCACG CGGCGCGCCG GCTCGTCGCC GCGCCGTATC GCAGCGGCGG GCAGGCGCAG 
TACGTGCCGC GCAGCGTGCC CGAACCGCTC GGCGAACGCT TCGCAGCCAC GCGCGAATGG 
GCTCTGCGTC GACTCGGCGA TCCGCTGAGT CTGGAATCCC TCGCCGAACA CGCGGCGGTC 
TCCCCGCGTA CGTTCTCCCG GCGTTTCATG GAGGACACCG GCTACACGCC GATGCAGTGG 
GTCACGCGTG CCCGCGTCGA CCTGGCCCGC GAGCTGCTGG AGCGGTCGCA GCGCAGTATC 
GAGCAGATCG CGAACGACGT CGGGCTCGGG ACCGGCACGA ACCTGCGGGC GCATTTCCAG 
CGGATCCTCG GCACGACGCC GAGCGAGTAC CGGCGGACCT TCACGCGCGG CGAGTAA

Protein sequence

MPTARLRRIA VLVLEGAKPL DVGIPAQVFT TRASMPYEVR VCGAAPGLVT GGDGLAYHVA 
HGLEALAWAD IAFIPGYRAP DRDDPPPAVV AALIAAHEGG TRLAAISTGA FALAATGLLD 
GKRATTHWHY TRTLAQKHPQ IRVDENVLFV DEGSVLTSAG AASGIDLCLH ILRGDLGVSA 
ANHAARRLVA APYRSGGQAQ YVPRSVPEPL GERFAATREW ALRRLGDPLS LESLAEHAAV 
SPRTFSRRFM EDTGYTPMQW VTRARVDLAR ELLERSQRSI EQIANDVGLG TGTNLRAHFQ 
RILGTTPSEY RRTFTRGE