Gene Caci_5389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5389
Symbol
ID	8336743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	6213122
End bp	6214129
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	72%
IMG OID	644958487
Product	transcriptional regulator, AraC family
Protein accession	YP_003116089
Protein GI	256394525
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.112757
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACAGC GCTGGTCGAC GATGGACGTG CCCAAAACCG CGCAGTTCGC GCGCTGGCGG 
GAGCTGATCT GCGAGGCGTT CCTGGCGCTG ACGCCGGAAT CGGACCTGCG CGACGGGTTC 
GCCGGGACGG TGGCCCAGCG GCAGCTGGCC GAGCTGAGCA TCGCGCGCAT CACCTCGCAG 
CGGCAGCACG TGCGGCGCAC GACGCGGGAC ATCGACCGCT CGGCGTATCA GGGTTATTAC 
GTGAACCTCC AGATCCGCGG CAGCAGTCTG ATGACCCAGG ACGGCCGCTC CACCGTGCTG 
CACCCGGGCG ACCTCGCCGT CGTGGACACC ACCCGGCCCT TCGCCTTCGA CTTCCAGGAC 
GACTTCCAGC AGCTCTCCCT CTACGCGCCG AAAGCCTTGC TGCTGCCCGG ATCCGGCACA 
CCGGTCACCA CCGCGACCCG CGTCGCCACC GCCGCCGGTC CCGGCGCCGC CGTCCGCCAC 
GCACTGCTCA GCCTCACCTC CGGCGACCTG TCCGAGGACA CCGCCGCCCG CCTCGCCGCC 
CACGCCTGCG GCATCCTGTC CATCGCCCTG GACCAGCAGA CCGAACCCGA CCCGCGCTCC 
ACTCCCCTGC GCCAGGACCG GCTGCACGCC GCCGCCCTCG CCGACATCGA CGAGCACCTC 
ACCGACGCCG ACCTGTCCGC TGCCGCCGTA GCCGCCCGCC TGGGCGTCTC AGTCCGCCTG 
CTCTACTCGG TCTTCGCCGG CCGCCGCCAC AGCTTCGCCT CCGAAGTCCG CCGCCGCCGC 
CTCGACCACA CCTGGCGCGA CCTCCGGGAC CCGGCGCGCA CCCACCTGTG CGTCATCGAC 
ATCGCGGTGG CGGCCGGGTT CGCCGACGTG ACCAGCTTCC ATCGGGCCTT CCGACGGGAG 
TACGGACGGA CGCCGGCGCA GGTGCGGCGC GCTGCTTTGG GCGGGGTTGC CGATGACGGG 
GATGGCGAGG GGGCGCTGCG GTCCCCCGCG TTGACAAACA TGGCCTGA

Protein sequence

MPQRWSTMDV PKTAQFARWR ELICEAFLAL TPESDLRDGF AGTVAQRQLA ELSIARITSQ 
RQHVRRTTRD IDRSAYQGYY VNLQIRGSSL MTQDGRSTVL HPGDLAVVDT TRPFAFDFQD 
DFQQLSLYAP KALLLPGSGT PVTTATRVAT AAGPGAAVRH ALLSLTSGDL SEDTAARLAA 
HACGILSIAL DQQTEPDPRS TPLRQDRLHA AALADIDEHL TDADLSAAAV AARLGVSVRL 
LYSVFAGRRH SFASEVRRRR LDHTWRDLRD PARTHLCVID IAVAAGFADV TSFHRAFRRE 
YGRTPAQVRR AALGGVADDG DGEGALRSPA LTNMA