Gene Caci_3301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3301
Symbol
ID	8334654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	3643278
End bp	3644273
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	72%
IMG OID	644956446
Product	transcriptional regulator, AraC family
Protein accession	YP_003114049
Protein GI	256392485
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.688791
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTTCGC AAAACTTGCT CGAGCGTTCA GCCGAACCGG TCACCCCGGG CGAAAACGAT 
GATCCCCTGT GCGCCGCCCT GGCCGTCGCC GACGCGCGCG CGGCCATGTC CGGCGCCTTC 
GTCGCGGGCG GCGACTGGGC CGTCCGGCTG CACGCGCCCG ACCGGCTGAA GGTGAACTGC 
GTCATGCGCG GCACCCCGGT CCTGGTCCGC CAGGACACCG GCGAGCAGCT GCGGCTGGCT 
CCGGGCGACG TGATCGTCTC CGACGGCGCG CTGCCTTACG TCCTGTGCAG CGACCCGAGC 
ATCGAACCCC ACCCCTCAGG CTGGCTCGCC ACCGACCCCC GCACCGGATT CCGCCGCATC 
GGCCACGGCG AGGACGTCAT GTGCGTCGCA GGCCACGTCG ACCTGAGCCG CGACGGCGGC 
GGCCTCCTCC GCAGCGCCCT GCCGAACCTG CTGCACATCC CCGGCGACGC CCCCGAAGCC 
ACCCCCCTGC GCCGCCTGAT CGAGCAACTC CTCGACGAGA TGACCACCCG CCGCCCCGGC 
GCCCCAGCCG CCATGGACCA CATCGCCCAA CTGATCTTCC TCCACGTCCT CCGCATCAGC 
CTCACCACCA CCGCCACCCT CCCCCCAGGC TGGCTCCGCG GCCTCGCCGA CCCCCGCATC 
TCCCCCGCCC TCCACCTCAT GCACCGCGAC CCAGCCCGCC CCTGGCGCCT CGAGGAACTG 
GCCCAAGCGG CAGCACTGTC CCGAACAGCC TTCGCAGTCC GCTTCCGCGC CACCGTCGGC 
GTTCCCCCAC TCACCTACCT CCTCACCTGG CGCATGAGCC TGGCCGCCCG AGCCCTACGC 
CGCGACACCA CACCGGTCGC GGTCCTGGCG CGCGAGGTGG GCTACGGCTC CGAGAGCGCG 
TTCAGCAACG CTTTCAAGCG CGCGGTGGGA ACCTCGCCTC GGAACTACCG GAACCGGAGC 
TCGGTGGGCG GGGACGCGGA GGCGGAAGCA GGGTAG

Protein sequence

MSSQNLLERS AEPVTPGEND DPLCAALAVA DARAAMSGAF VAGGDWAVRL HAPDRLKVNC 
VMRGTPVLVR QDTGEQLRLA PGDVIVSDGA LPYVLCSDPS IEPHPSGWLA TDPRTGFRRI 
GHGEDVMCVA GHVDLSRDGG GLLRSALPNL LHIPGDAPEA TPLRRLIEQL LDEMTTRRPG 
APAAMDHIAQ LIFLHVLRIS LTTTATLPPG WLRGLADPRI SPALHLMHRD PARPWRLEEL 
AQAAALSRTA FAVRFRATVG VPPLTYLLTW RMSLAARALR RDTTPVAVLA REVGYGSESA 
FSNAFKRAVG TSPRNYRNRS SVGGDAEAEA G