Gene Caci_1410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1410
Symbol
ID	8332749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	1603255
End bp	1604541
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	62%
IMG OID	644954558
Product	sigma-70 region 4 domain-containing protein
Protein accession	YP_003112174
Protein GI	256390610
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000424388
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0278593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTAT GGAAGAGTCT CTCGCCACGG GACCAAGCCT TGCACTCGCG TCGGGCCTCT 
GGCGAGACTC TGGATTCGAT TGGACAGTCC TATGGGCTTT CGCGCGAGCG AATCCGCCAG 
CTGATCAGCC GCGGCGAGAA GTCTTGGGTC GACCAGGTCG ACGCGCTTCG ACCAGGGTGG 
CGTGCGAGCG TTAGACAGAG GTTCGCGGTG AGGCCTGTCG TCGCCGAATC CGACTTCGCC 
GATATTCTTC CGGACTCGGT CGGCATCGTA CGGGGGACGC TACTCCGCGC TGCGGGCGCT 
GACCGCGCCC GGACGTGGGC TGGACCTATC GATGGGATTT GGTCGATGGA CCCAAGTGGT 
CTCGCCGCAC AACTACGTGA CTTGATCGCG TTGGCTCCGT TCACAGACGA CGACTTGGAC 
ACCGCCGCGG CGAATCTCGA GTTTCCAGAG AACACTCCGT TGCGAGCCAT CCTCACCCAT 
TCGCGCAGCC CTCTGGTGCG GGGCCCTCAC GATTACTGGC TGCGACGTAA CGCTAGAGCG 
CGAGACGCCA GCTACCTCTG GCTGCTTTCT GAGGGCGAGC CGCGGAGAAT CGAACCAATC 
GTGATGGCTG TCGGGGGTAA CCGCAACGCT GTCGCCGAGG CGATGCGTCG TGACAGCCGT 
TTCCGGCAAT TGCGCCCCGA GGGCACGTGG GCCCTAACGG ACTGGCACGT TCCAGGCGCG 
ACCGAATACA CGAACGCGAT GGATGTCGTT GTCGACGTAC TCACAGAGCG AGGACCGATC 
ACACGGAAGA ACCTGATCGC AGAGGTCGTA CGCCGCTATC CGGTGAGTGC CGCACGCGTT 
GTGCAGTGTC TCATTGGGGT ACGCGTCGGT ATCCATCGAG ACGGCCGGTT CGATCTGGTC 
GAACGCGGGG CTAGTCCATA TGAGGAATCT GAGCCGCGAA GGCCGCGGAA CATCATCATC 
GATGAGGCCG GGAACATCGC GGGTGTCCTA TTGACAGTAG ACAGGGAAGT CTTGCGGGGA 
AGCGGGGTCA TCGTCCATCC GTGGCTCACA TGGCACCTCG GATTACGTCG GGCACCGATG 
ACCCGACGAT TCTCCGTCCC GGGAGGCGAC GGAGATGTGA TCACCGTCAG CCGTCATACA 
AGCGGGGCAC AGTTCTCGAG CATGAAGTCT TTTGTGGACG ACATGGGCCT AGCCATAGGT 
TGCCAGTTCG CCGTGCTTCT CCGCCTCGAC GAAGAGACAG CGTCGGTACG ACACACGTGC 
AAACCCGATA CCTGCACGGC GAGCTGA

Protein sequence

MALWKSLSPR DQALHSRRAS GETLDSIGQS YGLSRERIRQ LISRGEKSWV DQVDALRPGW 
RASVRQRFAV RPVVAESDFA DILPDSVGIV RGTLLRAAGA DRARTWAGPI DGIWSMDPSG 
LAAQLRDLIA LAPFTDDDLD TAAANLEFPE NTPLRAILTH SRSPLVRGPH DYWLRRNARA 
RDASYLWLLS EGEPRRIEPI VMAVGGNRNA VAEAMRRDSR FRQLRPEGTW ALTDWHVPGA 
TEYTNAMDVV VDVLTERGPI TRKNLIAEVV RRYPVSAARV VQCLIGVRVG IHRDGRFDLV 
ERGASPYEES EPRRPRNIII DEAGNIAGVL LTVDREVLRG SGVIVHPWLT WHLGLRRAPM 
TRRFSVPGGD GDVITVSRHT SGAQFSSMKS FVDDMGLAIG CQFAVLLRLD EETASVRHTC 
KPDTCTAS