Gene Caci_3026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3026
Symbol
ID	8334377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	3343854
End bp	3345512
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	66%
IMG OID	644956172
Product	HNH endonuclease
Protein accession	YP_003113776
Protein GI	256392212
COG category	[V] Defense mechanisms
COG ID	[COG1403] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.409509
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0700786
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGTCA GCAAGCGCCT CCGCTACGAA ATCCTCCGGC GCGACAATCA CACCTGCCGG 
TATTGCGGCG CCACCGCACC GACCGTCCCG CTGCGCGTCG ACCACGTCGT TCCTGTCGCT 
CTCGGCGGCA CCGACGACGC CACCAACCTC GTCGCCTCGT GCGAGCCCTG TAACAGCGGC 
AAGACGTCCA CCGCCCCTGA CTCCCCACTG GTTGAGCAGG CACGCGAAGA CGCCATGCGC 
TGGCAGATGG CGTGGACGGT TGCAGTCGCC GAAGCCGAGA CCGAGGGCAA GCAGCGCGCC 
AAGGACATCG CCAAGGTCAA GAAGAACTAC GTCGCCGCCT ACAAGGGGCG GCACGGACAT 
GCACCGATCC TTCCCGAGGG CTGGGAGGCG TCCGTCGGGC GGTGGCTCGA CCTCGGGCTG 
CCGCTGACGC TCATCGACAA GGCCATCGCA TCCGCTGTCG GGCGAACCTA CGTTCCCGCC 
AAGGACCGGT TCGCCTACTT TGCCGGCTGC TGTTGGAGCC TTCTCCGGGA GCTGAAGGAC 
CGCACCGAGG CCATCGCCAT GCAGGCTTCG CCGACAACGC AGGATGAGCA AGGCGACGGA 
CAATGCGAGT ACTGCGACGG CGGACAGGAT GATCGCAACA TCGTCGAGTA CGCCACGGAC 
GTCTTCGCAG AAGCGTGGTC CCAGGACGAA GAACCCAACT CATACTGCCG CCGCATGCTG 
GCCGCTTATG CAAGCGCGGC GAGCGGCGCC GGCTACGACA GGCTCTCCAT CGGATATGCA 
GTTCACCAGG CCGCTCGCGA CGGGCACGCC GATATCGGCG CCTACCTCTC GACCCTTGAC 
GATGTCCTTG AGCGAGCGTC CGAACCCATC ATCGACAGCC CTTTCGGATC CCGCGTCATC 
GATGCAGACC TGCTGCCCAC AGACGAAGAT CGCGCCGCAC GCGCCGTAGC GGAAGCTGTA 
GTCGCGGCCT GGCGCGCGTC GTGGCGGGAC GCCATGGAGC ATCCTCCCCC TGGACGCCGC 
AGCACCGAAG CTTGCGCTGT TCGCGACTAC GCATTGGCCA CCTACCGCAA GACCGAGAAC 
GCTCATGAGT TGCTGCGCGC TGCCGAGTTC GCAGGCGCGG AAGGCAACAG CAACCTCCCA 
CAGGCAACTG CTCATGCGGA GGCGTACTAC GCCACCGAAC CGGCCGTCTC CGCATGGGGC 
TGGGCGTGGT ACAAGGCGAC AGGCTTGGAC GCGCCAGGGT CGGTTCACGA AAGCGTGTGG 
GCCGATTGCC GCACACTGCA CGCGAGTGGC GCCTGGGATC ACAAAATCAC CCTTGCCGCG 
TCATTCGCGG GCGCACACGC AACGACACGT ATGCACTTCG GACTTGACGC CAATGAGGCC 
GAGCTGATCG GCGTGGAGGC TACCACCCAG CGCATCGAGG ACTACTGGGC CCGTTCCTGG 
AATGAATCCA GCCACTCGTG GCCGGGCGAA GGAGACCGCG CAGCGCTCCG AGCATGCCTC 
TCGTCCATCG CTGACGGCAA GGCACACACG GTCGGGGACG TAACCGCTGC CGCTGTTGCC 
GCGGGCGCCT ACCAGAGTGC CGACCTCTAC CCGAGCCTCA CGCGCTCGCA GTCCACGTTC 
GTTGCCGCGG CCCACCTGCC GCACCTGGGA GGTGAATAA

Protein sequence

MAVSKRLRYE ILRRDNHTCR YCGATAPTVP LRVDHVVPVA LGGTDDATNL VASCEPCNSG 
KTSTAPDSPL VEQAREDAMR WQMAWTVAVA EAETEGKQRA KDIAKVKKNY VAAYKGRHGH 
APILPEGWEA SVGRWLDLGL PLTLIDKAIA SAVGRTYVPA KDRFAYFAGC CWSLLRELKD 
RTEAIAMQAS PTTQDEQGDG QCEYCDGGQD DRNIVEYATD VFAEAWSQDE EPNSYCRRML 
AAYASAASGA GYDRLSIGYA VHQAARDGHA DIGAYLSTLD DVLERASEPI IDSPFGSRVI 
DADLLPTDED RAARAVAEAV VAAWRASWRD AMEHPPPGRR STEACAVRDY ALATYRKTEN 
AHELLRAAEF AGAEGNSNLP QATAHAEAYY ATEPAVSAWG WAWYKATGLD APGSVHESVW 
ADCRTLHASG AWDHKITLAA SFAGAHATTR MHFGLDANEA ELIGVEATTQ RIEDYWARSW 
NESSHSWPGE GDRAALRACL SSIADGKAHT VGDVTAAAVA AGAYQSADLY PSLTRSQSTF 
VAAAHLPHLG GE