Gene Cagg_2286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2286
Symbol
ID	7266699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2789643
End bp	2790722
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	56%
IMG OID	643567116
Product	restriction endonuclease
Protein accession	YP_002463601
Protein GI	219849168
COG category	[V] Defense mechanisms
COG ID	[COG1787] Predicted endonuclease distantly related to archaeal Holliday junction resolvase and Mrr-like restriction enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.227945
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCAA GCTCACGTTC CAGTACAGAA ACTAATCTTC TCGCTTCTTT GCTTAGTATC 
CTCATCGTAT TCAGTCTATT CAGCGGGTTG TCGCTCTGGT GGATAATCAG CCTGATAGTT 
GGTAGTCTCA CAATTGTTTT CTTTATTGCC CGCTCGCTGC ACCATGCACG TGTGCAACGG 
TTGTATCGTC AGCAATTGTT AGCATTATCA CCGAGCGAAT TCGAGCAGCG CATCGCCCTG 
TTGCTTGAAG ATCTAGGGTG GCAGAACGTT GTGGTGCGCG GTGGCAGTGG TGACCGCGGT 
GTTGATATTA CCGCCCAACG AGACGGTTTG CGCTACATTA TCCAATGCAA ACGGTACACC 
AAACCGGTCG GACCCAACTA CGTGCGCGAT CTCGTTGGCG CGCTCCAGAT TCAGCAAGCT 
GACCGAGCCA TTTTGGTGAC GACCAGCACC TTCACCGATC AATCGCGTCT CGAAGCCCGC 
GGGCAAGCTC TCGAATTGTG GGATCATCGA ATACTGTGGC AACGGATCGA AGAGGCCGAA 
CAGCGACGAT TGACCAACCA GCAGCGCCGG AAACGGTCGG TGGCCCTCCC GGTTGCTTTC 
GCGCTTGGTC TCAACCTCGT GGTTGCCGGC ATCGCCTTCA GCATCAGCGG ACCGCCGGTC 
ATCAGCATAG ACCGCATTGG GCAACTGGTG CCGGTTGGAG AAACGAACGG TGAACGTGCG 
ACGTCCCGGT CGTTGGGCAC CAATAGCCCT ACACTACAAT CAACGGTACC TAACCGTCCT 
TCGGTCACAC CACGTCCCAC TCGTACCCCA CAACCAACGG CGACGCCACA ACCGACCTCC 
ACACCGGTAC GACCGACCGC ATCGGTTTTT AATGGTGGGA ACGTGCGCGC TGCACCTAAC 
CTCCAAGGCA CCGTCCTTGA TCAAATTCAC GCCTATGAAA CGGTCATCCT GCTTGGCCGC 
AGTGCCGATG GGGTATGGAT ACGGATTATC AACCCGCGCG GCCAAGAGGG TTGGGTCCAC 
CGCAGCCTAT TGACCCTTGA TCCGGCAATC GCCGAGACAC TGCCGGTGAT CACACCGTAG

Protein sequence

MPSSSRSSTE TNLLASLLSI LIVFSLFSGL SLWWIISLIV GSLTIVFFIA RSLHHARVQR 
LYRQQLLALS PSEFEQRIAL LLEDLGWQNV VVRGGSGDRG VDITAQRDGL RYIIQCKRYT 
KPVGPNYVRD LVGALQIQQA DRAILVTTST FTDQSRLEAR GQALELWDHR ILWQRIEEAE 
QRRLTNQQRR KRSVALPVAF ALGLNLVVAG IAFSISGPPV ISIDRIGQLV PVGETNGERA 
TSRSLGTNSP TLQSTVPNRP SVTPRPTRTP QPTATPQPTS TPVRPTASVF NGGNVRAAPN 
LQGTVLDQIH AYETVILLGR SADGVWIRII NPRGQEGWVH RSLLTLDPAI AETLPVITP