Gene Mpal_2165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2165
Symbol
ID	7270250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2299187
End bp	2300170
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	58%
IMG OID	643570781
Product	CRISPR-associated protein Cas1
Protein accession	YP_002467186
Protein GI	219852754
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.770952
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCCAA GATCCTGCAG TAAGCTCCCC TGGCTGGTCG TGTCAGGCTA CGGTGCCCAT 
ATCAAGTCTA CTCCCCGTTT ACTTATCGTT CAGAAGAATG GGACCACCAC CGAGTACCCG 
ATCGGAGATG TGCACCACCT GCTGGTGGTC GGTGGGCATA CGATCCATTC GGCAGTGTTG 
CAGCATATGC AGAACGCAGG AAACTGGGTC TCTTTCTTCG CAGCTGACGG CACCCCCGTC 
GGGCTTATCC GACCCCCTGA AGACAGGGTC GATGAACAGG TCCGTGCCAT CCAGCGGCAT 
GCCCCTGCCC ACAGTTATGC ACTCGGGATC ACCAGAGCCG CACTTGGGAG AAGACTGCAG 
GTGATCGGAG AGACGACCGT GGTCACCGGG GAGAGCCCGC TCTATCAGGG GGAACTGGAG 
GTACTGCAGG ACGCGCGGCA GGAACTCGAA TACCTGGTCA CTCTCGATGA GATACGCAGG 
CTCCACCGGC TGGCCACCGA CATGTACTAT GAGATCATGG CCCGCACGAT CCCCAAAGGA 
ACCGGGTTTC GGCGGAGGAC AGCCCGGCCG TACATGGATC CCGTAAACAC GATGCTCTCG 
TTCTCATATG GGATTCTCTC CGGAGTCTGC GCCGTTCATC TGGCAGGAGC ACACCTGGAT 
GCCAATATCG GCCTGCTTCA CCAGGGGGAA CGAGCACTAG TGAGGGATCT TACAGAACTC 
TTTAAACCGC AGATGGTCGA CCAGCCCATC TTCGCCCTGG TCAGACAGGG GATCACTGCA 
AGCGATTATG AGATTGGGGA GAGCCGGTGC ACCCTCTCGG ACGCACTGAT CCGGCGAATG 
CTACTGCACC TACAGACATC GATTGAAGTG ACAGCGATCG GCAGACAGGT AGAGATGCTC 
GCCGATGCGC TGATCAGGAA TCGCGAATTC CAGATCCTCG ACCCTGCAGA GTTCTTACCC 
CGCATCCCCC TGAAAAACCA TTAA

Protein sequence

MSPRSCSKLP WLVVSGYGAH IKSTPRLLIV QKNGTTTEYP IGDVHHLLVV GGHTIHSAVL 
QHMQNAGNWV SFFAADGTPV GLIRPPEDRV DEQVRAIQRH APAHSYALGI TRAALGRRLQ 
VIGETTVVTG ESPLYQGELE VLQDARQELE YLVTLDEIRR LHRLATDMYY EIMARTIPKG 
TGFRRRTARP YMDPVNTMLS FSYGILSGVC AVHLAGAHLD ANIGLLHQGE RALVRDLTEL 
FKPQMVDQPI FALVRQGITA SDYEIGESRC TLSDALIRRM LLHLQTSIEV TAIGRQVEML 
ADALIRNREF QILDPAEFLP RIPLKNH