Gene Mhun_1375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mhun_1375
Symbol
ID	3923370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanospirillum hungatei JF-1
Kingdom	Archaea
Replicon accession	NC_007796
Strand	-
Start bp	1573758
End bp	1574657
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	49%
IMG OID	637897012
Product	CRISPR-associated Cas1 family protein
Protein accession	YP_502834
Protein GI	88602656
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03638] CRISPR-associated endonuclease Cas1, ECOLI subtype

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00127759
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.582034
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCCTA CTCTCCCCGA TATAAAGCCG ATTCCGATAA AAGAGCGTTC TTCGGTGGTA 
TTTCTTGGTA GGGGAGAATT GGATGTTATT GATGGTGCGT TTGTTCTGGT TGATACGAAT 
GGGATCAGGA TGCAGATTCC TGTCGGTGGC CTTGCATCGC TGATGCTGGA ACCTGGGTCA 
CGGGTTTCCC ATGCAGCGGT CTCTCTTGCA TCGAAAGTTG GTTGTCTGCT TGTTTTTGTA 
GGTGAGGGTG GTGTTCGTCT CTATTCTGTT GGTCATCCCG GGGGTGCCCG ATCAGATCGT 
CTTTTGTACC AGGCACGTCT TGCTCTTGAT GAGGTATTAC GGCTAAAGGT TGTGAAGAAG 
ATGTTCTCTC TCCGGTTTGG AGAGGATTTT TCTGATGCAT ATTCTGTTGA ACAGTTACGG 
GGACTTGAAG GGGTTCGTGT CAGGGAAGGG TATCGTAAGA TTGCAAGAGA TACTGGTGTC 
ATCTGGAATG GCAGGCGATA TGATCCTCAT TCCTGGGGGA GTGCTGATCT TCCGAATAGA 
TGTCTTAGTG CAGCAACCGC CAGTTTATAT GGGATTTGTG AGGCTGCTGT TCTTGCTGCA 
GGGTATTCTC CTTCTATCGG GTTCTTACAT ACGGGAAAGC CGCTTTCTTT TGTGTATGAT 
ATTGCAGACC TTTTCAAATT TGAAACGGTT GTCCCTGCAG CGTTTAAAAC GGCTGCATTA 
AATCCCAGGG AGCCTGAGCG TGAGGTCAGG TATGCCTGCC GCGATTTATT CCGGGAAACA 
CAACTCCTCA AGAGGATTAT TCCAACGATT GAGGAGGTGC TGACAGCTGG TGGCATTTCT 
GCGCCTGCTC CTCCTGACTG GGTTGTTCCA CCGGCGATTC CTGTTGATGA GGAGGGATGA

Protein sequence

MTPTLPDIKP IPIKERSSVV FLGRGELDVI DGAFVLVDTN GIRMQIPVGG LASLMLEPGS 
RVSHAAVSLA SKVGCLLVFV GEGGVRLYSV GHPGGARSDR LLYQARLALD EVLRLKVVKK 
MFSLRFGEDF SDAYSVEQLR GLEGVRVREG YRKIARDTGV IWNGRRYDPH SWGSADLPNR 
CLSAATASLY GICEAAVLAA GYSPSIGFLH TGKPLSFVYD IADLFKFETV VPAAFKTAAL 
NPREPEREVR YACRDLFRET QLLKRIIPTI EEVLTAGGIS APAPPDWVVP PAIPVDEEG