Gene MCA0654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0654
Symbol
ID	3104680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	686941
End bp	687870
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	62%
IMG OID	637169865
Product	CRISPR-associated Csh2 family protein
Protein accession	YP_113167
Protein GI	53804985
COG category	[L] Replication, recombination and repair
COG ID	[COG3649] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR01595] CRISPR-associated protein, CT1132 family [TIGR02589] CRISPR-associated protein, Csd2 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCAGC TCCCCCAAAA TCGCTACGAC TTCGTGCTGT TGTTCGAGGT CAAAGACGGA 
AATCCCAACG GCGATCCCGA TGCAGGAAAC CTGCCGCGTT TGGATGCGGA AACGGGTCAC 
GGGTTGGTCA CCGACGTCTG CCTGAAGCGG AAAATCCGCA ATTTCGTCGG CCTGACGCAA 
GGCGATGCCG CCCCTTACGA AATCTATGTC AAGGAAAAAG CCGTTCTGAA TCGGCAACAC 
GAGCGAGCCT ATCAGGCATT GGGCGTGGAT TTAGGTGCCG ATGAGGGGAA GCGTAAAGGC 
GGCGATAAGG TCGATGATGC CCGCCGCTGG ATGTGCCAGA ACTTCTTCGA CGTCCGCACC 
TTCGGCGCGG TGATGTCGAC CGGCGTCAAC TGTGGTCAAG TCCGAGGGCC CGTGCAACTC 
ACCTTCGCGC GTTCCATCAG CCCCATCGTT GCCCTGGAAC ACTCCATTAC CCGCATGGCG 
GTTGCCACTG AGGCGGAAGC GGAAAAGCAG GGCGGCGACA ACCGCACCAT GGGCCGCAAG 
CACACCGTGC CCTACGGTCT TTACCGCGCC CATGGCTTCG TGTCGGCCCA TCTCGCCCAA 
CAGACCGGTT TTTCCGAAAA GGATCTCGAA TTGCTCTGGC AGGCGTTGAG CCAGATGTTC 
GACCACGATC ACTCCGCGGC CCGCGGCGAA ATGGCCACGC GGGGGCTCTA CGTCTTCAAG 
CACGTCGGCA CCGATACCGA CCCGGACCAA CGCAAGCAGC AGGCCATGCT CGGTTGCGCG 
CCGGCGCACA AGCTGTTCGA TCTGATCCGA GTGGAACCCA AAGACACCGG CCGGCCGCCG 
CGCGAGTTTG GGGACTACGC GGTCAGCGCG CCGCCCGCCG GGCCGTTGCC GGCGTTTCCC 
GGCGTGGAAC TGATGATCCT CGTGCCATGA

Protein sequence

MNQLPQNRYD FVLLFEVKDG NPNGDPDAGN LPRLDAETGH GLVTDVCLKR KIRNFVGLTQ 
GDAAPYEIYV KEKAVLNRQH ERAYQALGVD LGADEGKRKG GDKVDDARRW MCQNFFDVRT 
FGAVMSTGVN CGQVRGPVQL TFARSISPIV ALEHSITRMA VATEAEAEKQ GGDNRTMGRK 
HTVPYGLYRA HGFVSAHLAQ QTGFSEKDLE LLWQALSQMF DHDHSAARGE MATRGLYVFK 
HVGTDTDPDQ RKQQAMLGCA PAHKLFDLIR VEPKDTGRPP REFGDYAVSA PPAGPLPAFP 
GVELMILVP