Gene Noc_2688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2688
Symbol
ID	3704445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3044928
End bp	3046391
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	53%
IMG OID	637739170
Product	restriction endonuclease S subunits-like
Protein accession	YP_344671
Protein GI	77166146
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.165356
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGGTT TGGTTGATAC GAATTTGGCT ACGCAAGCGG CGACTGGATC GCCCGATCAG 
GGCGGGGCTA GTGCGGGTGG CATTCCGAAG TATCGGGAGT ACAAGAATTC AGACGTAGTT 
TGGATTGGTG AAGTACCAAG CTTCTGGGAG GTCAAACCGT TCAAATGGCT GCTCACCCAT 
AACGAAGGAG GCGTGTGGGG CGATGACCCA GCAGGCGAAG GTGACACGAT TGTCCTGCGC 
TCCACCGATC AAACCGTTGA TGGCAACTGG AATGTCACCG ATCCTGCCGT CCGCCACCTC 
ACCGTCAAAG AAAATGCCTC TGCGGTTCTT GAGGCGGGTG ACTTGGTTGT AACAAAATCC 
AGCGGCAGCG CTTTGCACAT CGGCAAAACA ACGTTGGTAA ACGTTGACAT GGCAAAACTA 
GGTTATTGCT ATGGAAATTT CATGCAAAGG CTAAGGCTTG GCCAAAAGTA TATTCCCAAG 
CTAGCTTGGT ATGTCATGAA TAATGACTTG GTTAGGTTGC AATTGAACTT GCTATCAAAC 
TCAACAACTG GGCTTGCAAA TCTGAACGCT ACGTTGATTG GCGAGATTTT GCTGCCGGTT 
CCCCCTGTTG AAGAACAAAC CCAAATCGCC CGCTTCCTCG ACCACGAAAC CGCCCGCATC 
GACGCACTGA TTGAAGAGCA GCAGCGTCTG ATTGAACTGC TCAAGGAAAA GCGCCAGGCC 
ATCATCTCCC ACGCTGTCAC CAAGGGCCTG GACCCCACCG TGCCGATGAA AGACTCCGGC 
GTGGAGTGGC TGGGCGAAGT GCCGGCGCAT TGGATTACCA AGCCGCTGAA GCATCTGGCT 
GAGCTGAACC CGAAGAAATC AGGCTACCAC GGCGATCGGG ATGAGCTTTG CAGTTTCGTT 
CCAATGGAGA AGTTGAAGAC TGGTGTTATT CAACTGGATG AGGAGCGATT CATTGCCGAT 
GTAATTTCTG GCTACACCTA CTTTGAAGAT GGCGATGTGC TGCAGGCGAA AGTCACACCA 
TGTTTTGAGA ATCGAAACAT CGCTATAGCT GATGGTTTAA CAAATGGTGT GGGTTTTGGG 
TCGAGTGAAA TCAACGTATT AAGGCCGTTC CCAGACGTTA ACGCATCATT TCTCTACTAC 
CGGCTGCAAG AAGATGGCTA CATGGGAATT TGCACTGCGT CGATGATTGG CGCGGGCGGT 
CTAAAACGAG TGCCAGGTGA AGTCATAAAT GGTTTCACGG TAGCCGTTCC CGAACGCCAC 
GAGCAAACCC AAATTGCCCA TTTCCTCGAC CACGAAACCG CCCGCGTGGA CAAATTGGTC 
GAAGAGGCAA ACGTTGGCAT TGAACTCCTG AAAGAACGCC GCTCCGCCCT GATCTCCGCC 
GCCGTCACCG GAAAAATCGA CGTGCGCGGT TGGCAGCCGC CGGCCAGCGC GCCATCTCCC 
GAATTGGAAA ACGAGGCCGT GTAA

Protein sequence

MTGLVDTNLA TQAATGSPDQ GGASAGGIPK YREYKNSDVV WIGEVPSFWE VKPFKWLLTH 
NEGGVWGDDP AGEGDTIVLR STDQTVDGNW NVTDPAVRHL TVKENASAVL EAGDLVVTKS 
SGSALHIGKT TLVNVDMAKL GYCYGNFMQR LRLGQKYIPK LAWYVMNNDL VRLQLNLLSN 
STTGLANLNA TLIGEILLPV PPVEEQTQIA RFLDHETARI DALIEEQQRL IELLKEKRQA 
IISHAVTKGL DPTVPMKDSG VEWLGEVPAH WITKPLKHLA ELNPKKSGYH GDRDELCSFV 
PMEKLKTGVI QLDEERFIAD VISGYTYFED GDVLQAKVTP CFENRNIAIA DGLTNGVGFG 
SSEINVLRPF PDVNASFLYY RLQEDGYMGI CTASMIGAGG LKRVPGEVIN GFTVAVPERH 
EQTQIAHFLD HETARVDKLV EEANVGIELL KERRSALISA AVTGKIDVRG WQPPASAPSP 
ELENEAV