Gene Noc_0024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0024
Symbol
ID	3705957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	20172
End bp	21842
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	46%
IMG OID	637736548
Product	DNA/RNA non-specific endonuclease
Protein accession	YP_342096
Protein GI	77163571
COG category	[C] Energy production and conversion
COG ID	[COG1229] Formylmethanofuran dehydrogenase subunit A
TIGRFAM ID	[TIGR03121] formylmethanofuran dehydrogenase subunit A

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCATTA AACTCACCGG CGGTACCGTT TATGATCCCA TGCATGGGAT TAATGGCGAA 
GTTCGTGATA TTTATATCCG AGATGGCCGC ATTATCAATC CCCCCCCCGG CGATATGTCT 
ATCGATCAAG AGTATCCCTT AAATAATAAA ATTATCATGG CTGGAGCGAT CGATATCCAT 
AGTCATATCG GTGGAGGTAA CGTTAATATC GCCCGAACAT TGCTGCCGGA GGGTCATCAC 
ACTAATTTAT TACCCCGTAC TGAACTATTA CGCGCAGGAT CTGGCCGCGC GATTCCCAGC 
ACCTTCGCTA CCGGTTATCG TTATGCGGAA ATGGGTTATA CGGCGGTCTT CGAACCTGCC 
GTATTACCTA TGAATGCCCG CCAAGCCCAC ATGGAAATGG GGGATACTCC CTTGGTAGAC 
AAAGGTGGCT ATGCCTTATT GGGTAATGAT GATTATGGGT TACGGATGTT GGCAGCTAAT 
AAGGATCAAA AAACCTTTAA CAATTACGTG GCCTGGATTC TCAAAGCCAG CCAGTGTCTA 
GGTATCAAAG TAGTCAATCC AGGTGGAATT AATGCCTTCA AATTCAATCA ACGCCGCCTC 
GATCTGGATG AACCAGGTCC CTTTTATGGG GTTACACCAC GACAAATATT GCTTCGCCTC 
GCACGTGCAG TACATGAATT GGATATTCCT CACCCCATTC ATGTCCATGG CTGTAACTTG 
GGAGTACCAG GCAATCTAAA AACCACTTTA AGCACTATTG AGGGGATCGC GGGCCTCCCT 
ATGCATCTTG CCCATATTCA ATTTCATAGT TACGGCGCTG AAGGTGATCG GAAATTCTCA 
TCAGGGGCAG CTCAAATTGC AGAAGCGGTA AATAGACACC CGAATATTAC CGTTGATGTC 
GGTCAAATTC TGTTTGGGCA AACGGTAACC GTATCCAGTG ACACCATGCA GCAATATGCC 
AGCCATCCCC ATGCTTATCC TAAGAAATGG GCCTTCATGG ATATTGAATG TGACGCTGGC 
TGCGGTATTG TCCCTTTTAA GTACCAAGAC AAGCATTTTG TTAATGCTCT CCAGTGGGCT 
ATTGGCTTAG AGATCTTTCT TTTAGTGGAT GATCCCTGGC GGGTTTTTCT TACGACTGAT 
CATCCTAATG GTGCCCCTTT TGTTTCTTAC CCTCATCTTA TCCGGCTATT AATGGACCGA 
AGTTTCCGTA ATGATATGTT AGCCACTATC CATCCGGAGG CTGCCCAGGC CAGTACTTTA 
GGCACTATTA CCCGGGAATA TTCTCTTTAT GAGATTGCTA TCATGACCCG GGCTGGAGCG 
GCTAAACTGC TTGGTCTTTC AGACCGAGGG CATCTAGGTA TTGGGGCAGC CGCTGATATT 
ACCGTCTACA CGGAGCAAAA AGACAAGGAA AAAATGTTTT CTAAACCCGA CTATGTCTTT 
AAGGATGGGG AACTCGTCGT TAGAAACGGG GAAATCGTCA AGGTCACTTG GGGCGCAACC 
CATGTAGTCC GGCCGGAGTT CGATAATAGT ATAGAAAAAG AGCTTTCCAG CTACTTTGAT 
CGTTATCTTC CCATGAAGAT TAGCAATTTT AAAATAAACG ATGAGGAAAT GACTTATTTC 
GGGCGAGGTC ATATCCAAGT TCATCCCTGC CGGGAGAGGA ATAGCTTCTG A

Protein sequence

MLIKLTGGTV YDPMHGINGE VRDIYIRDGR IINPPPGDMS IDQEYPLNNK IIMAGAIDIH 
SHIGGGNVNI ARTLLPEGHH TNLLPRTELL RAGSGRAIPS TFATGYRYAE MGYTAVFEPA 
VLPMNARQAH MEMGDTPLVD KGGYALLGND DYGLRMLAAN KDQKTFNNYV AWILKASQCL 
GIKVVNPGGI NAFKFNQRRL DLDEPGPFYG VTPRQILLRL ARAVHELDIP HPIHVHGCNL 
GVPGNLKTTL STIEGIAGLP MHLAHIQFHS YGAEGDRKFS SGAAQIAEAV NRHPNITVDV 
GQILFGQTVT VSSDTMQQYA SHPHAYPKKW AFMDIECDAG CGIVPFKYQD KHFVNALQWA 
IGLEIFLLVD DPWRVFLTTD HPNGAPFVSY PHLIRLLMDR SFRNDMLATI HPEAAQASTL 
GTITREYSLY EIAIMTRAGA AKLLGLSDRG HLGIGAAADI TVYTEQKDKE KMFSKPDYVF 
KDGELVVRNG EIVKVTWGAT HVVRPEFDNS IEKELSSYFD RYLPMKISNF KINDEEMTYF 
GRGHIQVHPC RERNSF