Gene Noc_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2023
Symbol
ID	3705174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2335103
End bp	2336209
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	56%
IMG OID	637738499
Product	GTP cyclohydrolase II
Protein accession	YP_344014
Protein GI	77165489
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCTTGA GCAAGACGGA AGCGATCATT CAGGATCTCC GTGAAGGAAA AATGGTTATC 
CTCATGGACG ATGAGGATCG GGAGAATGAG GGAGACTTGA TTATGGCAGC CTCCCAGGTG 
AGGGCGCCAG ATATCAATTT TATGGCCCGC TATGGACGGG GATTGATTTG TCTGACCTTG 
ACTGAGGCCC GTTGCCGCCA ATTACGGCTG CCCTTAATGG TGTCAGACAG TAACGCTAAA 
TATAGTACTA ATTTTACGGT ATCCATCGAA GCGGCAACGG GGGTGACTAC GGGAATTTCC 
GCAGCGGATC GGGCTCGCAC CGTGCAAGCG GCGGTTGCTC CAGAGGCGCG CCCCGAGGAT 
TTGGAGCAGC CGGGCCATAT TTTCCCCCTC ATGGCTCGTC CAGGGGGAGT GCTTACCCGA 
GCAGGGCATA CGGAGGCAGG TTGTGACTTG GCGCGGCTGG CTGGTTTTGA GCCGGCGGCA 
GTCATTGTGG AAATTCTCAA TGAAGATGGA AGTATGGCCC GCCGCCCGGA TCTGGAAGTT 
TTTGCCGAGC GCCACGGTTT GAAACTGGGC ACCATCGCCG ATCTGATTCG TTACCGTTTA 
GAACATGAAC GCTCTGTCGC ACGGGTAGCC GAGTGCGCTC TGCCTACGGA ACAGGGGCTG 
TTCCGCCTCT TAGCTTATCA GGATCTGGTG GACCAGCAGC TCCATCTGGC TTTAGTTAGG 
GGCGAGCTTT GTCCTGAAGA GCCGGCTTTG GTGCGTGTTC ACATGGCTGA TACCCTTTGC 
GATATTCTCC AGGTACGGCG CGGTGATTGT GGCTGGCCCT TGCACGATGC CATGACTCGC 
ATCGCCAAGG CGGGTACCGG CGTGGTCGTG ATTCTACGCC GGCCGGAATC TTCTAGTGAT 
TTGGTGCAGC GAATTCAGGA CTATAATCTG GAGGATCAGG GGGAGCGTTT GCCTCGGCAA 
GAGCCTCCAA ATGATTTGCG GACTTATGGA GTTGGAGCCC AGATCTTGAC TGATTTGGGT 
GTGCAAAAGA TGCGGGTGAT GAGCGCTCCC CGGCGAATGC ATGGGCTGGC GGGTTTTGGC 
CTGGAAGTGG TGGATTATGT TACTTGA

Protein sequence

MPLSKTEAII QDLREGKMVI LMDDEDRENE GDLIMAASQV RAPDINFMAR YGRGLICLTL 
TEARCRQLRL PLMVSDSNAK YSTNFTVSIE AATGVTTGIS AADRARTVQA AVAPEARPED 
LEQPGHIFPL MARPGGVLTR AGHTEAGCDL ARLAGFEPAA VIVEILNEDG SMARRPDLEV 
FAERHGLKLG TIADLIRYRL EHERSVARVA ECALPTEQGL FRLLAYQDLV DQQLHLALVR 
GELCPEEPAL VRVHMADTLC DILQVRRGDC GWPLHDAMTR IAKAGTGVVV ILRRPESSSD 
LVQRIQDYNL EDQGERLPRQ EPPNDLRTYG VGAQILTDLG VQKMRVMSAP RRMHGLAGFG 
LEVVDYVT