Gene Noc_2501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2501
Symbol
ID	3704386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2845776
End bp	2846966
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	51%
IMG OID	637738980
Product	monooxygenase subunit B protein
Protein accession	YP_344484
Protein GI	77165959
COG category
COG ID
TIGRFAM ID	[TIGR03079] methane monooxygenase/ammonia monooxygenase, subunit B

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000158949
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATAGCCT CAAGCGTTTT CTATATTCCG ACAGTAGCTG CCCATGGCGA GAAGGCGCAG 
GCAGCTTTCC TGCGCATGCG GACAATCCAT TGGTATGACA TGGTATGGTC CAAGGATACC 
ATTGCGGTTA ATGAGACCTA TACCATAAGC GGGAAGTTCC GGGTTTTTGA GGATTGGCCG 
GAAGCAGTCG AAAAACCCCA TGTATCCTTT TTAAATGCGG GTCAACCTGG TCCAGTCACG 
GCTCGGCTTA CTTCCTACGT CAATGGTATG TTCGTCCCTC GTTCGATAGG TCTTGAATTG 
GGCGGCGATT ACGAGTTTGA GATGACGATG CAAGGGCGCC GTCCTGGGAC GTGGCATGTT 
CATACCTTGC TAAATGTCCA AGGAGGGGGG CCGCTCATCG GTCCAGGTAA ATACATCACC 
ATTACCGGAG ATATGGCTGA TTTTGAGAGC AAAATCACGG ATCTGACCGG TAATACGGTC 
AACCTGGAAA CCATGGCCAC GGGCACGGTT ATTGGTTGGC ATCTGTTCTG GTACGTTCTT 
GGTATCGCCT GGATTTGGTG GTGGGCCCGC CGTCCCATGT TCTTGCCCCG CTACATGAGA 
ATAGAGGCGG GCGAGGCTAA TGATCTAGTA ACTGCCCAGG ACAAAAAATT GACTATAGGC 
GTTCTTGTGG GCGTCCTGCT CATTATTTTG TTCGGCTTCA AGAGTGCTGA GGATAAATTC 
CCAGTCACCA TTCCGTTGCA GGCTGGGCTG CTGGGCACTA TTGACTCCTT GCCGGTGGAT 
TATAATTCGA TGGTAAGCGC TAACGTGCTT AAGGCTAACT ATCGGGTGCC GGGGCGGACT 
ATCAGCATGA CGGTTGAAAT CACTAACCAT ACTGACCAGG TGATTTCTAT TGGCGAGTTC 
AATACTGGGG GCATTCGATT CATGAATGCA AATGTGCGGG TTGATGAGAC GGATTATCCT 
GAGGAGTTGT TGGCACCGGA AGGGTTGGAA GTGAGTCAAC AGGATATCGC TCCAGGTGAA 
ACCGTAGTTG TTGACATCTC CGCCACCGAT GCCGCCTGGG AAGTTCAGCG TATGGCCGAC 
GTCATTTATG ATCCAGACAG CCGCTTTGCG GGCTTGATCT TCTTCGTTGA TCCAGAGGGG 
AATGAGATTC CGATACCTAT CGGCGGTCCA TTAGTTCCCA CGTTTGTCTA G

Protein sequence

MIASSVFYIP TVAAHGEKAQ AAFLRMRTIH WYDMVWSKDT IAVNETYTIS GKFRVFEDWP 
EAVEKPHVSF LNAGQPGPVT ARLTSYVNGM FVPRSIGLEL GGDYEFEMTM QGRRPGTWHV 
HTLLNVQGGG PLIGPGKYIT ITGDMADFES KITDLTGNTV NLETMATGTV IGWHLFWYVL 
GIAWIWWWAR RPMFLPRYMR IEAGEANDLV TAQDKKLTIG VLVGVLLIIL FGFKSAEDKF 
PVTIPLQAGL LGTIDSLPVD YNSMVSANVL KANYRVPGRT ISMTVEITNH TDQVISIGEF 
NTGGIRFMNA NVRVDETDYP EELLAPEGLE VSQQDIAPGE TVVVDISATD AAWEVQRMAD 
VIYDPDSRFA GLIFFVDPEG NEIPIPIGGP LVPTFV