Gene Noc_0226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0226
Symbol
ID	3706281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	249384
End bp	251159
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	53%
IMG OID	637736742
Product	PAS sensor diguanylate cyclase and phophodiesterase
Protein accession	YP_342286
Protein GI	77163761
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain [COG2200] FOG: EAL domain
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGATG TCACCGCCCG TAACCGTGCC GAGGCCGCGC TGGTCGCCGA AAAAGAGCGT 
ATCCAGGTAA CCCTGGAATC CATCGGCGAC GGGGTGATTA CTACTGATGC TAATAGCCGT 
ATCAACTACC TTAATCCAAC CGCCGAGGCT ATGACCGGTT GGCTATTGGC GGCTGCCCGG 
GGCAAAGCAT TACCGGACGT ATTGCAAATT ATCAATGAGT CCACCCGTGA GCCGGTAGCC 
GATCCTCTCG CCCCTTGCTT GACTGGCAGC TCCGCTGTGA GATCCACCAA CCCTACGGTA 
CTCATCAGTC GCCACGGCGC CGAATATTCA ATTGAAATCT CCGCCGCCCC TATCCGCGAC 
GCCAACAACC AGGTGCTAGG CGCGGTACTG GTATTTCACG ATGTTAGTGA ACAGCGCCGG 
TTGCAGTGCG AAATTGCCCA TCAGGCGCAA CACGATGCCC TTACGGGTCT AGTCAATCGC 
CGTGAGTTTG AGCGGCGCTT GCAAAGGGTA ATCGAGACCG TTCAGACGCA AAACAGCGAG 
CACGCCCTAT GCTATCTCGA TCTCGATCAA TTTAAGCTTG TCAACGACAC TTGCGGGCAC 
GCTTCAGGCG ATGCGTTGTT GCAACAGCTG GCGGTGCTGT TCGAAAAAAA TATCCGTCGG 
CGCGATACGC TGGCGCGGCT GGGAGGCGAT GAATTTGGGC TGCTATTAGA GCACTGCTCG 
TTGGACAGAG CGCTGCAAAT AGCCAATACC TTACGTCAAA CGGTTGAGGG TTTCCGTTTT 
TGCTGGAATG GGCAACACTT TCGGATCGGC GTCAGTATCG GCTTGGTGCC CATCACCATT 
GCTAATTCAA GCGCCGCCAG CGTCTTACAA ACAGCCGACA GCGCCTGTTA CGTTGCTAAA 
GACGGCGGCC GTAATCGAAT TCACATTTAT CGTGAGCACG ATGTGGAGTT GGCCCGGCGC 
CATGGTGAAA TGCAATGGGT GGCCCGTATT CAGCAGGCAT TGGAAGAGAA TCGCTTTCAA 
CTGTATGCAC AACCGATAGT GCCGCTTAAG GCCACGCTAT CCGGTGGCAT ACACTGCGAA 
TTGTTACTAC GGTTGGTGGA AAACGATGGT AAGATATCGC CGCCAGGCGC ATTTATGCCA 
GCCGCCGAGC GCTATAATCT GGCCGTTGCG ATTGATCGCT GGGTCGTTAC CCAGGCATTG 
CGCTGGCTGG CCGCCCATCC GGCGCTGCTT GATCGAATCA CGTTATGCAC TATTAATTTA 
TCGGGCCACT CTATCGGTGA TCGCTTTTTC CACGCTTATG TACTGCGGCA ATTTGACGAT 
ACCGGCCTGC CGGCTAAAAA AATCTGCTTC GAGATTACGG AAACAGCCGC CGTGGCTAAT 
CTTGCTGATG CCACCCGGTT CATGGAGGCG CTGAAAACAC GCGGCTGTTG TTTCTCTCTT 
GATGACTTTG GCAGCGGCTT GTCCTCGTTT GCTTACCTCA AGGCCCTGCC CGTTAATTTT 
CTCAAAATTG ATGGTCTATT TGTTAAAGAC ATTGTCGATG ACCCCATCGA TCTGGCTATG 
GTTCGTTCAA TCAACGAAAT CGGCCATCTG CTGGGGAAAA AAACCATTGC TGAATACATC 
GAAAACGACG CTATCCTGGA TAAACTACGC GGCCTCGGTA TAGATTACGG GCAAGGCTAT 
GGCCTTGGTC AGCCGCAACC GTTGTCCGCG CTACTTGCAA CAGTGTCTAG GCCCGCTAAT 
TCCATAAAAA CGGGAGCGGA TACCCATTTC ATATAA

Protein sequence

MHDVTARNRA EAALVAEKER IQVTLESIGD GVITTDANSR INYLNPTAEA MTGWLLAAAR 
GKALPDVLQI INESTREPVA DPLAPCLTGS SAVRSTNPTV LISRHGAEYS IEISAAPIRD 
ANNQVLGAVL VFHDVSEQRR LQCEIAHQAQ HDALTGLVNR REFERRLQRV IETVQTQNSE 
HALCYLDLDQ FKLVNDTCGH ASGDALLQQL AVLFEKNIRR RDTLARLGGD EFGLLLEHCS 
LDRALQIANT LRQTVEGFRF CWNGQHFRIG VSIGLVPITI ANSSAASVLQ TADSACYVAK 
DGGRNRIHIY REHDVELARR HGEMQWVARI QQALEENRFQ LYAQPIVPLK ATLSGGIHCE 
LLLRLVENDG KISPPGAFMP AAERYNLAVA IDRWVVTQAL RWLAAHPALL DRITLCTINL 
SGHSIGDRFF HAYVLRQFDD TGLPAKKICF EITETAAVAN LADATRFMEA LKTRGCCFSL 
DDFGSGLSSF AYLKALPVNF LKIDGLFVKD IVDDPIDLAM VRSINEIGHL LGKKTIAEYI 
ENDAILDKLR GLGIDYGQGY GLGQPQPLSA LLATVSRPAN SIKTGADTHF I