Gene Noc_0722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0722
Symbol
ID	3706988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	780027
End bp	781685
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	52%
IMG OID	637737225
Product	signal transduction histidine kinase
Protein accession	YP_342766
Protein GI	77164241
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00200947
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTGGC AAAAAGCGAT AAAGGATAAA AGAATCATCG AGATTGATGG CCAGGATATA 
GCGGAAGGAC CTCTTCCTCC TTGGCGGCCG CTTGCCGTTT TTTGTCTCTA TCGCTTGTTA 
ATTGTCTCCT TGCTTTTGGT GGCCGTCATT ACTGGTGCTG GCCCCGGTTT TCTGGGCGAA 
TCTCACCCTA ATCTATTCTT GATTACTAGT CTGGTTTATG CCGCCGCCGC CATTGCCCTA 
GGTGTTGCCA CGATAGCTCG GATGGGCGGA TTTTGCTTTC AAGTGTGGTT CCAGTTAACC 
TTGGATATTG GCGCTATTAC GCTTTTGATG CATGCCAGTG GCGGTGTGCT CAGCGGCCTG 
GGAATGCTGC TGGTGGTAGT GATTGCCGCC GGGGGTATTT TAACGGTGGG GCGGACCGCT 
AGCGCCTTTG CTGCCCTGGC CACATTGGCG GTGTTGCTTG AACAGTCTCA TGCTCTCGTA 
TTCCGTGATT TCGATACCGT TCACTATACT CAGGCGGGTT TATTAGGCGC CACCCTATTT 
GCCACGGCTC TACTAGCCCA GGTGCTGACA GCGCGGATTC GAGAGAGTGA GGCCCTCGCG 
GCCCAGCGGA GCTTGGATCT GGCAAATATC AGCCAGCTCA ATGGGTACAT TATCCAGCAC 
CTACAGTCTG GAGTCCTTGT GATAGATAGG GAGGATACCC TGCGGCTCAT TAATCAGGCT 
GGGCGAGCAC TATTAGGGTT GAAGCCGGGA GGAGAAAAAA AATCGTTGGA CCGGATAGCC 
CCATGCCTGG CTAAACAGCT TAATTGCTGG CGAGAAGGAC TACGCTCTCA TCAGCCTGAA 
GCTTTCCGGT CACGTTGGGG ACAATCCGAG ATATTGTCTA AATTCATCAG CCTGGGGCCC 
CGCTCAGGCA CACTGATTTT TTTAGAGGAC GCTTCGGCTT CGGCTCGCCA AGCTCAGCAA 
TTGAAGCTAG CTTCCTTAGG ACGGCTTACA GCGAGCATTG CCCATGAAAT CCGTAATCCT 
CTGGGCGCCA TCAGTCATGC CAGTCAACTT CTAAGAGAAT CTTCCACCCT AAGTCAAAGT 
GAGCAGCGGC TGTTGGAAAT TATTCTTAAT CACTGCACCG GGGTAAACGG GATCGTTAAG 
AATGTCTTGC AGTTGAGCCG CCGGCAGCAG CATAGCCGTC TAAAAGTGTT AGCCCTCAAG 
CCATGGTTGC TGGATTTTCT GGATGAATTT TGCCGTACCC AAGGAATTGA CCGGACAGAG 
GTGGCGCTCC AAATTCGCTC CGGCACAGTT CAAGTTCATA TGGACCCTTC TCAGTTTCAC 
CAGATATTGT GGAATCTTTG CGATAACGCT CGGCGTCATT CCCGAAGCTT GGGCCGTATT 
CCTTGTTTTC AAATTTCAGT AGAGAGCGCA GTGGATATGG GCCAAGTCTT TTTGGAGGTC 
CTGGATAGGG GATCCGGTAT TCCCAACGAT ATAGCCGATA AAATATTCGA GCCCTTTTTC 
ACAACCCAAG GCACAGGTAC CGGGCTAGGT CTTTATTTGG CCCGCGAACT ATCGGAATGT 
AATGGTGCCA GTCTGGAGTA TCGTCCAGCG CCTGGCGGAG GAAGCTGTTT TCGGCTTTGC 
TTTGCCCCCC TGGGCATGAT GGGGGCGAAT GTGGCATGA

Protein sequence

MNWQKAIKDK RIIEIDGQDI AEGPLPPWRP LAVFCLYRLL IVSLLLVAVI TGAGPGFLGE 
SHPNLFLITS LVYAAAAIAL GVATIARMGG FCFQVWFQLT LDIGAITLLM HASGGVLSGL 
GMLLVVVIAA GGILTVGRTA SAFAALATLA VLLEQSHALV FRDFDTVHYT QAGLLGATLF 
ATALLAQVLT ARIRESEALA AQRSLDLANI SQLNGYIIQH LQSGVLVIDR EDTLRLINQA 
GRALLGLKPG GEKKSLDRIA PCLAKQLNCW REGLRSHQPE AFRSRWGQSE ILSKFISLGP 
RSGTLIFLED ASASARQAQQ LKLASLGRLT ASIAHEIRNP LGAISHASQL LRESSTLSQS 
EQRLLEIILN HCTGVNGIVK NVLQLSRRQQ HSRLKVLALK PWLLDFLDEF CRTQGIDRTE 
VALQIRSGTV QVHMDPSQFH QILWNLCDNA RRHSRSLGRI PCFQISVESA VDMGQVFLEV 
LDRGSGIPND IADKIFEPFF TTQGTGTGLG LYLARELSEC NGASLEYRPA PGGGSCFRLC 
FAPLGMMGAN VA