Gene Noc_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1997
Symbol
ID	3704881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2299407
End bp	2300765
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	51%
IMG OID	637738473
Product	sigma-54 specific Fis family two component transcriptional regulator
Protein accession	YP_343989
Protein GI	77165464
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR02915] putative PEP-CTERM system response regulator

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGTA AGAAAAACTT GCTGATCGTG GAAGATGATC TTGGCTTGCA GGGCCAGTTG 
CGGTGGGCTT TTTGTGGTTA TGAAATAGCA GTAGCTAAGG ATCGTCAGGA AGCGGTTGCA 
TTAGTACGCC GCCATGAACC TCCGGTAGTA ACGTTAGATC TTGGTTTGCC TCCTAACCCT 
GGTGGCGTCA GCGAAGGCAT GGCCTCCTTG CAGGAAATCC TGGCTCTGGC GCCCTATACC 
AAAATCATTG TGATCACAGG GAATGACAGC CAGGAGCATG CGGTGCAAGC AGTGGGGGCG 
GGTGCCTACG ATTTTTATTC GAAGCCCATC GATCCCGACA TTCTTAAATT GACGATTGAT 
CGGGCTTACC GGCTTTATGA ATTGGAGATG GAAAATCGGC GTTTACGGCG GGCTGGTCAT 
TCCTCCCTGG AAGGGGTGAT TGCCGTCAGC CCTGGAATGA AGAAAATATG TCGTACCATT 
GAGAAGATCG CACCCGCTGA TGTCACTGCG TTTATTTTGG GTGAGAGCGG TACAGGCAAG 
GAAGTTATTG CTCGGGCCTT GCACCAACTG AGCTATCGCC GAGAGCAAAC TTTCGTGGCT 
ATTAACTGCG CGGCTATTCC GGAGAACCTT TTGGAAAGCG AGCTTTTTGG CCATGAAAAA 
GGAGCCTTTA CGGGGGCTGT GAGACAAACC CGGGGCAAGA TTGAATACGC TCATGAGGGT 
ACTTTGTTCT TAGATGAAAT CGGGGATTTG CCCCGGGGCC TCCAGGCCAA GCTGCTGCGT 
TTTCTGCAAG AACGGGTGAT TGAGCGGGTG GGTGGCCGTG AAGAAATCCC TGTGGATGTG 
CGGGTTATCT GCGCGACCAA CCAGGATTTA AAAGAGCTTA TTGCTCAAAA CCAATTTCGG 
GAAGATCTAT ATTATCGAAT TGCCGAAGTT ACCGTGACTC TTCCGCCTTT GCGGGAACGC 
CCGGGCGATG CGGTAGTCAT TGGGCGGGCG CTGCTTGAGC ATTTTTCGCG CACGCAGGGT 
AAAGCGGTCC GCGGTTTTAC AGATGATGCT ATTAGAGCTA TTGAGACTCA TACCTGGCCT 
GGCAATGTTA GAGAACTAGA AAATTGCATA AAACGGGCTG TGATAATGGT GGAAGGCAAC 
CGTATTGCGT CGGAAGATTT AGACTTGCCC GCCTCTGCCT CCCCCGAACA GCAATCTTTG 
TCCTTAAATT TGCGTCAAAT ACGGGAGCAT ACTGAACGGG AGGCGCTTAC CCGCGCCATC 
ACCTTGGTGA ATGGCAATCT CTCACGGGCA GCGGAACTCT TAGGGGTGAC TCGTCCTACT 
TTATACGCAT TATTAGATAA ATATGAAATG CGTGGTTAA

Protein sequence

MSSKKNLLIV EDDLGLQGQL RWAFCGYEIA VAKDRQEAVA LVRRHEPPVV TLDLGLPPNP 
GGVSEGMASL QEILALAPYT KIIVITGNDS QEHAVQAVGA GAYDFYSKPI DPDILKLTID 
RAYRLYELEM ENRRLRRAGH SSLEGVIAVS PGMKKICRTI EKIAPADVTA FILGESGTGK 
EVIARALHQL SYRREQTFVA INCAAIPENL LESELFGHEK GAFTGAVRQT RGKIEYAHEG 
TLFLDEIGDL PRGLQAKLLR FLQERVIERV GGREEIPVDV RVICATNQDL KELIAQNQFR 
EDLYYRIAEV TVTLPPLRER PGDAVVIGRA LLEHFSRTQG KAVRGFTDDA IRAIETHTWP 
GNVRELENCI KRAVIMVEGN RIASEDLDLP ASASPEQQSL SLNLRQIREH TEREALTRAI 
TLVNGNLSRA AELLGVTRPT LYALLDKYEM RG