Gene Noc_1185 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1185
Symbol
ID	3706759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1292819
End bp	1293874
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	50%
IMG OID	637737688
Product	hypothetical protein
Protein accession	YP_343217
Protein GI	77164692
COG category	[S] Function unknown
COG ID	[COG3249] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAAG TTGCTTTGGC GATAGTGATA TTTTATGTGC TGCCATTAGA GGTTCAAGCG 
ATAGGAGCGG TGGATCTTTA TGAAGCCCAG GTGCCTGTAA GTAATCAAAC CCCCGAGGAG 
CAGGCGAGGG CGGTGAAAGA GGCTTTTCAA AAGGTGTTAT TGAAAGTGAT GGGAAACCGG 
CGTACCTTGG CTCGCGCACC CCTTGCCTTG TTGCTTGAGA AGTCCTCCAG TTTGGTTCAG 
AAATTTCGCT ATAATGCTTC TGATGAGGAA AACGGTGCGG CGACCTTTTG GGTTCGTTTT 
GACCCACTGG GTGTAGAGCA ATTGTTACGG CAGAAAGCGC TGCCCGTATG GGGCCAGGTC 
CGTCCTATTT TATTGTTATG GGTTGCGATT GAAGAAGGCA GGCACCGCTA TTTGGTAGAT 
GCAGACGGCA ATTTGCCTGC TGCCGAAATC CTGGAAGAGC AAGCAGGAGT ACGGGGGATG 
CCCGTGATTT TACCTCTTTG GGATTTAGAG GATCGATCCC AGCTGTCTTT CAGCGATATT 
TGGGGTAATT TCCCTGAGCC TATACTGGCT GCTTCCAAGC GCTATCCCGC TTCGGTACAG 
TTAGTGGGGC GTTTGTCGCG CCAGAGTGAG GATGATTGGC AGGCCCGTTG GACTCTTTAC 
GGCGTTGATA AAGCGCGAGA CTGGCGGGTT AATGGCGAGT TTGAACAGGT GTTGCGTGCT 
GGTATCGATA AATCAGTAGA CACGATTGCT GCCCAGATAG TGCCGGCTAC CGGGAATAAT 
TCACTATCCT CGGTGCAGGT TAGGGTGACC GGAGTAACCT CGTTTATGGA TTATGCTCGT 
CTCTTCTCTT ATCTCAGCAG CCTTAGTCAA GTGATCACCA TGGAGCCAGT ACAATTATCC 
CGGGCAGAAG CAAAATTTAG GCTTGAATTG CGGGGAAAGG CCGAGGGGTT AGCCACTTCC 
ATCCGCTTTG GGAGGGTTTT GGTGCGAGCA ACGGAAGGTA TGGGCACAAA CATAGAGCCG 
AATCACATGG AATTGAATTA TCGGCTATTA CCTTAA

Protein sequence

MKQVALAIVI FYVLPLEVQA IGAVDLYEAQ VPVSNQTPEE QARAVKEAFQ KVLLKVMGNR 
RTLARAPLAL LLEKSSSLVQ KFRYNASDEE NGAATFWVRF DPLGVEQLLR QKALPVWGQV 
RPILLLWVAI EEGRHRYLVD ADGNLPAAEI LEEQAGVRGM PVILPLWDLE DRSQLSFSDI 
WGNFPEPILA ASKRYPASVQ LVGRLSRQSE DDWQARWTLY GVDKARDWRV NGEFEQVLRA 
GIDKSVDTIA AQIVPATGNN SLSSVQVRVT GVTSFMDYAR LFSYLSSLSQ VITMEPVQLS 
RAEAKFRLEL RGKAEGLATS IRFGRVLVRA TEGMGTNIEP NHMELNYRLL P