Gene Noc_1455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1455
Symbol
ID	3706024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1610568
End bp	1611548
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	53%
IMG OID	637737944
Product	hypothetical protein
Protein accession	YP_343473
Protein GI	77164948
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.435019
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCTT TACATAACGA TAATGTAGAA TCTACACCAA CCACAAAGAC GCTAGAACCA 
GGCTCGCCCA ATTCGCGCCT ATTTCTCATT CTTAATCCGG TCGCGGGCAG TTGCAGCGCC 
GAGCGGGTCA GGTTTACTCT GAAGCAATAC TGCGAGCAGC ATGATGTAGG CTACGAAATT 
TATGAGACCA CCGGCAAAGA GCACTTGCCC AGTATTGTGC GCCAGGCACG GGAGGAAGAC 
TATAGCGTCA TCGTTGCAGC GGGCGGTGAT GGCACCGCTT CGATGGTGGC CGGTGAGTTA 
ATCCACAGCC CGATTCCTCT GGGTATTATC CCAGTGGGCA CGGCCAATTT ACTAGCCCGT 
GAGTTGGCCA TCCCGTTAGA TCTGGAGTCC GCCTGTCAAC TCGTGGTTAC CGGGGGTGCC 
ATAAGAAAGA TTGATGCCAT GCGGGTGGGC CGTCAGGTTT TGATTTCTCA TATTAGCCTG 
GGTTCTTATT CGCGCATTGC GGAGAGAACC AGCGTGGAGG CTAAACGGCG TTTTCGCCAA 
CTCGCCTATA TCTGGAATGG GATAGCCGAA TTTATCGGCA CTCGGGTATG GCGTTTTGAC 
CTCGTTGTGG ACGGTCAGCG GCAGCGCATT AAAGCCGCTT TTATTATGAT CGCTAACGTA 
GGCGCCATGG GAGCGGCTAC CCTGCGCTGG GGTGAAGAGG TCAAGCCTGA TGACGGGAAA 
GTAGATATTT GTATTGTCCG AACCCGGGGC CTTCTCCATT ACTCGTCTTT TTTGTGGCAT 
GCCTTGAGAG GACGGCATAA GGAATCTCCC CATACGGACT ATTTATGGGC CGAAAAAAAT 
ATAAAGGTAA CGGCAAAAAA GAATTTGCCG GTGCGGGGCG ATGGGGAAAT TATTGGTCGC 
TCCAGCGTGG AGATAGAGAT TATCCCAAGG GCCGTTCCCA TCATCGTCCC CGCTCCCGTG 
CCTGATGAGA TAGCCTCCTG A

Protein sequence

MKSLHNDNVE STPTTKTLEP GSPNSRLFLI LNPVAGSCSA ERVRFTLKQY CEQHDVGYEI 
YETTGKEHLP SIVRQAREED YSVIVAAGGD GTASMVAGEL IHSPIPLGII PVGTANLLAR 
ELAIPLDLES ACQLVVTGGA IRKIDAMRVG RQVLISHISL GSYSRIAERT SVEAKRRFRQ 
LAYIWNGIAE FIGTRVWRFD LVVDGQRQRI KAAFIMIANV GAMGAATLRW GEEVKPDDGK 
VDICIVRTRG LLHYSSFLWH ALRGRHKESP HTDYLWAEKN IKVTAKKNLP VRGDGEIIGR 
SSVEIEIIPR AVPIIVPAPV PDEIAS