Gene Noc_1959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1959
Symbol
ID	3704973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2245504
End bp	2246460
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	52%
IMG OID	637738435
Product	esterase/lipase/thioesterase family protein
Protein accession	YP_343951
Protein GI	77165426
COG category	[I] Lipid transport and metabolism
COG ID	[COG2267] Lysophospholipase
TIGRFAM ID	[TIGR03100] hydrolase, ortholog 1, exosortase system type 1 associated

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.175259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAACT ATGTTGGGAA TGGGTATAGG GTAGAGGGGT TTCCAGGCGC ACTCAAAGCC 
AGGGGAGACA TAACGCATAT TTATAACGGA CAGTCGGTGT CCAGGGTGAC GGCTGAAGAA 
GCACTGACCT TCCATTGCCT TGGAGAGCTT CTCGTTGGCA TCTTGCACCG AGGTTCAGAG 
TACGCCACCC GGGGTGTCTT GGTCGTTGTT GGTGGCCCCC AATACCGGGT AGGCAGTCAT 
CGCCAGTTTG TATTGTTTGC CCGCTGGTTG GCGGAAGCGG GAGTTCCTGT ATTCCGTTTC 
GATTACCGTG GAATGGGAGA CAGCGGTGGC GGTACTCGTA CCTTTGAGAA TATTGAAGTT 
GATATCCGTG CAGCGATCGA TGCTTTTCTA GAAGCTGCGC CAGGGTTAAG AGAAATCGTG 
ATTTGGGGCC TTTGCGATGC CGCCTCGGCG GCCTGTTTTT ATGCGCCCTC AGATCCGCGA 
GTAGCAGGTT TGGTGTTGTT GAACCCCTGG GTGCGAACGG AGGAAGGGCA GGCAGCCGTT 
TACCTCAAGC ATTATTATTT TAGAAGGTTA GTTAGCGGCG ACTTTTGGCG CAAGTTTTGG 
CGCCGGGAAT TTGATTATAA GGATTCACTG CGTTCATTGG GAGATATATT AAGGAAAGCT 
AATTCCTGGC GGCAGAAGGT TGATGAAGTT GAGACTGAAG AAATATTGCC GTTGCCCAAG 
CGGGTATATA AAGCTTTAGA GCAATTCCAG GGCAGGACGC TCTTGATACT AAGCGGCAAG 
GATCTGACAG CGAATGAGTT TCGCGATACC ATCTCGTCTT CATCCGCTTG GCGCGGCTTG 
CTTCGCAGTA GAAGCATTGA GCGTCGCGAG TTGTCGACTG CGGACCATAC CTTCTCCCGC 
CGCGTTTGGC GGGATCAGGT GGCTCAGTGG ACCCTTGAAT GGGTGCGGTC ATGGTAA

Protein sequence

MMNYVGNGYR VEGFPGALKA RGDITHIYNG QSVSRVTAEE ALTFHCLGEL LVGILHRGSE 
YATRGVLVVV GGPQYRVGSH RQFVLFARWL AEAGVPVFRF DYRGMGDSGG GTRTFENIEV 
DIRAAIDAFL EAAPGLREIV IWGLCDAASA ACFYAPSDPR VAGLVLLNPW VRTEEGQAAV 
YLKHYYFRRL VSGDFWRKFW RREFDYKDSL RSLGDILRKA NSWRQKVDEV ETEEILPLPK 
RVYKALEQFQ GRTLLILSGK DLTANEFRDT ISSSSAWRGL LRSRSIERRE LSTADHTFSR 
RVWRDQVAQW TLEWVRSW