Gene Noc_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2100
Symbol
ID	3704410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2413766
End bp	2414926
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	59%
IMG OID	637738575
Product	8-amino-7-oxononanoate synthase
Protein accession	YP_344090
Protein GI	162139858
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR00858] 8-amino-7-oxononanoate synthase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCCGATT TAAAAACGGC CCTTACGATG GAGCTGAGGC AGCGCCAGAC TCAGTCTCTT 
TACCGCTATC GGCGGGTATT GGAAGGTCCC CAGGGGGCGG AGCTCCAAAT GGATGGCCGC 
CGAATTTTAG CCTTTTGCAG CAATGACTAT TTAGGTCTGG CGAATCACCC CGCAACCCGG 
GCTGCCTTTA TGCAAGGAGT CCGAGAGTAC GGGGTTGGCA GTGGGGCGGC CCACCTAGTG 
ACGGGCCATA GCCGTGCCCA TCATACGCTA GAGGAGGCTC TGGCGGCGTT TGTGGGACGG 
CCCCGGGTGT TGCTGTTTTC TACCGGTTAT TCGGCCAATC TTGGGGTTAT CAGCGCCCTA 
ATAGGGCGTC AAGACGCAGT TTTCGAGGAT CGCCTCAATC ATGCCTCCTT GCTAGATGGG 
GGGCTGCTTG CGGGTGCCCG CTTTAAACGC TATCGGCACC GGGATTATCA GTCCCTCGAA 
GCCGCTTTAA CTGCCACCAA GGCCCGCCGC AGATTGGTGG TGACGGATGG GGTTTTTAGC 
ATGGATGGGG CGCTGGCTCC CTTGCCGGAC CTGGCTGCAG TTGCCGACCG TTTTGATGCT 
TGGCTGATGG TGGATGATGC CCATGGTCTG GGCGTCTTGG GCGAAGAAGG GCGTGGCAGC 
GTGGCCCATT TTGGGCTGGG AATGGCCCAG GCGCCTATTT TGGTGGGTAC CTTGGGTAAA 
GCCTTGGGCA CCTTCGGGGC CTTTGTGGCC GGTGAGGAGG CCCTTATTGA AACCTTGATT 
CAGCAAGCGC GGACCTACAT CTATACTACA GCCCCGCCCT CTGCGGTGGC CGTAGCGACC 
CTGGCCAGTT TGCGGCTGGT TGAAACCGAA TCCTGGCGTC GGGATAAATT AACCCGCTTG 
ATTGCCCAAT TTCGGCAAGG CGCCGCTCAG TTGGGGCTTC AGCTCGTGGA TTCCCCGACC 
CCTATCCAGC CGTTGCTGGT GGGAGATGCT GGGGCTGCAG TTAAACTGAG CGAGCGCTTG 
CTTGCGCAAG GGATACTGGT GACTGCCATC CGCCCGCCCA CGGTGCCAGA GGGAAGTGCC 
CGCCTACGAA TTACTTTAAC GGCGGCTCAT TCCGAAGCCC AGGTAGCACG CTTGCTGGAG 
TCGCTAGTTC AAGTTTTATG A

Protein sequence

MPDLKTALTM ELRQRQTQSL YRYRRVLEGP QGAELQMDGR RILAFCSNDY LGLANHPATR 
AAFMQGVREY GVGSGAAHLV TGHSRAHHTL EEALAAFVGR PRVLLFSTGY SANLGVISAL 
IGRQDAVFED RLNHASLLDG GLLAGARFKR YRHRDYQSLE AALTATKARR RLVVTDGVFS 
MDGALAPLPD LAAVADRFDA WLMVDDAHGL GVLGEEGRGS VAHFGLGMAQ APILVGTLGK 
ALGTFGAFVA GEEALIETLI QQARTYIYTT APPSAVAVAT LASLRLVETE SWRRDKLTRL 
IAQFRQGAAQ LGLQLVDSPT PIQPLLVGDA GAAVKLSERL LAQGILVTAI RPPTVPEGSA 
RLRITLTAAH SEAQVARLLE SLVQVL