Gene Noc_0174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0174
Symbol
ID	3706207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	193581
End bp	194666
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	52%
IMG OID	637736691
Product	chorismate mutase
Protein accession	YP_342237
Protein GI	77163712
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01807] chorismate mutase domain of proteobacterial P-protein, clade 2

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGATA GCCACCAATT ACAGGAAATT CGGGCGCGTA TAGACGCTTT GGATGAACAG 
CTTCAATGTC TCATCAATGA ACGCGCCGAG CTTGCCCGCC AAACGGCGCA GATAAAACAA 
GCAGCTGGCT TGGGGGAAAA TTGTTTTCGC CCGGAGCGGG AAGCTGAAAT TTTGCGACGG 
GTTATCGCAC GCAACCAGGG ACCACTCAGT GGGCAAGAAA TGGCCCGCTT ATTTCGGGAG 
ATTATGTCGG CCTGTCTGGC CCTTGAAACG CCCCTGGTGA TTGCTTATTT AGGTCCAGAG 
GGAACCTTTA CCGAGGCTGC AGCGCTTAAG CATTTTGGCC ATTCAGTGAA AACCCAACCG 
CTTATGGCCA TTGATGAGGT TTTCCGTGAA GTGGAGGCAG GTACAGCCTA CTATGGGGTC 
GTCCCGGTAG AAAACTCCAC CGAAGGAGCC GTGACCCACA CCTTAGATCG GTTTTTAGTC 
TCGCCCTTAC AGATTTGTGG TGAAGTGGAG TTGCGCATCC ACCATCATTT GCTTAGCAGA 
AACCAAACCA TTGCCGAAGT AAACCGGTTA TATGCCCATC AGCAAACATT GGCACAATGC 
CGAGAGTGGT TAGATGCTCA CCTGGCAGGA TGTGAGCGCA TTCCAGTAAG CAGCAATGGG 
GAAGCGGCGC GGCGGGCTGG GGATGAATCC GATTGTGCCG CTATTGCGAG TGACCGGGCC 
CGTGAAATTT ATGGGCTTCA CGCTTTAGCG ACCAATATTG AGGATGAGCC TGGCAATACC 
ACCCGTTTCC TTGTAATTGG CTCCCAAGCC GTGGTTGCTA GCGGGAATGA CAAAACGTCG 
TTGCTAGTCT CAGGTCCGAA TCGCTCCGGC TTGCTGTATG ATCTGCTGTC TCCCTTGGCA 
GAGTATGGCA TTAGCATGAC CCGGTTGGAG TCCCGTCCCT CACGGCGCCA ACTTTGGGAA 
TATGTGTTTT TTATTGATGT TGAAGGACAT ATAGACGATT CTAATCTAAC TACCGCGCTG 
GCTACTCTCA AAGAGCGGGC CTCCTTTCTC AAATTATTAG GCTCTTATCC ACGGGCGGTA 
ATATAA

Protein sequence

MDDSHQLQEI RARIDALDEQ LQCLINERAE LARQTAQIKQ AAGLGENCFR PEREAEILRR 
VIARNQGPLS GQEMARLFRE IMSACLALET PLVIAYLGPE GTFTEAAALK HFGHSVKTQP 
LMAIDEVFRE VEAGTAYYGV VPVENSTEGA VTHTLDRFLV SPLQICGEVE LRIHHHLLSR 
NQTIAEVNRL YAHQQTLAQC REWLDAHLAG CERIPVSSNG EAARRAGDES DCAAIASDRA 
REIYGLHALA TNIEDEPGNT TRFLVIGSQA VVASGNDKTS LLVSGPNRSG LLYDLLSPLA 
EYGISMTRLE SRPSRRQLWE YVFFIDVEGH IDDSNLTTAL ATLKERASFL KLLGSYPRAV 
I