Gene Noc_1722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1722
Symbol
ID	3705037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1926844
End bp	1927839
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	57%
IMG OID	637738203
Product	4-hydroxythreonine-4-phosphate dehydrogenase
Protein accession	YP_343724
Protein GI	77165199
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1995] Pyridoxal phosphate biosynthesis protein
TIGRFAM ID	[TIGR00557] 4-hydroxythreonine-4-phosphate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTGCC TGCGATTGGC CCTCACTCCT GGCGAACCTG CTGGCATTGG CCCGGATATC 
TCGATCCAAT TGGCCTGCCA GCGGCGGGAA TATGATTTGG TCGTGGTGGC CGATCCAGAA 
ATTCTACGCC AACGGGCACG GCAGCGGGGG TTAGCCCTGA TAGTTGAGTC CTATGATCCT 
GCTCAGCCGC CGGAGCCAGG GGTATCCGGA ACATTGAAGG TTCTACCATT AAGGGCTCCC 
GTCCCTGTTA CCACGGGGTG TTTGTCTCCG GGGAATGCGG CGTATGTTTT AGCATGTTTG 
CGGCGCAGTG TAGCAGGCTG CTTACAAGGA GAGTTTTCCG CTTTGGTCAC CGGTCCCGTT 
CACAAAGGGA TTATCAATCA GGCAGGCATC TCCTTTAGTG GTCATACTGA ATTTTTAGCC 
CAGCTGTGCA ACCGCTCTCA AGTAGTGATG ATGTTGACCG CGCCTGGACT GCGGGTAGCG 
TTAGCCACCA CTCATTTACC CTTGCGTGAG GTGAGTGCCG CGATTACCCG CCGAGGACTG 
GAGGGGACGC TGCGGATACT GCACCGGGAT TTGAGGCAGC GCTTTGGAAT TTCCAGGCCG 
CGTATTTTAG TCTGCGGCTT GAATCCCCAT GCGGGAGAGG GGGGGCATTT GGGGCGTGAG 
GAAATCGAGA TCATCGAGCC GGTCATAGCA ACCCTCCGGG CTCAGGGAAT GCAATTATTC 
GGACCCTTGC CGGCGGATAC CTTGTTTGTG CCCCGTTACC TGAAAGAAGC GGATGCAGTG 
CTCGCCATGT ACCATGATCA GGGGCTGCCC GTGCTCAAGC ATGTAGGTTT TGGGCGAGCG 
GTGAATATTA CCTTGGGGCT GCCTATTATT CGCACCTCAG TGGACCATGG CACCGCTTTG 
GATCTTGCCG GCAAGGGCCC GGTAGGAAGC GGCAGCTTGG AAGCGGCTGT GGAGGCGGCA 
CTAGCGATGG CGGAGAGAGA GCAACTTTCA AAGTGA

Protein sequence

MACLRLALTP GEPAGIGPDI SIQLACQRRE YDLVVVADPE ILRQRARQRG LALIVESYDP 
AQPPEPGVSG TLKVLPLRAP VPVTTGCLSP GNAAYVLACL RRSVAGCLQG EFSALVTGPV 
HKGIINQAGI SFSGHTEFLA QLCNRSQVVM MLTAPGLRVA LATTHLPLRE VSAAITRRGL 
EGTLRILHRD LRQRFGISRP RILVCGLNPH AGEGGHLGRE EIEIIEPVIA TLRAQGMQLF 
GPLPADTLFV PRYLKEADAV LAMYHDQGLP VLKHVGFGRA VNITLGLPII RTSVDHGTAL 
DLAGKGPVGS GSLEAAVEAA LAMAEREQLS K