Gene Noc_1437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1437
Symbol
ID	3706045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1593919
End bp	1594974
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	50%
IMG OID	637737927
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_343456
Protein GI	77164931
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCACAT TGCCTGAGAA CCCCATGGGT ACCGACGGCT TTGAATTCAT AGAATTCACG 
GCGCCGGATA CTGCTGCCTT AGCCCATTTA TTTGAGCAGA TGGGTTTTGC GGTGCTGGCC 
AGGCATCGCC ACAAAGAGGT CACTGTTTAT CGGCAAGGAG ACATTAATTT TATTATCAAC 
CATGAGCCTG ACAGCTTTGC CCAGGCATTT TCCCGGGTCC ACGGGCCGTC AGTGTGTGCC 
TTTGCCATCC GGGTTAAGGA TGCCGCCGCC GCTTTTAAAC GCGCGGTGGG ATTAGGCGCT 
GAGCCATTTC ATGTTCCGCT CGGTCCTATG GAACTGAATA TCCCGGCAAT TTTAGGCATT 
GGGCGGAGTA TCATTTATTT TGTTGACCGC TATGGTGAAC ATTCTATCTA TGACGTGGAT 
TTCATGCCTG TTCCCGGCGA GTCAAGGCAT CCCCAGGGGG TAGGACTCAC CCATATTGAT 
CACCTGACTC ATAATGTTCC CGAAGGCCGG ATGGACCATT GGGCGCATTT CTACGAGCAC 
CTATTTAACT TTAAGGAAAT TCGCTATTTT GATATCCATG GCAAGGCCAC GGGTCTTAAG 
TCCCGGGCGA TGACCAGCCC CTGCGGTAAG ATTCGCATTC CCATCAATGA GCCTTCGGAC 
AGGCACTCTC AGATACAAGA GTATTTAGAA GCCTATCATG GGGAAGGCAT TCAGCATATT 
GCTTTAGCGA CGGAGGATAT TTATCAGACG GTGGAAACTC TCCGCCGCAA TGGCGTTGAG 
TTCATGGGGG TACCCGATGC TTATTATGAA GGTGTGGAGG CACGCTTGCC TGAGCATGGT 
GAAGATTTAG CCAGGCTGTC TCAGAATCGT ATTTTGATTG ATGGGGCGCC GCAACAAGGA 
GAGGGTTTAT TATTGCAACT GTTTACCCAG GCTCTGATTG GCCCTATTTT TTTTGAAATT 
ATTCAACGTA AAGGTAATCA GGGTTTTGGC GAAGGTAATT TTCAAGCCCT GTTTGAGGCT 
ATCGAGCAGG ATCAGATAAC GCGAGGGGTG CTTTGA

Protein sequence

MFTLPENPMG TDGFEFIEFT APDTAALAHL FEQMGFAVLA RHRHKEVTVY RQGDINFIIN 
HEPDSFAQAF SRVHGPSVCA FAIRVKDAAA AFKRAVGLGA EPFHVPLGPM ELNIPAILGI 
GRSIIYFVDR YGEHSIYDVD FMPVPGESRH PQGVGLTHID HLTHNVPEGR MDHWAHFYEH 
LFNFKEIRYF DIHGKATGLK SRAMTSPCGK IRIPINEPSD RHSQIQEYLE AYHGEGIQHI 
ALATEDIYQT VETLRRNGVE FMGVPDAYYE GVEARLPEHG EDLARLSQNR ILIDGAPQQG 
EGLLLQLFTQ ALIGPIFFEI IQRKGNQGFG EGNFQALFEA IEQDQITRGV L