Gene Noc_3008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_3008
Symbol
ID	3705716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3400559
End bp	3401632
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	51%
IMG OID	637739482
Product	uroporphyrinogen decarboxylase HemE
Protein accession	YP_344980
Protein GI	77166455
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAGT TAAAAAATGA TCGTTTTCTC CGGGCACTGT TGCGGCAGCC GGTGGATCGA 
ACCCCGATTT GGATTATGCG CCAGGCGGGG CGTTATCTCC CGGAATATCG GGAAGTGCGT 
GCTAAAGCTG GGGATTTTTT GACCTTATGT ACAACGCCAG AGCTAGCTTG CGAAGTGACC 
CTGCAACCGC TGCGTCGCTT TGACCTGGAT GCTGCTATTA TTTTTTCCGA TATCCTCACC 
ATTCCGCATG CCATGGGGTT GGGATTGTAT TTTTCCAAAG GTGAAGGGCC TCGTTTTGAA 
CGGCCGGTAA GAACTAAAAA CCAAGTCTCT GCCCTTGGAG TTCCAGATCC AGAATCGGAT 
TTAAGTTATG TCATGGAAGC TCTGCGGTTA ACCCGAAGAG AGCTGGATGG GCGCGTGCCT 
CTCATCGGTT TTTCTGGCAG TCCCTGGACC TTAGCGTGCT ATATGGTGGA AGGGGGATCA 
AGCAAAGATT TTGCCCTAAT CAAGGGACTA ATGTTTGAGC ATCCTCAAGT AATGCATCAC 
CTACTAGAAA TTCTTGCCCA GGCTGTTACA GTCTATCTTA ATGCCCAGAT AGCAGCGGGT 
GCCCAGGCCG TGATGCTCTT CGATACTTGG GGTGGAGCGT TAAGTCACCG TGATTATCGG 
GACTTCTCTC TCTCTTATAT GGCCAGGATT GTGGAAGGCG TAGTCCGGGA GAATGAAGGC 
CGTCAAGTAC CGGTAATTTT ATTCACCAAA GGGGGAGGGC TTTGGTTGGA AACAATGGCT 
GGGACGGGCT GTGATGCCTT AGGGGTTGAT TGGACTGTGG ACCTTGCTAA AGCGCGAATG 
CAGGTAGGAA AACAAGTCGC CTTGCAAGGG AATATGGACC CTTGCGTGCT TTATGCCTCC 
AGCGAACGGG TACGCCAGGA GGCAAGCGAA ATCATTAAAG CTTATGGTGC TGGTAGCGGC 
CACGTTTTTA ACCTTGGGCA TGGCATACAT CCTACGGTGA TGCCTGAGAA AGTAGCGGCC 
CTTGTGGATG CGGTCCATGA ACTGAGTGTG CCGTATCATA CCTATGAGGA GTGA

Protein sequence

MAELKNDRFL RALLRQPVDR TPIWIMRQAG RYLPEYREVR AKAGDFLTLC TTPELACEVT 
LQPLRRFDLD AAIIFSDILT IPHAMGLGLY FSKGEGPRFE RPVRTKNQVS ALGVPDPESD 
LSYVMEALRL TRRELDGRVP LIGFSGSPWT LACYMVEGGS SKDFALIKGL MFEHPQVMHH 
LLEILAQAVT VYLNAQIAAG AQAVMLFDTW GGALSHRDYR DFSLSYMARI VEGVVRENEG 
RQVPVILFTK GGGLWLETMA GTGCDALGVD WTVDLAKARM QVGKQVALQG NMDPCVLYAS 
SERVRQEASE IIKAYGAGSG HVFNLGHGIH PTVMPEKVAA LVDAVHELSV PYHTYEE