Gene Noc_2574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2574
Symbol
ID	3704578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2928330
End bp	2929388
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	51%
IMG OID	637739054
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_344557
Protein GI	77166032
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.162764
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTATT TTTCATGTAG CTCTAATAGA GGAATTGTAG ACTTGTCGAC ACACCTTTGG 
AATAGCAGAT CTTTTCCCCG CACCCGTCCC CGCCGTATGC GGTGTGACGA CTTCTCCCGG 
CGGCTAATGC AGGAACATCG TATAAGCTGC AACGATCTTA TTTATCCAGT ATTTATTCTC 
AATGGCCAAG GCCGTCGCGA GACGGTCTCC TCCATGCCGG GCATTGAGCG GCTCACCATC 
GATAATTTAC TGGATGAAGC TAAAGAGCTT ATTGCGCTTG GCATCCCTGC CATTGCCCTA 
TTTCCAGTGA CACCGCCTGC CCAAAAATCG GACAACGCCC ATGAAGCCTA TAATCCAGAT 
GGCCTCGCGC AACAGGCAGT ACGGACTTTA AAACAACATT TCCCTGAATT AGGTGTGATC 
ACTGATGTTG CCCTAGACCC CTTTACCAGC CATGGTCAGG ACGGCCTAAT AGATGCCAAT 
GGTTATGTAA AGAACGATGA AACCGTTGAA GTGTTAGTAA AGCAGGCCCT TTCCCACGCA 
GAAGCTGGCG CTGATATTGT TGCTCCTTCC GATATGATGG ACGGCCGTAT TGGTGCTATT 
CGCCAGGCCC TAGAAAGTGC CGGACACACT AATACCCGGA TTCTTGCCTA TTCAGCAAAA 
TATGCTTCTA GTTTTTACGG ACCTTTCCGG GATGCAGTCG GGTCAGCGGA TAACCTTGGC 
GGCGGCAACA AATACAGCTA CCAAATGGAC CCAGCTAATG GCGATGAAGC TCTGCAAGAA 
GTGGCTTTAG ATCTAGAAGA GGGCGCGGAT ATGGTCATGG TCAAGCCAGG ATTGCCCTAT 
CTGGATATTG TCCAGCGGGT CAAGACAACC TTTGGGGTTC CTACCTTTGT GTATCAGGTC 
AGCGGCGAAT ATGCCATGCT GACTGCCGCT GCCCAGAACG GCTGGCTGGA TCGGCAAACT 
GTTACGATGG AATCTCTGCT TGCCATGAAA CGGGCCGGGG CCGATGCCAT CTTGACCTAC 
TTTGCCAAAG ACGCGGCCCG CTGGCTAAAC GAGCAGTAG

Protein sequence

MIYFSCSSNR GIVDLSTHLW NSRSFPRTRP RRMRCDDFSR RLMQEHRISC NDLIYPVFIL 
NGQGRRETVS SMPGIERLTI DNLLDEAKEL IALGIPAIAL FPVTPPAQKS DNAHEAYNPD 
GLAQQAVRTL KQHFPELGVI TDVALDPFTS HGQDGLIDAN GYVKNDETVE VLVKQALSHA 
EAGADIVAPS DMMDGRIGAI RQALESAGHT NTRILAYSAK YASSFYGPFR DAVGSADNLG 
GGNKYSYQMD PANGDEALQE VALDLEEGAD MVMVKPGLPY LDIVQRVKTT FGVPTFVYQV 
SGEYAMLTAA AQNGWLDRQT VTMESLLAMK RAGADAILTY FAKDAARWLN EQ