Gene Noc_0257 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0257
Symbol
ID	3706331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	283353
End bp	284393
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	637736773
Product	hypothetical protein
Protein accession	YP_342317
Protein GI	77163792
COG category	[R] General function prediction only
COG ID	[COG1821] Predicted ATP-utilizing enzyme (ATP-grasp superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCC TCGTCTACGA ACATATTACC AGCGGCGCGT TCTGTACAGA ATCCTTACCC 
AGCCACTTGG CCAGGGAAGG CGATGCCATA CTGCAAGCAT TACTTTATGA TTTAGCAAGA 
ACGCAAGGCG TACAGTCCGT GATTCTCCGA GATTTTCGCC TAGATACGCC CCCTTACATT 
CACCGCTGCC ATTATATTCG CAACTTGAAT GATTTTCGCC GTTGCTGGCT CATTTCCTTA 
GACTATGTCG ATGGGGTCTT ACCCATTGCC CCCGAGAGCG ATAACTTATT GGCTGAGATC 
CAGTCCTGGG TGCTCAAGGC GGGCAAACGT TTACTCGGCT GCCGCCCCGA GGCTACCGCT 
ATTGTAACAA GCAAAACCCG GACAGCCAGG CATTTAGCAG CGGCAGGACT CGTTACTGCA 
CCCACAGTCT GGCTCAAGGA CTGGCAACCT GATACTTTCA CGGAGAGCGC CTTGATCTGC 
AAGCCAGATG ATGGCGCGGG ATGTAGCAAC CTTTTATATT TTGAGAATAC AGCCGCATTA 
TCTGCCTGGA AACAGCAGAG AGCTCCGGAA ATTTGGGGAA AACAAATCGT TCAACCCTAT 
ATTTGGGGAA CGGCTAGCAG CCTTTGTCTG CTTTGTGCTG ATGGTGAAGC CCGGTTATTA 
TGCGGGAATC GCCAAGGGCT CCGGATTACC GAAGGAACAA TCCAGCTTAC CAGTATTACG 
GTAAATGGGG TAAACTCTCA GGAATTTTAT CCTCCCTCCT TCCAGGAAAT TGCCGATATA 
ATTGCCACGG CCCTCCCTGG TTTATGGGGT TTCGTTGGAG TGGATCTAGT CTTGAGTCCA 
CAACCGGTAA TCATAGAAAT CAATCCCCGC TTAACAACGA GCTACATAGG GCTGCGGGAA 
GTTTACGGAA TAAATCCGGG TACCTGGCTG CTTACTCTAC TTAATAAAGG GATGAAAGCC 
GTGGAGTTAC CGCCTCGCCC CTGTCAAAAG GTGACCGTTG CAACGGAGGA AGGAGATGCT 
ATCCAGGCCA CTCGCCATTA G

Protein sequence

MKILVYEHIT SGAFCTESLP SHLAREGDAI LQALLYDLAR TQGVQSVILR DFRLDTPPYI 
HRCHYIRNLN DFRRCWLISL DYVDGVLPIA PESDNLLAEI QSWVLKAGKR LLGCRPEATA 
IVTSKTRTAR HLAAAGLVTA PTVWLKDWQP DTFTESALIC KPDDGAGCSN LLYFENTAAL 
SAWKQQRAPE IWGKQIVQPY IWGTASSLCL LCADGEARLL CGNRQGLRIT EGTIQLTSIT 
VNGVNSQEFY PPSFQEIADI IATALPGLWG FVGVDLVLSP QPVIIEINPR LTTSYIGLRE 
VYGINPGTWL LTLLNKGMKA VELPPRPCQK VTVATEEGDA IQATRH