Gene Noc_0232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0232
Symbol
ID	3706287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	256439
End bp	257734
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	50%
IMG OID	637736748
Product	hypothetical protein
Protein accession	YP_342292
Protein GI	77163767
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAATT TGGCCCGTCA CTGTTTTATT TTTTTAGGTT TGCTACTTGT GCCAACCCTC 
GGGGCGGCTG GTTTGAATAT CTTCCCCGAG TTGGATTCAA ATGATAACAA TAATACCAGC 
AGCAATAATA CCAGCCAAGA AAGTACTCAG AACTTTAGTA ATACCGCAGA CCCAGAGCCG 
GAGGCTGATA CCAACGCCTC CCCCCCTGCA AACAAGGATG AAATTATTGC TGAAACCAAA 
GCAGGATGCG CCACCGATCC GGCAAGCTGC GGGGTGACTT TATCCAGTTT TCTAGACAGC 
ACCGGCTTTG GCGAAACCGA ACCCAATAAC CATGCCATGG GCGCTGACGC CATGGAGTTC 
GGCGTTGAAT ACGCGGGGCA GCTTTATAGC CCGGAAGATG TGGACTGGTT CCGTATTACC 
ACCACGGAAT CCAATCAAAT GCTCACCGTT AATTTTAACG TTCCCGGATT AAACGATATT 
ACCGGATGGA ATCTCTCCAT TCGGGATAGC GGGGGTAATA TTTTCTCGGA AGTCTACACT 
GGGTTTGACT TCGGACCAGA AAGCCCATTA CAGACAATCC TATCCCGTGC GGGTACTTAT 
TATGTAGTGG TAAAATCCTT GAAGCAGGCC CAGGAAGAGA CAAGATCTTC AGACCAAAGC 
GGCGAAGCTG ACCTGATCTA TGAACATCTG CCCCACGAGT ACCGCCTGGC CGCTTTTCTG 
GGGGATTCTC AGGTCACCAC GGAACCCCTT GACGTCAATT TTTTTGACGC CGAAGTGGAA 
CCCAATGACT CCCGCGATGA AGCCAACCCA TTAACCTTTG CCACCCCCCT CGCATCCAAT 
GTCACCATGG AGGGCTTAAT ATCCGGACCT CTCATCTTTG GATCGGTGGG ATTTGCCTTC 
GAAGAGGACT GGTTTGTCTA TGACACGGCA GGGAATGAAA TTCTCAGTAT AGAATTTTGC 
GCTAGCCAAG ACTGCGAAGA CAGCACTTGG CAAGTCACCG TGTACGATGA AAATGAACGA 
ATGCTGCTCA CCGGGCGGAC CGACATGGAA CAAAATTATT ATCTGGGTAT CCGCAATCCA 
GGCAAGTATT TTATACGAAT TGGTGTGGCC CCGGCACTAG ATGAGGAAAG CGGCGGCGCA 
CAATATGTCT GCTCTATTGA TCCTACCATG CCCCTCAAGG ATTGTCCTAG CCCCAGCGAG 
AGAACATTAC TGGTTGAGTC ACCGTGGCAT CAATACAACT TCACTGTCAC CAGCACCAAG 
CTTCCACCCT TGATGAGCGA GGTAGATAAT CCCTAA

Protein sequence

MKNLARHCFI FLGLLLVPTL GAAGLNIFPE LDSNDNNNTS SNNTSQESTQ NFSNTADPEP 
EADTNASPPA NKDEIIAETK AGCATDPASC GVTLSSFLDS TGFGETEPNN HAMGADAMEF 
GVEYAGQLYS PEDVDWFRIT TTESNQMLTV NFNVPGLNDI TGWNLSIRDS GGNIFSEVYT 
GFDFGPESPL QTILSRAGTY YVVVKSLKQA QEETRSSDQS GEADLIYEHL PHEYRLAAFL 
GDSQVTTEPL DVNFFDAEVE PNDSRDEANP LTFATPLASN VTMEGLISGP LIFGSVGFAF 
EEDWFVYDTA GNEILSIEFC ASQDCEDSTW QVTVYDENER MLLTGRTDME QNYYLGIRNP 
GKYFIRIGVA PALDEESGGA QYVCSIDPTM PLKDCPSPSE RTLLVESPWH QYNFTVTSTK 
LPPLMSEVDN P