Gene Noc_1150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1150
Symbol
ID	3706915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1257160
End bp	1258368
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	46%
IMG OID	637737654
Product	hypothetical protein
Protein accession	YP_343184
Protein GI	77164659
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATTAAAG GAGCTAGAAA ACCATGGTAT AAGAAGAGAG CATTTAGTGC CATGCTGCTA 
TTGCTGGTAA ATCCGTTACA GGCTGAATGG AAACTTCCCG ACTCTTTTCA GATTCATGGT 
TTTGCCTCGC AAGCATTCAT ATTGAGTACA GACAATAATT TTTTTGGCGG CAGTAAGGAT 
AACGGGACAT TTGATTTCAG AGAATTGGGG ATTAATGCTT CTTGGAGGAT TTTGCCCAGG 
CTTCAGGTTG CGGCTCAGGG GGTTGCACGC TGGGCTGGCG AGAATGACGA AGGCAGCCCA 
AGGTTAGACT ACGGCTTGGT TGACTATGCT TTCGTGAGTA ATGCTAAGAA CACTTGGGGC 
CTGCGGCTTG GCCGTGTAAT TAATCCTATT GGTTTTTATA ATGATACCCG CGACGTGGCT 
TTTACTCGGC CAAGTATTTT TCTACCCCAA TCCATTTACT TTGATCGTAC CAGAGATGTA 
GCACTGTCGG CGGATGGCGG CCAAGTTTAT GGTGAACAGC GTACCAGCAT AGGAGATTTT 
ATCCTCCAGT TCAATATCGC AAAACCAAGG GTTGGTACAC GGGAAGAGCG GGCTTTACTC 
AGCCATGACT TCCCTGGTCA ACTTAAAGGA GATACATCTG TATTTGGGCG TCTCTTGTAT 
GAGAAGGATG GGGGAGGTAT TCGGTTGGGT TTTTCCTCCT TCTGGGCTAA TTTTGATTTT 
GACTCTGCGT TGTCCACAGA CTCGATTTCT TCGGGATCAA TCGAGTTTTC TCCTTTGATA 
TTTTCAGGCC AATATAATGG GGAGCGGTTG AGTCTGACAA GCGAGGTTGC TCTAAGACAT 
TTTAGCTATT CTGATTTTGG ACCTCGTATT CCAGATACCG ATTTCACTGG CCTGAGCTGG 
TATTTTCAAG CCACCTATCG TTTTACACCC CGCTGGTCAG CTGTCGCCCG TTTTGATAGT 
CTTTGTACCG AGCTTGGTGA TTGTAACGGA GAAGATTTTG CTGCTAAAAC CGGACAACCT 
GCACATCGCC GGTTTGCAGA TGATTGGATG GTAGGCCTAC GTTGGGATGT GACCTCTTCC 
ATCATGGTGA GAACAGAGTT CCACCATATT AGGGGTACTG CTTGGATAAC CACTGAAGAT 
AATCCAAATA TTAATGATCT CCACGAGGAC TGGAATATGT TCTCCCTTCT GGTTTCATTT 
CGTTTCTAG

Protein sequence

MIKGARKPWY KKRAFSAMLL LLVNPLQAEW KLPDSFQIHG FASQAFILST DNNFFGGSKD 
NGTFDFRELG INASWRILPR LQVAAQGVAR WAGENDEGSP RLDYGLVDYA FVSNAKNTWG 
LRLGRVINPI GFYNDTRDVA FTRPSIFLPQ SIYFDRTRDV ALSADGGQVY GEQRTSIGDF 
ILQFNIAKPR VGTREERALL SHDFPGQLKG DTSVFGRLLY EKDGGGIRLG FSSFWANFDF 
DSALSTDSIS SGSIEFSPLI FSGQYNGERL SLTSEVALRH FSYSDFGPRI PDTDFTGLSW 
YFQATYRFTP RWSAVARFDS LCTELGDCNG EDFAAKTGQP AHRRFADDWM VGLRWDVTSS 
IMVRTEFHHI RGTAWITTED NPNINDLHED WNMFSLLVSF RF