Gene Noc_0491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0491
Symbol
ID	3706662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	528860
End bp	529939
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	43%
IMG OID	637737000
Product	hypothetical protein
Protein accession	YP_342544
Protein GI	77164019
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000229793
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCAAC TAGATGAAGC ACAGAATCGC TATCGAAAAA ACTTTATTAT GATACTGTTG 
GTATCCATTC TGGCAGTATT TTTAGTGATG ATTCATGAGT ACCTTATTGC CATTCTTTTA 
GCGATTATTT TCACAGCCCT GTTGTATCCT GTTTATGCTT GGATTTTAAA GAAATTTAAT 
GGCAGACAGG TGCTGTCGTC AATGACTACG ATCCTGTTAG CTATTCTAAT GATAGGCCTG 
CCGTTGCTAG GTTTGCTCGG CGCCGTAGCT GCCGAAGCAA TTCAAATTAG CAATAGCATT 
GCCCCCTGGA TAGAGAAAAA AATTCCTGAT CAGAACGCCT CCCCCCTCCA CGAATTTCCA 
CAGTGGCTGC CGTTTGCTGA TCAGCTTGAG CCTTATAGAA CGCGGATTTT AGCTAAAGTA 
GGGGAGTTTG CCGGTAATGC AGGCGCGTTT ATCGCAAGTG GAATTTCTAA GGCCACCCAA 
GGCACGATCG GTTTCATAGT AAATTTTTTC ATTATGTTAT ATGCCATGTT CTTCTTTTTT 
ATATGGGGGC CGGATTCGCT TATTAACTTA ATACGTTATC TTCCCCTTAC TGAAAAAGAC 
CGTTCCCATA TTCTTGAAAA AGGACTTTCA GTTACAAAGG CGACCTTAAA GAGTATTCTC 
ATCATTGGGG TATTACAGGG AATCCTAGTA GGGCTCGCCT TCTGGGTAGC TGGGATTAAA 
GGGGCTATCT TTTGGGGTAC CATCACGGTA GTGCTTTCTG CGGTTCCCGG GCTCGGTGCC 
CCCGTTGTTT GGATTCCAGC GGTAATTTAT TTGATAGCTA CGGATCAAAT AGGTTGGGCC 
ATTGGGATGA CGTTATGGGG GATAATTATC GTAGGCTTGG TGGATAACAT CCTGCGTCCT 
CGAATTGTGG GCAGCGAGGC CAAAATGCCT GATTTGCTGA TTTTGCTAGC TACTTTGGGT 
GGTATTCTTA TGTTCGGAAT GGTGGGTGTT ATTGTAGGTC CTATTATTGC TGCCTTACTA 
ATCACTGTGC TTGATATCTA TGGAAAAGTA TTTACTAATC TTTATTCCCA GGCGGAATGA

Protein sequence

MIQLDEAQNR YRKNFIMILL VSILAVFLVM IHEYLIAILL AIIFTALLYP VYAWILKKFN 
GRQVLSSMTT ILLAILMIGL PLLGLLGAVA AEAIQISNSI APWIEKKIPD QNASPLHEFP 
QWLPFADQLE PYRTRILAKV GEFAGNAGAF IASGISKATQ GTIGFIVNFF IMLYAMFFFF 
IWGPDSLINL IRYLPLTEKD RSHILEKGLS VTKATLKSIL IIGVLQGILV GLAFWVAGIK 
GAIFWGTITV VLSAVPGLGA PVVWIPAVIY LIATDQIGWA IGMTLWGIII VGLVDNILRP 
RIVGSEAKMP DLLILLATLG GILMFGMVGV IVGPIIAALL ITVLDIYGKV FTNLYSQAE