Gene Noc_0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0949
Symbol
ID	3707360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1046692
End bp	1048233
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	48%
IMG OID	637737457
Product	hypothetical protein
Protein accession	YP_342990
Protein GI	77164465
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAGG AAACCCATCG TTCGATTCTC GCTGATTTAG TGGACTTCAG TACACAAATG 
GATTTGGATG CCGTCATGGA GCCTGGAGAT GTGCGTCGCC GTGACCGTAG TATTGGGCGA 
GAGCTGGAGC ACCTTGCAGA TAAGCCTCGG AGCCAGCTTC GCCAATGGCT ATGGCGGGTT 
GCTGAGAACA AACATGATTT CCCTGGTAAT AATGCCGCTA AAACCCTTCG TTTAGTGATG 
CTAGTGTTGT TTTTTTTCGG GGTGACTGTC GGCTGGATAG CAGCATTGGG GGTGTTCGCC 
TATGATGGCA CGCAGCCGGT CAATGTGGTT AATGTATTGG CGGTATTTGT GGGACTCCAA 
ATTCTGCTTT TACTGATGTC CGCTATTATT GCACTGCCAC GGAATATACT CCGTTTTATC 
CCTGGAACAC GCTCACTGCA GGATCTTTTT GGTGTGTTGA GTCCGGGACG GTTAGCGCCT 
ACAATCGCAC GGTTTTTATC GCCAGATTAC CGTTTGGCCT TTGAAGCAGC CTTGGGTCGC 
CAAAAGGCGC ACCATATTAC GTATGGCCGC GTGAGGAAAT GGTTGATACT GCAATTCTCC 
CAGGTATTTG CCGTGGCTTT CAATTTGGGA GCATTAATCG GCTGCCTTTA TCTAGTTACG 
ATTTCTGATC TAGCCTTTGG ATGGAGTACG ACATTAACGT TTCAGGCTGA AAAATTCCAT 
TGGTTAGTAC AGCAATTAGC TTGGCCGTGG CGCGATTGGC TTGGGAGCGC TGTTCCTTCC 
GCCAATCTCA TTGAGGTGAC CCGGTTTTAT CGTCTTGACG AAGGCATTTT GCCAAATGCA 
ATGAAGCTAG AGTCTAAAGA TGCTTCCATT CTAGGTCAGT GGTGGCAATT TTTGCTTCTA 
GCAATTATCT TTTATGGTTT GCTACCACGG CTTTTTACGT TAGCTTTTGC TCGCTGGCGC 
CTTAACGTTG CGTTAAACAA TGCTTTCATC CACGCACCAG GGGCTACTCA GGTTCTTGAT 
CGCATGAATC ATGCGGTAGT TGAAACGGCG GCGGTAGAAC CCGAGGCAGG AGCAGTACCG 
ATGCCAGAGG TGGTGCCATC TTTTCATGGC GAGAATTTCG CTGGAATTAA GGGGTACCTT 
GTTAATTGGG CTGGAATTAA TTTGGATGAA AGTCAGTTAG AAAATACGTT GCGGGCGGCC 
ATGGCGGTAA AGATCGATCA GGTGTTCCAT GCGGGCGGTA AAAGCCCTAT TGAGCAAGAT 
CAGCGTATTA TCGGAAAGTT GCAAGCGGCG GCGGATACAA TGGCTATTGT AGTTGCTGTA 
AAATCATGGG AGCCTCCTCT CTTGGAATTT TTAGATTTTT TAGAAGCACT CCGATCTGCA 
TTGGGTCCAC AGCGATTAAT TACGGTGATT CCGTTAGCGC TTAACCATAG GGGTGATCTG 
GTTTCTGCCG ATTCCAGTGA TTTAGATATT TGGCGGAAAA AGCTGCAGAT TCTTGGAGAT 
CCCCAGCTTG ATTTTCGCCC ATTGAATTTT AAGGCAAGCT AA

Protein sequence

MEQETHRSIL ADLVDFSTQM DLDAVMEPGD VRRRDRSIGR ELEHLADKPR SQLRQWLWRV 
AENKHDFPGN NAAKTLRLVM LVLFFFGVTV GWIAALGVFA YDGTQPVNVV NVLAVFVGLQ 
ILLLLMSAII ALPRNILRFI PGTRSLQDLF GVLSPGRLAP TIARFLSPDY RLAFEAALGR 
QKAHHITYGR VRKWLILQFS QVFAVAFNLG ALIGCLYLVT ISDLAFGWST TLTFQAEKFH 
WLVQQLAWPW RDWLGSAVPS ANLIEVTRFY RLDEGILPNA MKLESKDASI LGQWWQFLLL 
AIIFYGLLPR LFTLAFARWR LNVALNNAFI HAPGATQVLD RMNHAVVETA AVEPEAGAVP 
MPEVVPSFHG ENFAGIKGYL VNWAGINLDE SQLENTLRAA MAVKIDQVFH AGGKSPIEQD 
QRIIGKLQAA ADTMAIVVAV KSWEPPLLEF LDFLEALRSA LGPQRLITVI PLALNHRGDL 
VSADSSDLDI WRKKLQILGD PQLDFRPLNF KAS