Gene Noc_0973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0973
Symbol
ID	3707404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1075297
End bp	1076445
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	59%
IMG OID	637737480
Product	hypothetical protein
Protein accession	YP_343013
Protein GI	77164488
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACACA CCACAGTAAT GATGAGCGCG GTTGTGGCCG CCTCCCTGTT AAGCACCTCC 
GCCCTGGCCC TGGACCGGGC CAACACCTCC GAGAAAGGCA GCTTATTGGT TTTCCCGAAT 
GTGGATGTGA GCGGGGATAG GAATACCATT ATTCGCCTCC AGAATGATTA CTCCGACTCG 
GTGAGCCTGA AGTGCTACTG GAAGAACGGG ACCAAGTTTT TCACCGACTT TCAAATTGAG 
CTGACCAAGT TCCAACCCAT CTGGATAAGC GCCCGGGATG GTGAGGGGAC CTACAGCGTC 
CCCCCCTTCC CCACCTCCGC CAACCAGGAC TACCTGGATA AGATAGGCCA CAGTGGCGGT 
CCATATGCCA CCCCCAGCCG GGTGACGTTG CCCGAGCATG CCCGGACCGC AGGTGAGCTG 
CAATGCTGGG CGGTGGATGG CGGGGGTGCC AGTGAAATTC GCTGGAACCA TCTGGCCGGC 
TCTGCCACGG TGGTGGACGC CTCCCAAGGG ACGGCCTATC AATACAACGC CTGGGGTTTT 
CGCTGCCTGG TCGGGGGCAA TGGGGATGCG TGCGTGGTGG CCGATGCGGG TCAACTGGAC 
CTCAATGGCA ACGAATACGA AGCCTGCCCG AAGAAGCTCA TCGGCCATTT CAGCCCCGCC 
GAGACCGCTC TTGGGGGCAT GCAGGTGCAT CGCAATGAGC TGACCCTGGC CTCCTGTAAT 
CAGGACCTGA CCCAGGACCA GCAGTTCCAC TTCACCAAGC TGAAGTTTAA TGTCTGGAAC 
GAGCAGGAAG CCAAATACAC GGGGGCCTAT CAGTGCATGG ACAGCTGGCA TCAGGGGCTG 
CTCGATGGGG TGCAGAACAA TGGCCGTAAC TTCACCGCCT CGAGCCTCAA GACCGATGTG 
GCCCGCTTTA AGGTAAGGGG GATGAAGAGC AGCGTCTGTG AGCGTGCTGA TAACCGCAAA 
ACCTTCGCCA TTGATGAGAG CATTGTGACC GAAGAGGCCG GGCTGCTCGG GGTCATGGCC 
ACCACCTACG GGTTGGGGGA AAGTGATGGC CTCGCCGAGG CGGGCACTAC CCTGCACATG 
CTCGGTCAGC GTGATGGCTT TATCGCCTAC GACCCTCAAG AGGTCATTGA GGAGCGTCCC 
GCTCGCTAG

Protein sequence

MKHTTVMMSA VVAASLLSTS ALALDRANTS EKGSLLVFPN VDVSGDRNTI IRLQNDYSDS 
VSLKCYWKNG TKFFTDFQIE LTKFQPIWIS ARDGEGTYSV PPFPTSANQD YLDKIGHSGG 
PYATPSRVTL PEHARTAGEL QCWAVDGGGA SEIRWNHLAG SATVVDASQG TAYQYNAWGF 
RCLVGGNGDA CVVADAGQLD LNGNEYEACP KKLIGHFSPA ETALGGMQVH RNELTLASCN 
QDLTQDQQFH FTKLKFNVWN EQEAKYTGAY QCMDSWHQGL LDGVQNNGRN FTASSLKTDV 
ARFKVRGMKS SVCERADNRK TFAIDESIVT EEAGLLGVMA TTYGLGESDG LAEAGTTLHM 
LGQRDGFIAY DPQEVIEERP AR