Gene Noc_1797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1797
Symbol
ID	3705314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2028480
End bp	2029931
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	52%
IMG OID	637738281
Product	hypothetical protein
Protein accession	YP_343798
Protein GI	77165273
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.636063
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTCAA AAATAGTTCG CTGGATTATT GTGCTGCTGG CATTAGTCCT GGTGATTGGA 
GCCGTTGGCT GGTACAAACT TTTGCGCGAG GTGGAACAAA CCTCCCTGAA AGAGTCCTCG 
GCGGCGGAAT GGTTTAAATA CGGTTCCATT AGCAGTGAAG AGGAGCAAGG CGTTCCCTAT 
TGGATCTGGC GAGTTTTGCC TAAGATGTTC CCTGAATATT TGCCTGCCCC CGGTGGTTAT 
GCCGCCCTCG GTGTTCCTTG GGAACAGGGG CAGGAATTGC CGGTAGGGTT CTCTAAAAAA 
ACCATTGGTT TCCCCCGCGT TGCCTTTAAC TGCGCCTTCT GCCATTCGGC CAGGTACCGG 
CTCAAGGCAG ACGAGCCAGC CACTATAGTG GTGCCGGGAC CAGGGAATAC CGTCAGGCCC 
CAAGACTATG CCCGCTTTCT TGCGGCATCG GCGAATGATG CCCGCTTTAA TTCCGATAAT 
ATTCTGGAGC AGATCAGCTT GATCTACGAA TTGTCGTGGC TAGATAGGCA GCTCTATCGT 
TACTTGATTA TTCCCATGAC TAAAAAAGCG CTGATCCAAT ATGGGCAGGA GTTTGCTTGG 
GCCCAAGGGA AGCCCCCCTG GGGGACCGGG CGCATCGATC CTTTTAATCC CATCAAGTTT 
GGAATCCTGC AGATGGGAAT CGATGCAACC ATTGGCAATT CGGACATGAT GCCTCTATGG 
AATTTGAAAG TCCGGGAAGG AGATGCGCTT CATTGGGATG GTCTAAATAC TAATCTTCAT 
GAAGTAGTCA TCAGTTCCGC CATTGGCGAT GGCATGACCT ACAAAGCCAT TGCCCATGAT 
AGCTTGGATC GTATCGAGGC GTGGTTACAG GAAGTGCCTT CGCCGGCTTC ACCCTTTAAT 
GCCAATGAGA ACCCTGCTTC TCCTTACTAC TTGGATGAGC AGCAAGCGGC AATAGGTAAA 
GCTATTTATG AGCAGCATTG CGCCACATGC CATGCGCCAG GAGGAGAACG CCATAGAACG 
GTAATTCCGG TTGAAGAGGT GGGCACTGAT CGCCACCGGG TGGATATGTG GACAGCCGAA 
GCCGCTAAGC GCTACAACGC CTATCAGGAA GATTACGATT GGGGAATGCG TCACTTTAGG 
GACGTGGATG GTTATGTGGC GGTGCCCCAT GATGGCTTGT GGTTGCGAGG CCCCTATCTC 
CACAATGGCT CCGTGCCTAC CCTGCGGGAT ATGTTGAAAA AACCGGAAGA TCGGCCCCAA 
GTATTTTACC GGGGTTACGA TCTTTTTGAT CCCATCAATG TAGGTTTCGT GTCCCAGGGA 
GAAGAGGCTG AGCGGATTGG TTTTCGCTAT GACACGGGGG TACCTGGCAA TAGCAACCAA 
GGCCATTTAT TTGGCACGGA TCTTCCGGAA GATCGGAAAG AAGCGTTGCT TGAATACTTA 
AAAACGCTTT GA

Protein sequence

MQSKIVRWII VLLALVLVIG AVGWYKLLRE VEQTSLKESS AAEWFKYGSI SSEEEQGVPY 
WIWRVLPKMF PEYLPAPGGY AALGVPWEQG QELPVGFSKK TIGFPRVAFN CAFCHSARYR 
LKADEPATIV VPGPGNTVRP QDYARFLAAS ANDARFNSDN ILEQISLIYE LSWLDRQLYR 
YLIIPMTKKA LIQYGQEFAW AQGKPPWGTG RIDPFNPIKF GILQMGIDAT IGNSDMMPLW 
NLKVREGDAL HWDGLNTNLH EVVISSAIGD GMTYKAIAHD SLDRIEAWLQ EVPSPASPFN 
ANENPASPYY LDEQQAAIGK AIYEQHCATC HAPGGERHRT VIPVEEVGTD RHRVDMWTAE 
AAKRYNAYQE DYDWGMRHFR DVDGYVAVPH DGLWLRGPYL HNGSVPTLRD MLKKPEDRPQ 
VFYRGYDLFD PINVGFVSQG EEAERIGFRY DTGVPGNSNQ GHLFGTDLPE DRKEALLEYL 
KTL