Gene Noc_1869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1869
Symbol
ID	3705443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2125409
End bp	2126629
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	51%
IMG OID	637738348
Product	hypothetical protein
Protein accession	YP_343865
Protein GI	77165340
COG category	[R] General function prediction only
COG ID	[COG3500] Phage protein D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACGCT ACCCGCGCTA TGCGCCCACT TTCGAGATCA AGATCAATGG TGAGAAACTG 
CCGATAGCCA TGCGGGCCTC CGTAGTATCG GTAAGTTATC AGGATGGCAT TGAAGGTGCC 
GACCGGGTGG AAATCACTTT GGCGAATGAT AATTTGCGCT GGCTAGATCA TTCGTTGCTG 
CAGGTGGACA ACGGTTTCAC GCTTTCCATT GGCTATGCGC CGGATCCCTT AGAAGAAGTT 
TTTGTGGGAG AAATTACTGG GGTGAATGCT TCGTTCCCAA ATGGCGGAAT GCCCACGCTC 
ACTGTGGTGG CTCATGATTT TTTACAGCGT TTGACAATGG GCACCAAAGA CCGAGCTTTT 
GCTTTGAATG TACCCTGTAT CGGAAAATTC TCGCTTCCTG ATCCTCATGT AGTGACCTTG 
GTGAGTGCAG TGGATTTATT GATTCCTGTG GTCGATCCGG CTGGTGCTGC GCTCTCATTT 
CTGACGCTGC TGGTGGCTTA CGCCCTTGAT CCCTTGGAAG CCAAGCAGGG CATTCGCCTG 
CAGCAGAGCC AAAGTGATTT TGATTTTTTA TCTATGGTCG CTAAGGAAAA CGGCTGGGAG 
ATGTATATCG ACCATGCGAT GGAGCCAAAG GGCTATGTGC TGCGGTTTCA ATTTTTAATT 
CAGGATTATG CGCCAAGTGC CACGCTGAAA TGGGGTGAAT CGCTGAGCGA GTTCACGCCG 
CGTCTATCCA CGGTCGGCCA GGTGGCTGGG ATTTCCACGC GTATTTGGGT TCCTAGCATC 
AAGATGGAGT TCGTGCTCGT TTTATCTTGG GACTTTGATC GTGCCGCATT TGATCTCATG 
GTGTTTCCAG GACTTGGCAG CCTGGAAGAG TTACTTGGCT CTACTAAGGC GCAGGGTGTC 
TTAAAAATCG ATGCAATTGG GCCGGCCACA GCGCCAAAGA AGATCTTGAG CGAATTATTA 
CCCCGCCTTA ACAACCGGTT AACCTGTAGC GGCAGCACTA TCGGAGATCC ACGTATCAAA 
GCTAGTAGAG TGGTTAGCTT CGAAGGTTTG GGTGAGCAGT TCAGCGGTCT TTATCGCGTG 
ACTTCCGCAA CTCATACGAT GGATGGCAGT GGTTACCGGA CTCAGTTTGA AGCTAGAAAA 
GAAGTATGGT TTGGATCGAT ACCCGTGCCG AAAGGGGTAG ATGGATTAGT GCGTGTGCAA 
GGCCAGAGAG TCGGCCAATA G

Protein sequence

MARYPRYAPT FEIKINGEKL PIAMRASVVS VSYQDGIEGA DRVEITLAND NLRWLDHSLL 
QVDNGFTLSI GYAPDPLEEV FVGEITGVNA SFPNGGMPTL TVVAHDFLQR LTMGTKDRAF 
ALNVPCIGKF SLPDPHVVTL VSAVDLLIPV VDPAGAALSF LTLLVAYALD PLEAKQGIRL 
QQSQSDFDFL SMVAKENGWE MYIDHAMEPK GYVLRFQFLI QDYAPSATLK WGESLSEFTP 
RLSTVGQVAG ISTRIWVPSI KMEFVLVLSW DFDRAAFDLM VFPGLGSLEE LLGSTKAQGV 
LKIDAIGPAT APKKILSELL PRLNNRLTCS GSTIGDPRIK ASRVVSFEGL GEQFSGLYRV 
TSATHTMDGS GYRTQFEARK EVWFGSIPVP KGVDGLVRVQ GQRVGQ