Gene Noc_2009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2009
Symbol
ID	3705199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2317596
End bp	2318786
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	51%
IMG OID	637738486
Product	hypothetical protein
Protein accession	YP_344001
Protein GI	77165476
COG category	[S] Function unknown
COG ID	[COG1690] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0383885
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAACACG ACGGCACCAT ACGCACCAAT GGGAAAGCGA TCATTGAAAC GGATAACTTG 
CCAATAAAAC TGTGGTTGGA AGAGGATCAA ATGGAAGAAG GGGCGCTGGA GCAGGCGCGA 
AATCTTGCGA ATCTTCCATT TGCCTTCAAA CACATTGCTA TCATGCCTGA TACCCATCAA 
GGCTACGGCA TGCCTATCGG TGCTATATTG GCCACCAAGG GGGCTATTAT ACCCAATGCT 
GTCGGTGTGG ATATTGGGTG CGGCATGTGT TCCTTGCGGA CCAATCTCGA GCATATCGAA 
ACGCCAAAGC TGAAAGAGAT CATGGGTATC ATCCGCAAGA CCGTTCCTGT GGGCTTTGAG 
CATCACAAAA CGCGTCAAGA CGAAGCCTGG ATGCCTGAGA GAAAGGGGGA ATTACCCATT 
GTTGAGCAAG AGTATGAAAG TGCCCTTTAT CAGATCGGTA CATTGGGCGG AGGCAATCAT 
TTCATCGAAA TACAAAAGGG ATCGGATGGC TATATCTGGA TTATGATTCA CTCCGGCTCC 
CGCAACATTG GTTTCACGGT GGCCAACCAT TACGAGGGCG TAGCGAAAAA GATGAACCAG 
GACGCCGGCG AGGACGTGTC GCAGGAACTG GCATATATTC CCGAAACGTC TGAATATTTC 
AAACTGTATT GGAACGAAAT GAACTATTGC CTCGAATTTG CACTGGCCAA CAGAAAACTG 
ATGATGGAAC GGGCCAGGTC GGCGTTTACC GAGATTTTAC CCGAGGTCGA ATTCGCGGAT 
TTTATCAATA AACCTCACAA CTTCGCGGCC GAGGAAAAAC ATTTTGGAGA GTGGGTCATC 
GTCCATAGAA AAGGCGCGAC GCGAGCCCGA AAAGGAGAAT GGGGAATGAT CCCCGGCTCC 
CAGGGCACAC GGTCTTTTCT CGTGAAAGGG AAAGGAGAAG CCCAGTCTTT CGAATCGTGC 
GCGCACGGTG CCGGAAGAAT CATGAGCCGA ACAAAAGCGC GCAAAACACT GGATCTGAAG 
GAAGAGGTAA AGGCCCTGAA AGACCGAGGA ATACTACACG CTATCCGCCA CCGCAAGGAT 
CTGGATGAAG CGCCGGGATC TTACAAGGAC ATCGATGAGG TAATGGCAAA CCAGGTCGAT 
CTGGTCGACG TGCAAATCGA GCTGCAGCCA CTGGCTGTCA TCAAGGGTTA A

Protein sequence

MKHDGTIRTN GKAIIETDNL PIKLWLEEDQ MEEGALEQAR NLANLPFAFK HIAIMPDTHQ 
GYGMPIGAIL ATKGAIIPNA VGVDIGCGMC SLRTNLEHIE TPKLKEIMGI IRKTVPVGFE 
HHKTRQDEAW MPERKGELPI VEQEYESALY QIGTLGGGNH FIEIQKGSDG YIWIMIHSGS 
RNIGFTVANH YEGVAKKMNQ DAGEDVSQEL AYIPETSEYF KLYWNEMNYC LEFALANRKL 
MMERARSAFT EILPEVEFAD FINKPHNFAA EEKHFGEWVI VHRKGATRAR KGEWGMIPGS 
QGTRSFLVKG KGEAQSFESC AHGAGRIMSR TKARKTLDLK EEVKALKDRG ILHAIRHRKD 
LDEAPGSYKD IDEVMANQVD LVDVQIELQP LAVIKG