Gene Noc_2029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2029
Symbol
ID	3705180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2341122
End bp	2342435
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	51%
IMG OID	637738505
Product	hypothetical protein
Protein accession	YP_344020
Protein GI	77165495
COG category	[S] Function unknown
COG ID	[COG1262] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03440] conserved hypothetical protein TIGR03440

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACCGA GCCAGGATGC AGTGGAGTTA AAAGAAATAG CGCCGGACAC TAGGGAGGAA 
GGGTTCACTT TTATGAGGCG CTACCGTCAG GTACGCCAGC TCAGTGAGAC CTTATGTCAG 
CCTTTGGTGG ACGAGGACTA TGTGATTCAG ACTATGCCGG ATGTCAGCCC GCCCAAATGG 
CATTTAGCCC ATAGCAGTTG GTTTTTTGAA AACTTTATTT TGATCCCTAA ATTCAAGGGC 
TATCAACCCT TCCATCCGGC CTATAGTTAT TTGTTTAACT CTTACTATGA GACCGTGGGT 
CAGTTCTGGC CTCGCCCGCA ACGAGGGCTG TTATCTCGTC CCACGGTAGC CGAGGTCTAT 
GCCTATCGCC ACCATGTGGA TAAGAACATG GTGCGCCTAG CAGAGAATTT GGAAGCGGAG 
AAGTGGCCGT CTGTTGCCTC CTTGATAGAA TTAGGACTTA ACCATGAGCA ACAACACCAA 
GAATTGCTCT TGACTGATCT TAAACATATC TTTGCCACCA ACCCACTCCG TCCCGCCTAC 
CAGGAGGGGG TTGTCCCTCA ATTCAAGGGA GCAAGAAAGA ATGGCAGCCT AGAATGGTAT 
GACTACAAGG GAGGACTGCA TGCCTTGGGG TATTCCGGAG AAGGTTTTGC CTACGATAAT 
GAAAGTCCTA ATCATCTTGT TTACTTGCGC GATTTTCGCC TCGCTTCGCG CCTCGTGACC 
AACAGGGAAT ATCTAGCCTT TATGGCGGCG GGAGGATATC GAGAACCTCG CTACTGGCTT 
TCTGAGGGTT GGCATACGGT GCGGCAAGAA GGTTGGCAGG CGCCATTGTA TTGGGAGCAG 
CAGGGCGAAG GTTGGTGGCA AATGACTCTC CATGGGATGC AACCTGTTCA GAAAGAGGCT 
CCCGTATGTC ATCTGAGCTA TTATGAAGCT GACGCCTATG CCCGCTGGGC AGGTTATCGG 
CTGCCTACAG AGGCTGAATG GGAAATCGTG GCGCGAACGC TGCCATGTCG GGGTAATTTT 
TTGGAGTCAG GGGCCTTACA GCCCTTACCC GCGCCTCCAG CAGCCCCTAC CCCGGTTCAA 
ATGTTTGGGG ATGTCTGGGA ATGGACCGGG AGTCCCTATG CGCCCTATCC TGGTTATCAG 
CCTTCCGAGG GAGCTATTGG TGAATACAAT GGAAAATTTA TGTGTAATCA AATGGTTTTA 
CGAGGTGGTT CCTGTATCAG CTCATCTGAG CATTTGCGTG CTTCCTATCG CAATTTTTTC 
CCTCCCCACG CCCGTTGGCA ATTTACGGGC CTTCGATTAG CGGATGATGT ATGA

Protein sequence

MIPSQDAVEL KEIAPDTREE GFTFMRRYRQ VRQLSETLCQ PLVDEDYVIQ TMPDVSPPKW 
HLAHSSWFFE NFILIPKFKG YQPFHPAYSY LFNSYYETVG QFWPRPQRGL LSRPTVAEVY 
AYRHHVDKNM VRLAENLEAE KWPSVASLIE LGLNHEQQHQ ELLLTDLKHI FATNPLRPAY 
QEGVVPQFKG ARKNGSLEWY DYKGGLHALG YSGEGFAYDN ESPNHLVYLR DFRLASRLVT 
NREYLAFMAA GGYREPRYWL SEGWHTVRQE GWQAPLYWEQ QGEGWWQMTL HGMQPVQKEA 
PVCHLSYYEA DAYARWAGYR LPTEAEWEIV ARTLPCRGNF LESGALQPLP APPAAPTPVQ 
MFGDVWEWTG SPYAPYPGYQ PSEGAIGEYN GKFMCNQMVL RGGSCISSSE HLRASYRNFF 
PPHARWQFTG LRLADDV