Gene Noc_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1940
Symbol
ID	3705477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2219606
End bp	2220733
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	55%
IMG OID	637738416
Product	hypothetical protein
Protein accession	YP_343932
Protein GI	77165407
COG category	[H] Coenzyme transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0189] Glutathione synthase/Ribosomal protein S6 modification enzyme (glutaminyl transferase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTGGA GACTGCGCCA GCGCGTTAGC CGGTTTTGCA AAGATTTTGC CGCGTTGCCG 
GGGGTACTGT GGGAACATGG CAGGGCGGCG CGAAAGGCCT CTGGGAAGTC ACTACTGGGT 
CAGGCTTCCG AGATGATTGC CCTGCGCTGG GGCAAGGGCC GCTTGGCTCC TGATGAATAC 
TATCAGTATT GTTTATTTGA TGATCGGCGT TTCAGCCCCG AGCAGAAGCG GACTTTCCTT 
GGTCGGCACA TGCAGTACGA TCTATGGGAG CTGTTCGATT CCTGGTCATG GCATGCCATT 
GCGAACGACA AGCTGGTGGC ATGCAGCCTA TTTGAAGCCT TGCAATTGCC GTCGCCCAAA 
TTGTACGGGT TCTTTCATCC GATACGCCGC CATGGCGCCT TGCCTATAGT GCGAAACGGG 
GCGCAGCTCG GGCAGTTTCT TCGTGAACAG GCGCCATTCC CTTTGGTTGC CAAGCCTGTG 
CTTGGAATGT GGGGTAAAAA TGTATACGCC ATCGAGCGCC TTGAGCATGA AAGCGATGAA 
CTGGTGCTGG TTAATGGGAA GCGTATGGCT ATAGCGGATT TTGTGGCTGC TCTTGAGCCC 
CTGGTGAAAC AAGGGTGGCT CTTTCAGGAG CTTTTGAAGC CACATCCCAT GCTATTGGAA 
CTATGTGGTA ACCGCATTTG CAGTGTCCGC GTAGTGACCC TGCTGGACCC GGCGCCTATC 
ATAATTAGCA CTCTCTGGAA AGTCGCTGTG GGCAACGCAA TGGCTGATAA TTATTGGGAG 
CCTGGAAATT TAGTAGGGCC TATCGACCCT GAGACGGGAG TCGTGGGGCA GATGTTTACG 
GGTTTGGGGT TACAACGCCG CAATGTTTCC GAGCACCCGG ATACGGGGGA GAAGCTGGTA 
GGGATTACTT TGCCCAACTG GGAGCAGACG CTGGAACTTT GCCGGGAGGG CACGGCGTCA 
TTGCCAGGCC TAAAAATGCA GGCGTGGGAT ATTGCGTTGA CCGATCGGGG GCCGGTGATG 
CTCGAAGTCA ATATCATCGG CGGGGTACGC TTGCCCCAGC TGGTAGTTGA TGCAGGCATG 
AATCGAGGTC CATTGAGAGA GATGCTGCGC AAACATAGAT ATATGTAG

Protein sequence

MFWRLRQRVS RFCKDFAALP GVLWEHGRAA RKASGKSLLG QASEMIALRW GKGRLAPDEY 
YQYCLFDDRR FSPEQKRTFL GRHMQYDLWE LFDSWSWHAI ANDKLVACSL FEALQLPSPK 
LYGFFHPIRR HGALPIVRNG AQLGQFLREQ APFPLVAKPV LGMWGKNVYA IERLEHESDE 
LVLVNGKRMA IADFVAALEP LVKQGWLFQE LLKPHPMLLE LCGNRICSVR VVTLLDPAPI 
IISTLWKVAV GNAMADNYWE PGNLVGPIDP ETGVVGQMFT GLGLQRRNVS EHPDTGEKLV 
GITLPNWEQT LELCREGTAS LPGLKMQAWD IALTDRGPVM LEVNIIGGVR LPQLVVDAGM 
NRGPLREMLR KHRYM