Gene Noc_2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2137
Symbol
ID	3705329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2464579
End bp	2465691
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	52%
IMG OID	637738613
Product	hypothetical protein
Protein accession	YP_344127
Protein GI	77165602
COG category	[S] Function unknown
COG ID	[COG5345] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.363757
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTGA CAAGTTCTAT TGCGCACAAA TCAAAGGAAG GCGCTCGCCG CCTGGCCTGG 
CTATACCGTC CCCGAACTTG GAAAGAGAAA GGGCTTCTCT GGACAATTGG CCTTGCCTTA 
GCTACCTATA TGGTCATCGT GGTGATTCTA GGCATCCTCT GGTCGTTTGA ACCAGAAGTT 
TTCGACGGCC GCACTCATAC CCAAGAAGTT GCCGCCGTAT TTGCTAAAGA CATTGCTGAC 
GAAATGGACT TGCCCCAAAG CAAACGGAAG GAGTTGCCCG CCGGCTTTAT TGCCACGAGC 
ACGGCAATTC ACGTCGCTAG AACTTTGTTG GAAAAACCAG GCGGTTATCT TAGCAACGAT 
GTTTTCCCTC CCGGCGTCTA TCTGGATAAT ATTCCCAATT GGGAATTCGG CGTATTAGTC 
CAGTTACGGG ATTTTGTGCG CAATCTGCGC AACGATTTTT CCCGCGCCCA GACCCAGTCC 
CTTGAGGACA AGGATTTGCA GATTGCCGAT CCCCAGTTTA ATTTCAACTC GGAATCCTGG 
ATACTCCCCA CCACGGAAAG CCAATACCGG AAAGGCAACA AGGCATTGCT CAGTTATTTA 
AAGCGTCTCT CGGACGACAA AAAAAATGAT GGCCACTTCT TTGTCCGCTC CGATAACCTG 
CGCTCCTACC TGGAAGTGGT GGAAAAACGG CTGGGGGGAT TAACCCAACG CTTAATAGCC 
GCCGTGGGCG AAGTGCAATT CAATGTTAAC CTGGCGGGGG AACGGCAAGG CCGCTCAGCC 
AAGCCCGAGC CCCGCGAGGT CCGGGTCAAG ACCTCGTGGT GGGAAATCGA CGATGTATTT 
TATGAAGCCC GTGGCTCTGC CTGGGCTCTT GTTCACTTTC TTCATGCCTT GCGGATCGAG 
TTCGAGCATG TCCTCCAGGA TAAAAACGCC GAGGTTAGCT TGGCACAGGT TATTCGTAGC 
CTAGAAAATT CCCAGAAAAC TCTCTGGAGT CCAATGATAC TCAACGGCGA TGGTTTCGGC 
ACGTTGGCTA ACCACTCTCT AGTGATGGCC TCCTATTTAG CCGCAGCTAA CGCCGCGCTT 
ATCGATCTCC GCAATCTGTT AAAGCAAGGT TAA

Protein sequence

MSVTSSIAHK SKEGARRLAW LYRPRTWKEK GLLWTIGLAL ATYMVIVVIL GILWSFEPEV 
FDGRTHTQEV AAVFAKDIAD EMDLPQSKRK ELPAGFIATS TAIHVARTLL EKPGGYLSND 
VFPPGVYLDN IPNWEFGVLV QLRDFVRNLR NDFSRAQTQS LEDKDLQIAD PQFNFNSESW 
ILPTTESQYR KGNKALLSYL KRLSDDKKND GHFFVRSDNL RSYLEVVEKR LGGLTQRLIA 
AVGEVQFNVN LAGERQGRSA KPEPREVRVK TSWWEIDDVF YEARGSAWAL VHFLHALRIE 
FEHVLQDKNA EVSLAQVIRS LENSQKTLWS PMILNGDGFG TLANHSLVMA SYLAAANAAL 
IDLRNLLKQG