Gene Noc_0099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0099
Symbol
ID	3705859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	99270
End bp	100871
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	52%
IMG OID	637736615
Product	glycoside hydrolase family protein
Protein accession	YP_342162
Protein GI	77163637
COG category	[S] Function unknown
COG ID	[COG1543] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAGCG GTTATCTAAG CCTTATCCTA CATGCCCATT TGCCTTATGT GCGGCATCCT 
GAACAGGAGG AAGCGTTAGA GGAACGGTGG CTGTTTGAAG CCATGACTGA ATGTTACCTT 
CCCCTCCTGA CCACTTTTGA ACGGCTAACG AATGAGGGAA TTCCGTTTTA CCTGACACTC 
TCCTTATCCC CAACCTTGCT CTCCATGCTT CAAGACCCCC TATTGCTGCA GCGCTATGGA 
CTTCACATGG AGAAGCTTAT TTCCCTAGCC GAGAAAGAAA TCCGATATAC CCGGGGCAAT 
ACTGATCTTA ACCGGCTGGC GCGCCTTTAC CGGCGCTGGT TTTTGCAGAC ACTTTCAGAC 
TTTGAGGAGC GTTATCAGCG CCAATTGGTG CCGGCTTTTG CCCGTCTCCA GCAAGAAGGG 
GTCCTTGAGA TTATTACTTG TGCCGCTACC CATGGCTTTT TACCCTTGCT ACAACCGGAG 
CCCACGGCTG TCTACGCTCA GCTCCAGGTT GCCGCTGATT ACTACCGGCA ATGTTTTGGC 
ATTGCTCCTA AAGGCATTTG GCTGCCCGAG TGCGCTTATT ACCCAGGGCT TGAAAAGGTA 
TTAAAAGCAG TAGGTTTCCG TTATTTTTTC ATTGAAACTG AAGCCCTTCT CCATGCCAGC 
ACTCGGCCTC GCTATGACCA TTTCGCTCCC GTTGCCTGCC CGAATGGGGT GGCTGCCTTT 
GGGCGGGAGC CAGCACTTTC GCGGCAAGTT TGGAGCGCCG AGGAAGGCTA TCCTGGCGAC 
GGTGATTACC GGGAATTCTA TCGGGATGTG GGCTTTGAAC GAGAACTGAG TTACCTTCAA 
CCTTATCTTC CTGATGGCCG AATCCGGGTC GATACCGGCA TGAAATATTA TCGGGTAACC 
GATAAAACTG AGTATAAAGC TCCCTATCAA CCTGCTAAGG CCCAGGCTAG GGTTGCTTGC 
CATGCCGGTC ACTTTTACCA CCATTGCCTG CAACAGATAA CAGGCGCCAA CAGGATGGAC 
CGGCCACCGC TCCTGGTTGC CCCTTACGAT GCCGAATTGT TTGGTCATTG GTGGTTTGAA 
GGCCCCCAAT GGCTCGAGCA GTTACTACGC CGGATCGGGA CAGGGGAGGG AGCAATTCAA 
ACCATCACCC CTTCCCAGTA TTTGACTCAA CACCCTGTGC TCCAGCAAGC GACACCGAAC 
CTATCCAGCT GGGGCGATAG GGGCTATTAT GATTTTTGGC TCAATGAAAA AACTGACTGG 
ATATACCCCC TGTTGCACCG GGCCGCGCGG CGCATGAAGG AGCTTACGAT AGCTTATGGC 
CACGAGTCTA AGGGAACCCT TGCCGGCCGT GCCCTGGGAC AGGCCGCTCG CTCACTGCTA 
TTGGCCCAGG CTTCGGATTG GCCTTTTATC CTTCAAAATG GAACGACGGT GGAGTACGCC 
ACTCGCCAGC TACAGGATCA TTTGTCCCGC TTTCATTATT TAGAAATGGT TTTGGAAAGG 
AAAAGCTTTG ATGAGCGCCG GCTACAGGCT TTGGAGGCCC TTGATAATAT CTTCCCGGAA 
CTTGATTACC GCGTTTACAA ACACCCCTAT AGGGAACGAT AA

Protein sequence

MASGYLSLIL HAHLPYVRHP EQEEALEERW LFEAMTECYL PLLTTFERLT NEGIPFYLTL 
SLSPTLLSML QDPLLLQRYG LHMEKLISLA EKEIRYTRGN TDLNRLARLY RRWFLQTLSD 
FEERYQRQLV PAFARLQQEG VLEIITCAAT HGFLPLLQPE PTAVYAQLQV AADYYRQCFG 
IAPKGIWLPE CAYYPGLEKV LKAVGFRYFF IETEALLHAS TRPRYDHFAP VACPNGVAAF 
GREPALSRQV WSAEEGYPGD GDYREFYRDV GFERELSYLQ PYLPDGRIRV DTGMKYYRVT 
DKTEYKAPYQ PAKAQARVAC HAGHFYHHCL QQITGANRMD RPPLLVAPYD AELFGHWWFE 
GPQWLEQLLR RIGTGEGAIQ TITPSQYLTQ HPVLQQATPN LSSWGDRGYY DFWLNEKTDW 
IYPLLHRAAR RMKELTIAYG HESKGTLAGR ALGQAARSLL LAQASDWPFI LQNGTTVEYA 
TRQLQDHLSR FHYLEMVLER KSFDERRLQA LEALDNIFPE LDYRVYKHPY RER