Gene Noc_2221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2221
Symbol
ID	3705101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2564885
End bp	2566918
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	57%
IMG OID	637738697
Product	peptidase S15
Protein accession	YP_344211
Protein GI	77165686
COG category	[R] General function prediction only
COG ID	[COG2936] Predicted acyl esterases
TIGRFAM ID	[TIGR00976] putative hydrolase, CocE/NonD family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTCA TTACTTCATT CCCCCGGCGG GTGCGCGAGA TCGAAAATTG TTGGATTTCC 
ATGTCTGATG GCTGCCGTCT AGCGGCCCGA ATCTGGCTAC CCGAGGATGC TACGCAATCC 
CCCGTACCGG CCATTTTTGA GTATATCCCC TACCGCAAGC GGGATTTCAC CCGTCCCCGC 
GACGAACCCA TGCATCACTA CTTCGCTGGT CACGGTTATG CCGCCGTACG GGTAGATGTT 
CGCGGTTCCG GGGACTCCGA TGGTCTGCTC CTGGACGAAT ACCTCCAGCA AGAACAAGAT 
GACGCCATAG AGGTTATCCG CTGGATCGCC TCCCAGCCTT GGTGTTCCGG CGCTATCGGG 
ATGATGGGCA TTTCCTGGGG GGGATTCAAC TCCCTCCAGG TAGCGGCCCT GCAGCCCCCG 
GCCCTTAAGG CAATCATCAC CCTCTGCTCC ACGGATGATC GCTATGCCGA TGATGCCCAT 
TACATGGGCG GCTGCTTGCT CAACGAAAAC CTGACCTGGG GCTCGGTCTT ACTAACCTTT 
AATGCTTATC CCCCCGATCC GGAACTGGTG GGCGAGCGCT GGCGGGAAAT GTGGATGGAG 
CGGTTGCAGC ATGCCGTTTT ATTTCCCGAA GTATGGCTGC GCCACCCCCG GCGCGATAGC 
TACTGGCGGC ATGGCTCGGT GTGCGAGGAC TATAGCCGTA TCCGCTGCCC CGTATACGCC 
ATTGGCGGCT GGGCCGACGC CTACTCCAAT GCCATTCCCC GGCTCCTAGA AGGGCTGTCC 
GTGCCTCGCA AGGGATTAAT CGGTCCCTGG ACCCATAGTT TTCCCCATGA GAGCGCGCCT 
GGACCCGCCA TTGGCTTTTT ACAGGAAGCG CTACGCTGGT GGGATCACTG GCTCAAAGGA 
ATCGATCGGG GAATTATGGA AGAACCCATG TATCGGGTGT GGATGCAGGA AAGCCTGCCG 
CCACAACCCT TTTACGAAGA ACGCCCCGGC CGTTGGGTGG CGGAACGCTG TTGGCCTTCT 
CCACGAATTA GGCCCTTGCG GCTGATATTA AACCCTAACC GCCTGGAGCA GGAGGCCACC 
ACCGAAACCA AACTGACGTT CCAGTCCCCG CAGACAACGG GTCTGGCGGC CGGCGACTGG 
TGCGGCTTTG GCGCGGATGG GGAAATGCCT ACTGACCAGC GGGAAGATGA TGGCAAATCC 
CTAACCTTTG ATTCCGTCCC ATTAGACCAG CACCTGGAAA TTCTGGGGGC ACCCGTAGCC 
ACCCTGGAAC TTGCCTTTGA TCGTCCTTGT GCTCTCATCG CCGTACGTCT GAATGACGTT 
GCGCCCAATG GGGCCTCAAG CCGGGTGAGC TACGGTCTAC TCAACCTCAC CCACCATAAT 
AGCCATGAAT TCCCTGAACC TTTAAAACCA GGTCGGCGCT ATACCGTGCG GGTTCAGCTC 
AATGACATCG CCCATGCCTT CCCTCCGGGC CATACCCTCC GACTGGCAAT CTCCACCAGC 
TACTGGCCGG TGGCATGGCC TTCTCCAGAA CCCGTTCATT TAACTCTGTT CACGGGCAAA 
AGCTATCTGG ACTTACCTGT GCGCTCCCCC GATCCCCAAG ACCAATCGCT CCGCCCTTTT 
GAACAACCAG AAAGAGCACC CGCCCCCGCG CATATGACCT TGCGGCCAGC AAGGTTCCAG 
CGCACTATTG AACGTAACCT TTCCACTAAT GAAACCTTGT ATACCATTTT CAGCGATGGC 
GGCGATTTCG ATGGAGCGGC AGTGGCTCAT CTCCATGCCA TCGACTTAGA CCTTGGCCAC 
ACGATTTTAA AACGCTTTCG TATCGGCGAA ACTGATCCAC TCTCGGCTCA GGCCGAAAAC 
GAGCAGAATG CCCTGCTCCG CCGCGGCGAC TGGGAAATTC GGATTAAGGC CCGAACCCGT 
CTGTCCTCAA ACTGGAATAG CTTTCACCTC CACGCCGATC TGGAGGCTTA TGAAGGCGAG 
ACTTTGGTTT TCTCCCGCAG CTGGGAGGAG ACTATCCCCC GTGATTTAGT CTAA

Protein sequence

MKVITSFPRR VREIENCWIS MSDGCRLAAR IWLPEDATQS PVPAIFEYIP YRKRDFTRPR 
DEPMHHYFAG HGYAAVRVDV RGSGDSDGLL LDEYLQQEQD DAIEVIRWIA SQPWCSGAIG 
MMGISWGGFN SLQVAALQPP ALKAIITLCS TDDRYADDAH YMGGCLLNEN LTWGSVLLTF 
NAYPPDPELV GERWREMWME RLQHAVLFPE VWLRHPRRDS YWRHGSVCED YSRIRCPVYA 
IGGWADAYSN AIPRLLEGLS VPRKGLIGPW THSFPHESAP GPAIGFLQEA LRWWDHWLKG 
IDRGIMEEPM YRVWMQESLP PQPFYEERPG RWVAERCWPS PRIRPLRLIL NPNRLEQEAT 
TETKLTFQSP QTTGLAAGDW CGFGADGEMP TDQREDDGKS LTFDSVPLDQ HLEILGAPVA 
TLELAFDRPC ALIAVRLNDV APNGASSRVS YGLLNLTHHN SHEFPEPLKP GRRYTVRVQL 
NDIAHAFPPG HTLRLAISTS YWPVAWPSPE PVHLTLFTGK SYLDLPVRSP DPQDQSLRPF 
EQPERAPAPA HMTLRPARFQ RTIERNLSTN ETLYTIFSDG GDFDGAAVAH LHAIDLDLGH 
TILKRFRIGE TDPLSAQAEN EQNALLRRGD WEIRIKARTR LSSNWNSFHL HADLEAYEGE 
TLVFSRSWEE TIPRDLV