Gene Noc_1387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1387
Symbol
ID	3706073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1536473
End bp	1538791
Gene Length	2319 bp
Protein Length	772 aa
Translation table	11
GC content	52%
IMG OID	637737881
Product	peptidase S16, ATP-dependent protease La
Protein accession	YP_343410
Protein GI	77164885
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0466] ATP-dependent Lon protease, bacterial type
TIGRFAM ID	[TIGR00763] ATP-dependent protease La

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAACA ACGCTTATCC AACATTGCCG CTTAAAAATA CTGTCCTCTT TCCCCACCTG 
GTCCTTCCCC TGTCGGTGGG GCGAGCAGGA TCTATAGCCG CAGTCGAGGC GGCGCTGAGC 
AGCGAAGATA AACTAATTGC TGTCTTTCCT CAAAAGGATC CCCGGACTGA CGAACCCGCT 
GCGGATGATT TATTCCGCTT TGGCACGGTA GGAATCATCA AAAAGATGGT CAGGAGCGAG 
GATACGGTTC AGATTCTAGT TCAGGGAATA GAGCGGGTTG AGCAGCTAGA AATGGTCCAG 
AAGCAACCTT ATCTTTCCCT CAAAATTGCC ACTCTCTCTG AACCCTCGGA TACGGGCACT 
GAAATCGAAG CCTTGCACCG AACTGTTATC GAACTCGCTG GCAAAATGAT TGAACTGGTG 
CAACCCCAGA TCCAGGTCGG CATCCACCAC ATTATTTCCG ACGTGGAAAA GCCCCTCCAC 
CAGATCTATC TTCTCACCTC TATCCTCTCG CTGGATTTTG ACAAGGAGAA AGAACTGCTG 
GCTGCCGCTA CCCAGGTAGA AGCCTTGCAG TTAATGCACC GTTATCTTAA CCACGAAGTG 
CAGGTTCTGG AGGTGCGGCA AAAAATCACC AGCACCGCCC AAACAGAGAT AGATAAGAAA 
CAGCGTGAAT ATGTCCTACG CCAGCAATTA GAGGCCATCC AAGAAGAACT GGGGGAGACT 
AACCCTGAAC AGGCTGAGAT CAAGGAGTTA CGCCAGCGAA TGGAAGAAAC GGAACTCCCG 
GAGCTGGTCC GCAAAGAAGT GGAGAAAGAA ATTACCCGAT TGGAACGGAT GCCTTCGGCT 
GCTCCTGATT ATCAGCTGAC CCGCGGTTAC GTGGAGCTAG CCCTAGAATT ACCCTGGAAT 
AAAACCACGG AAGATCGTTT AGATCTCAAA AGGGCGCGCG AGATCCTCGA TGAAGATCAC 
TTCGACTTGG AAGACGTCAA AGAACGGATC ATCGAACATC TGGCGGTGAT GAAACTCAAC 
CCGGAAGCTA AATCGCCCAT TCTTTGCTTC GTTGGCCCCC CTGGAGTTGG TAAAACCTCG 
GTGGGACAAT CCATGGCCCG CGCCTTGGGA CGAAAATTCG AGCGCATGAG TCTTGGTGGC 
CTGCATGATG AATCGGAGTT GCGCGGCCAT CGCCGCACCT ACATTGGTGC TATGCCTGGC 
CGAATCATTC GCGCCATTCG CCGTACTGGT TACCAGAATC CGCTTCTAAT GTTGGATGAA 
ATCGACAAAC TGGGCCGGGA TTTTCGCGGC GATCCGGCGG CGGCATTATT AGAGATTCTT 
GATCCCGCCC AGAATGCCGA ATTTCATGAT AACTACTTGG ATCTGCCTTT CGATCTTTCT 
AAAATCTTCT TCGTCACCAC CGCTAATACG TTAGATACCA TCCCCCGCCC TCTGCTTGAT 
CGGATGGAGA TTCTGCGGCT ACCGGGGTAC AGTGACGAAG AAAAACAACA TATCGCCCGT 
CGTTATCTAA TTGGACGGCA AATTAGAGAA GCCGGCCTTT CCGAGATCCA ACTCTCCATA 
CCGGATGAGA CATTAAGTTA CCTTATTCGG CGTTATACTC GGGAAGCCGG AGTGCGTGAA 
CTAGAGCGGA TGCTGGGGCG AATTGCCCGC AAAGTGGCTA CCCAAGTCGC CACTGGTCAA 
ACTCAGCCGG TAACCGTCAC GCCGCAAGAC CTTGTCGAAT TACTAGGACC AGAGCGATTT 
TTCGCTGAAG AAATGCGCCA GCAGCTCGCC CCCGGGGTCG CGGCAGGCTT AGCTTGGACC 
GAAGCGGGCG GCGATGTCTT GTACGTGGAA GCGGCTCTGC TACCAGAAGG GAAAGGGATG 
ACTCTGACGG GACAGCTGGG CAGTATCATG CAAGAATCAG CAAAAGCTGC CCAAAGCTAC 
CTCTGGTCCC GCGCCGAAGA ACTTAACATC GATCAAAAAA CCATCCGGGA ATCGGGGGTC 
CACATTCATG TTCCAGCGGG CGCTATCCCT AAAGATGGCC CCTCGGCCGG AGTCACCATG 
GCTTCAGCAC TCACTTCCGC TTACGCCCAT CAACCTGTTC GCAGCGATAC GGCAATGACA 
GGGGAAATAA CACTGAGTGG TTTAGTCCTT CCCGTGGGAG GGATTAAAGA GAAAGTGCTT 
GCCGCCCACC GGTCCGGCAT CCAGCGGATC ATTCTTCCCA AAGAAAATGA GAAAGACTTG 
CGGGAAATTC CCGAGCATGT CCGGCAAAGC ATTCAATTTA TTCTAGCCAG ACGGATTGAA 
GAGGTGCTAG CTGAAGCTAT CCCAGATTTA AATAGGTGA

Protein sequence

MENNAYPTLP LKNTVLFPHL VLPLSVGRAG SIAAVEAALS SEDKLIAVFP QKDPRTDEPA 
ADDLFRFGTV GIIKKMVRSE DTVQILVQGI ERVEQLEMVQ KQPYLSLKIA TLSEPSDTGT 
EIEALHRTVI ELAGKMIELV QPQIQVGIHH IISDVEKPLH QIYLLTSILS LDFDKEKELL 
AAATQVEALQ LMHRYLNHEV QVLEVRQKIT STAQTEIDKK QREYVLRQQL EAIQEELGET 
NPEQAEIKEL RQRMEETELP ELVRKEVEKE ITRLERMPSA APDYQLTRGY VELALELPWN 
KTTEDRLDLK RAREILDEDH FDLEDVKERI IEHLAVMKLN PEAKSPILCF VGPPGVGKTS 
VGQSMARALG RKFERMSLGG LHDESELRGH RRTYIGAMPG RIIRAIRRTG YQNPLLMLDE 
IDKLGRDFRG DPAAALLEIL DPAQNAEFHD NYLDLPFDLS KIFFVTTANT LDTIPRPLLD 
RMEILRLPGY SDEEKQHIAR RYLIGRQIRE AGLSEIQLSI PDETLSYLIR RYTREAGVRE 
LERMLGRIAR KVATQVATGQ TQPVTVTPQD LVELLGPERF FAEEMRQQLA PGVAAGLAWT 
EAGGDVLYVE AALLPEGKGM TLTGQLGSIM QESAKAAQSY LWSRAEELNI DQKTIRESGV 
HIHVPAGAIP KDGPSAGVTM ASALTSAYAH QPVRSDTAMT GEITLSGLVL PVGGIKEKVL 
AAHRSGIQRI ILPKENEKDL REIPEHVRQS IQFILARRIE EVLAEAIPDL NR