Gene Noc_0289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0289
Symbol
ID	3706460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	315951
End bp	317456
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	55%
IMG OID	637736804
Product	leucyl aminopeptidase
Protein accession	YP_342348
Protein GI	77163823
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.823293
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTTC ACGTTACCAG TGGGACCCCC GAGAAACAAC GCACCGCTGC CCTTGTGGTG 
GGCATCTATG AAGACGAAAA ACTCTCTTCC TATGCCCAGC GGATTGATAA AGCCAGCGAA 
GGTTATGTGT CTCGGCTTAT CAAGCAAGGA GATTTTACCG GCAAAAAGGG ACAAGCCCTT 
CTGCTTTTTG CTCTCCCAGG CGTTAAAGCC GAGCGGGTTT TACTGATGGG ATGTGGCCAG 
AAGGACAAGG TAACGGCCAA GAATTTACGC CAGAGCTGGT CGGGCGCCGT CAAGGCGCTA 
CAAGCCTGTG GCGCTACCGA GGCAATGATC TGTCCGCTGG AAGCGAAGCC CAAGGACGAG 
GAACTTACCC AATGGGCGCG GCTCATCGTA GAAACGGCTG AACAGGCTTT ATATCGTTAC 
GAACACACTA AGAGCAAAAA GGAATCCTTA AAAAAGCCGC TCGCCAAGCT CACTTTGCTA 
TTGGATCAAC GCTCCCAACA ACCACTAGCG GAACAGGGTA TCCAGCAAGG TCAGGCCATT 
GCCAAAGGTG TTAACCTGGC CCGGGACTTG GGCAATCTAC CGGGGAATAT TTGCACGCCT 
ACTTATTTGG CCGACGAAGC CCGCCGATTA GCCAAAGAAT ACAAGTCATT AAAGGCAAAA 
ATCCTGGAGC AAGCCGAGAT GGAAAAGCTC GGGTTAGGAG CGCTGCTTGC CGTATCCCGG 
GGCAGCCGGC AGCCGCCCAA GCTCATTACC CTGGAGTATA AAGGCGCCCC CGGCAAGCAA 
AAACCCATTG TGCTGGTAGG TAAGGGATTG ACTTTCGATG CAGGCGGCAT CTCCATCAAG 
CCTGGGGAAC GCATGGACGA AATGAAATAC GATATGTGTG GCGGGGCAGG CGTTTTAGGG 
ACGATGCAAG CTTGCGCCGA GCTGGAATTG CCCCTCAACG TGATTGCCGT CGTACCCAGC 
TCCGAAAATC TCCCCGACGG CGCGGCTAAC AAACCGGGAG ACGTGCTTAC CAGCTTATCG 
GGCCAAACCA TCGAGGTGCT CAACACAGAT GCCGAGGGCC GTTTGATTCT CTGTGATGCG 
TTGACCTACA GCAAACGCTA CCGGCCTGAT GTGGTCATTG ATGTGGCGAC CCTCACGGGA 
GCCTGCGTGA TTGCCCTGGG TGCCCATGCC AGTGGTTTAC TGAGCAACGA TCAGAGCCTG 
GCGGAGCACT TGCTCGCCGC TGGACAAACC AGTGATGACC GTGCTTGGCA GCTTCCCCTC 
TGGGACGATT ACCAGCAGCA GCTGGACAGC AATTTTGCGG ATATGGCCAA CATTGGCGGC 
CGGGGGGCCG GCACTATTAC CGCGGCTTGT TTCCTGGCCC GCTTTACCGA AGAGTTTCGC 
TGGGCCCATT TGGACATTGC CGGTACCGCC TGGCTCAGCG GTAAAGAAAA AGGGGCAACC 
GGACGCCCGG TGCCTTTGCT CACCCAGTAT CTTATTCAAC GCGCCCAAGA AGCGAAAACT 
TCATAA

Protein sequence

MNFHVTSGTP EKQRTAALVV GIYEDEKLSS YAQRIDKASE GYVSRLIKQG DFTGKKGQAL 
LLFALPGVKA ERVLLMGCGQ KDKVTAKNLR QSWSGAVKAL QACGATEAMI CPLEAKPKDE 
ELTQWARLIV ETAEQALYRY EHTKSKKESL KKPLAKLTLL LDQRSQQPLA EQGIQQGQAI 
AKGVNLARDL GNLPGNICTP TYLADEARRL AKEYKSLKAK ILEQAEMEKL GLGALLAVSR 
GSRQPPKLIT LEYKGAPGKQ KPIVLVGKGL TFDAGGISIK PGERMDEMKY DMCGGAGVLG 
TMQACAELEL PLNVIAVVPS SENLPDGAAN KPGDVLTSLS GQTIEVLNTD AEGRLILCDA 
LTYSKRYRPD VVIDVATLTG ACVIALGAHA SGLLSNDQSL AEHLLAAGQT SDDRAWQLPL 
WDDYQQQLDS NFADMANIGG RGAGTITAAC FLARFTEEFR WAHLDIAGTA WLSGKEKGAT 
GRPVPLLTQY LIQRAQEAKT S