Gene NSE_0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NSE_0189
Symbol
ID	3931851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Neorickettsia sennetsu str. Miyayama
Kingdom	Bacteria
Replicon accession	NC_007798
Strand	+
Start bp	158171
End bp	159568
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	45%
IMG OID	637900345
Product	hypothetical protein
Protein accession	YP_506084
Protein GI	88608349
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAACATTG TAAAGAAACT GATCATCTCT GGTTGGCCTG TGTGGCCCAT AATAGAAGGT 
GGTAAAGGTG TAGCTGTAAG TGATGGGGTT TCGTCAGGTG CTTTTGCTGC TGCAGGTTGT 
GTAGGCACCT TTTCCGCCGT TAACGCAAAG CTTATAGATG ATAATGGGGA GATTGTCCCG 
CTCGAGTATC GTAGTAAGAC CAGAAAAGGG CGCCATGACG AACTGATCGA GTACAGCATC 
AAGAGCGCGA TAAGCCAGGC CAGGATAGCC CGTGAACGTT CAAAAGGAGA GGGAAGAATC 
CACATGAATG TGTTGTGGGA AATGGGCGGA GTCGAAAGAG TACTGGATGG CGTTTTGTCA 
AAGGTTAGTG GGTTAATTCA TGGGATCACT TGTGGTGCGG GTATGCCTTA TAAGCTCGCG 
GAAATAGCCT CACGCTACAA ATTGTGTTAC TACCCAATCA TTTCTTCTGT TAAGGCTTTT 
AGAATTCTGT GGAAGCGTTC GTACAGAAAG CTTAGTGAGT TTCTCGGTGG TGTTGTTTAC 
GAAGATCCGT GGCTTGCTGG TGGGCACAAC GGTCTTAGCA ACACTGATAG ACCGGACGAT 
ATACAGGATC CTTATCCAAG AGTTGTTGAG TTGCGTTCTT TTATGAATGA GAACGGATTG 
AGCCAAGTTC CTATAGTTAT GGCAGGTGGT GTATGGTCGC TCTCAGAATG GAAGCATTTC 
ATGGATAATG ATGAGGTGGG TGCAGTTGCG TTTCAGTTTG GTACGCGTCC TCTTGTGACA 
AAGGAAAGCC CGATTCCTGC CATATGGAAA CAAAGGTTAT TGCAAGCTAA AAGGGGTGAC 
GTCCTATTGC ACAAGTTCAG TCCCACTGGA TTTTATTCAT CTGCTCTAAA AAATAAATTC 
ATACAGGCTC TTATAGATCG TTCTGAAAGA CAGATTCCCT ATTCCGAATC TCTGGAGGGG 
GAGTTTGTGC TATCCTTCGA ATATGGTCCG CGTAAACGGC AGATCTTCAT AAGACATCCT 
GACGAGTCTT TAGTACAGGG ATGGCTTTCT TCTGGGTATA CAGAGGTTGT TAAGACTCCT 
GATCGTTCTG TTGTGTTTCT CACACCGGAT GAGTTTGCGT TGATTCGGGC AGATCAGATG 
AATTGTATGG GCTGCCTTAG CCATTGTAAG TTCAGCAATT GGAAAGACCA TGATGATTAC 
ACAACAGGTG AATTACCGGA TCCTAGAAGT TTTTGTATAC AGAAAACGCT TCAGAACATG 
GTATACGGGG CTGATCCTGA TACAGAGTTA GCCTTCGCTG GGCATAATGC GTATAGGTTT 
TCCACAGATC CTTTATACAG GGATGGACAC GTACCAACCG TAAAAGAACT GGTCGAGAAG 
ATTCTTGCTG GTGAATAA

Protein sequence

MNIVKKLIIS GWPVWPIIEG GKGVAVSDGV SSGAFAAAGC VGTFSAVNAK LIDDNGEIVP 
LEYRSKTRKG RHDELIEYSI KSAISQARIA RERSKGEGRI HMNVLWEMGG VERVLDGVLS 
KVSGLIHGIT CGAGMPYKLA EIASRYKLCY YPIISSVKAF RILWKRSYRK LSEFLGGVVY 
EDPWLAGGHN GLSNTDRPDD IQDPYPRVVE LRSFMNENGL SQVPIVMAGG VWSLSEWKHF 
MDNDEVGAVA FQFGTRPLVT KESPIPAIWK QRLLQAKRGD VLLHKFSPTG FYSSALKNKF 
IQALIDRSER QIPYSESLEG EFVLSFEYGP RKRQIFIRHP DESLVQGWLS SGYTEVVKTP 
DRSVVFLTPD EFALIRADQM NCMGCLSHCK FSNWKDHDDY TTGELPDPRS FCIQKTLQNM 
VYGADPDTEL AFAGHNAYRF STDPLYRDGH VPTVKELVEK ILAGE