Gene NSE_0023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NSE_0023
Symbol
ID	3931447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Neorickettsia sennetsu str. Miyayama
Kingdom	Bacteria
Replicon accession	NC_007798
Strand	+
Start bp	18761
End bp	21073
Gene Length	2313 bp
Protein Length	770 aa
Translation table	11
GC content	48%
IMG OID	637900180
Product	hypothetical protein
Protein accession	YP_505926
Protein GI	88608147
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACACAA AGATATGTGA AGCAATTAAA AGTTCGGACA TTCTTACTTT AAGGTGTCTA 
ATGCAAGAGG CAGGATTGGA GGAAGCGAAC GGTACTGCCT CAGCACAAGG TCGACCTCTC 
TGGTCCATGG TTGATTCTGA TGGGCGTAGT GTTCTGCAAG TTGCTGTAGA AAGTCAAAAT 
ACAGGTGTGC TTAAATGCGT GATGGAGGCA CTACCCGGTA ACTGCTTAGT AGATCTGTGT 
GCTAAGAAGA CAAGTACGAG CCATCCTTTT TTCCCTGAAA GCACCCCACT GCACACCGCA 
ATTGCAGTTG GGCGCATGGA AGTCCTGGAG TCACTACTAC GCGGAATGTT AAGCGCGCGT 
GGACAAAATG GTAAACCGCC ATCTAGTACT GTGGTTGTTT GGCATACGGC TGATGCAAAT 
GGGCGAACAC CTTTAGCCGC CGCATTGGCC ACCGGCAAGC TAGAGATTGT GAAGCTAGTC 
CTTGGAGCAA TAAAGACTCT GGAGCGAGAT ATGCAGACGG CTAGAGGAGA TCGTGTACCA 
CTGGTCCCCG GTATTCTTCA AATTGATGAT ATCAGAGTTA GGGGTGATAA CGGACTTAAT 
ATGGCTGTAT CTACAGGTAA TGTGGGTATA GTTGAGGTTC TGATCGATGC TCTGACTCCT 
GAGGAGCTGG CACCTATACT AACAAGGTGT AATTTAGTGG GTGACACTGC ACTTGACCAG 
GCCGCGCGTG CAGGAAATGT AGACATTGTG AGGCTTTTAG TCAAAAAGCT GGGGGATTTG 
TATGAGCCGT GGGTTAGTAC ACCTTTCCAG GTTGTTGTGG AGTCCTGCGC GGAGAGTAAA 
TACAAAGGGA ATGGAGCGCA AGTTCCAGAG CACTTTTCAA TGCGTCTTTT GGGTAACGCA 
GTTTCGAGTG GTAATGCTCA AGTTGTTAAG GAAGTTTTAG GACCTCTGTC TATCGAAGAG 
CGGTATAAGC TGTTGAGTCG TACCAGTTGG GGTTATCCTT ACCCTGCACT ACACCTGGCA 
TTCTCCTCAG GGGCACACGA ATGCGTAAAA ATAATGCTTG ACTCGCTTGT TGCTTGTCCT 
GGTGGAGGTA CGAAGTATGT GTCAAAAGTT CTTGCTCAAC GTTCCGGTGG GCTTACTCCG 
CTGCATTGTG CCGTTGATGC CAAGTCAGTT GCGGTAGTAC AAGGGTACGG ACTACCGAAG 
GGGGTCCTGT TCGGGCTACT TACGGCTGGA GGCTCGTCCT GTTCTCCTGA AGGACCTGTT 
TACGTGCCTG ATGGTATGAA TCCACTTCAA GCTATGCTTG CTGGTCCTAC TGGTGATGGG 
AATCCTGTTC CTGGGGCAGT TGGTGTAATT AGGGCTATGC TGGATCTTTT AGAAGGGGAT 
GCAGTTTTGA TGCAGCGTGT GCTTTCTTCA ATGGATGCGG GAGGACGTAA CACTCTGTAC 
ACTTTTGCAA GTCTTGTAGG TTCAAGGGGT GTTTCTGCCA CTGACTTTGT GACTATGCTC 
AACTACCTTG AAGGCAGAGT AAACCTCAGG ACTTTACTCG AGCAAAAAAA CATGACGGAG 
GATGTCTCTA CACTTGATGT TGTTCACGAA GCGGAACACA ATTTGTACAG TTGGGGTTTT 
AGTCTGAACG ATCATGTTTC CCAAGCGTTA AATAGACAAA GAGGAGTTTC AAAGAGCCGG 
GCTTCCAGGT TAAAGGTAGC GGGTGATGCT GCAGTGTTAT CCAGTTTTTT CTTGTCCTGC 
ATATCAGGGC TTATTGTGGT ATGTAGCGCC CTTTATAATG TATGTTCTAC GGGAGTTAAA 
AAGAAAAGCG CTGGATTTAC CGTATTTGAA ATAGCATACA TTGTATTTGC TTTCTCTGTC 
GTTATGCTTC TCCTCACTTT TTTCTGTATA ACTCCAGGTA TGCACGGTGC AGCTAATCGG 
TGTGCTGTGA TAACAGGCGA TCCTAGAGTA AACATCCCTG AGCCGAGTTT TAATGACGGG 
ATATCGATAT GCGCAAACAC AGAGATCCAA TTCAGACCTG AAGACGTCGA GAAAATAGAA 
ATGGAAAGGT TGCATCTTAG AAGCAAAAGA GACCCAATGG CGGTCTTTTC TTCATCTCCT 
TCTCTTTCCT CCTCCGCTCT GAGTGCACGA CCTGTACCTG GTTTGCTTGT TGAACAGTTG 
AGTGCCTTCC ATGTACGCGA TCCGGGCCAC CACTGTTGTT CTACATCTGA GAATGAGGGA 
TCCTATGCGT TGGAGGAGTC TCCTGGTACA GGGATACAGG GTTTGGCAGC GGAGGGACTA 
TGTGATGAAC AACAGAAAGG CGTTGCTGAG TAA

Protein sequence

MYTKICEAIK SSDILTLRCL MQEAGLEEAN GTASAQGRPL WSMVDSDGRS VLQVAVESQN 
TGVLKCVMEA LPGNCLVDLC AKKTSTSHPF FPESTPLHTA IAVGRMEVLE SLLRGMLSAR 
GQNGKPPSST VVVWHTADAN GRTPLAAALA TGKLEIVKLV LGAIKTLERD MQTARGDRVP 
LVPGILQIDD IRVRGDNGLN MAVSTGNVGI VEVLIDALTP EELAPILTRC NLVGDTALDQ 
AARAGNVDIV RLLVKKLGDL YEPWVSTPFQ VVVESCAESK YKGNGAQVPE HFSMRLLGNA 
VSSGNAQVVK EVLGPLSIEE RYKLLSRTSW GYPYPALHLA FSSGAHECVK IMLDSLVACP 
GGGTKYVSKV LAQRSGGLTP LHCAVDAKSV AVVQGYGLPK GVLFGLLTAG GSSCSPEGPV 
YVPDGMNPLQ AMLAGPTGDG NPVPGAVGVI RAMLDLLEGD AVLMQRVLSS MDAGGRNTLY 
TFASLVGSRG VSATDFVTML NYLEGRVNLR TLLEQKNMTE DVSTLDVVHE AEHNLYSWGF 
SLNDHVSQAL NRQRGVSKSR ASRLKVAGDA AVLSSFFLSC ISGLIVVCSA LYNVCSTGVK 
KKSAGFTVFE IAYIVFAFSV VMLLLTFFCI TPGMHGAANR CAVITGDPRV NIPEPSFNDG 
ISICANTEIQ FRPEDVEKIE MERLHLRSKR DPMAVFSSSP SLSSSALSAR PVPGLLVEQL 
SAFHVRDPGH HCCSTSENEG SYALEESPGT GIQGLAAEGL CDEQQKGVAE