Gene NSE_0242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NSE_0242
Symbol
ID	3931999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Neorickettsia sennetsu str. Miyayama
Kingdom	Bacteria
Replicon accession	NC_007798
Strand	-
Start bp	205891
End bp	207426
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	46%
IMG OID	637900398
Product	51 kDa major antigen
Protein accession	YP_506136
Protein GI	88608614
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000185861
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAAAC TTAGCAAGAT ATTACTTTTG ACGACGGCAC TAGCCAGCGT CGCAGGCGCG 
TCCGAGGTGC CTTTGACAGA GGATCAAGTT CCGGCTGTTG AGAAGACGAC ATCGAATAAA 
CCATGTGTCT GCAATAAAGC AGGCCCTAAT CAGGTCAAGG CCCGATTGAG TAAATTTGCG 
GACCATTGTG CAACTGGTAT GGGCTCGCGT GGATGCAGTT GTGATGGTTC GTCTGACCTA 
AATGGGACCA GTAACTGCGA TGCAGTGAAT TTCGTGTTCA AAGTAAAGGG TAGTAACGAT 
TTCTCGTTCG GTTACGCGAG CAATCAGGAC TTCTTCAAGT TAGCGAAAGG TCTTCCAAAA 
ATCGATGTCC TTGTAGATGC AAGCGGTAAA GATATTGAAA GCTCATACAA TGGAGATAGT 
AGCACTAGTG GTACTGTGAA CGGCGTTAAG GCCCTTTCTG ATGGTGGCGT TCTAGGTGAT 
TACACACGTA GCACTGATTT GTTCAACGAG CACAAGTTAT CAATAGAAGC TAGACGTACA 
CTAGGCAGCT TCGCTTATGG TGGTTTGCTA GAAGCAGAAT TTAGTAGGAA AGATGCGGTT 
AGTGCCGATA ATGCATACGT TTTCTTTGAA ACCGGTTACG GAAGATTTGA AATGGGCCGC 
ATCACTGACA GTGCTGTGGA ACCGCTCAGG ATTGATGCAT CTTCCATCGC TGCTGTTGGT 
GGTGGTTTTG GTGATCTAAA TTGGACGACG CTAGCTAACC TTGAAGGACG CCCTATAGGT 
GCTACGCATA GCACAACAGG GAATGGTGAT AGCCAGAAGA GCAGCAGCAC GCGTCATAGG 
GATGCACAGC GCCCTTTCTT GGTGCATGCA AACTACTATA CCGCATATAA CAATCCACTA 
AGGGCTAACT TCATTACTAC TGGGCTGGGC AATTTGCGGA TGGCATTGGG TTATACGAAC 
TCTACTGCGG ATGGTACATA CCATGATATT ATTGATGTAG GTGCTGGCTA TGCTGGGAAG 
AAAGGAAATC TGAAGTATGC TATTTCCTTC AGTGGTCAGG CTGGTCTCAG CACTCCAACT 
GGTGATGAAC ATCACCCTCT CAGACGTTTT GAAGTCGGTG CATCGGTTCA GCTTCACACT 
ATAAAGCTTG CTGGATCATG GGGTAGTACG TATCTCTCTG GAGTTAAAAA ATCGAAGGAT 
ATGCAACTTG ATTTAACTAA GGCTTTTGCT GATAGCAGTC AACTCAAAAA AACAGACGGT 
GATAGTACTT ACATGACTTT CGGTGCTACA TATGAAGAAG GTCCTGTGAT GTTTAGCCTT 
GGCTATATGG AGAGTTATAA TACCTTCGTT AAAAGTGTCG GAGTGAATAC GCTAAGAGTT 
GTTTCCCTTG GTACGCATTA TCGCATCACT GGAAGCACGT ACGAGCTTAC GCCTTACATT 
AACACCAAGT GTTTCATGGC TCAGGAAGCT GGGATTAAGG CTGAGGACAA CAACAAAGGT 
TTTGTTCTTG CTTCCGGTGT GAAGGTATCG TACTAA

Protein sequence

MYKLSKILLL TTALASVAGA SEVPLTEDQV PAVEKTTSNK PCVCNKAGPN QVKARLSKFA 
DHCATGMGSR GCSCDGSSDL NGTSNCDAVN FVFKVKGSND FSFGYASNQD FFKLAKGLPK 
IDVLVDASGK DIESSYNGDS STSGTVNGVK ALSDGGVLGD YTRSTDLFNE HKLSIEARRT 
LGSFAYGGLL EAEFSRKDAV SADNAYVFFE TGYGRFEMGR ITDSAVEPLR IDASSIAAVG 
GGFGDLNWTT LANLEGRPIG ATHSTTGNGD SQKSSSTRHR DAQRPFLVHA NYYTAYNNPL 
RANFITTGLG NLRMALGYTN STADGTYHDI IDVGAGYAGK KGNLKYAISF SGQAGLSTPT 
GDEHHPLRRF EVGASVQLHT IKLAGSWGST YLSGVKKSKD MQLDLTKAFA DSSQLKKTDG 
DSTYMTFGAT YEEGPVMFSL GYMESYNTFV KSVGVNTLRV VSLGTHYRIT GSTYELTPYI 
NTKCFMAQEA GIKAEDNNKG FVLASGVKVS Y