Gene NSE_0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NSE_0004
Symbol
ID	3932223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Neorickettsia sennetsu str. Miyayama
Kingdom	Bacteria
Replicon accession	NC_007798
Strand	+
Start bp	3639
End bp	4886
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	35%
IMG OID	637900161
Product	hypothetical protein
Protein accession	YP_505907
Protein GI	88608480
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0178798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACGATT ACGTAGTAGT TGGGGGAGGG ATAGAATCTT TTTTGTTATG TTTTCTGATT 
TTATACAATA CTGGAAGAAG CAACATAGCC TTTGTTACGA AAAGTCCACC TGACATGTCC 
AAGGACTCTT CATTATCGAA GGTGGGGCTT AGACATGTTA GTACATCGGA ATACACAAAT 
TTCCTTTCAA AATTTCATAT AAACGCTTTT TCTAGGAGTG TCCCTTCAGG TGGATGGAAT 
GGAATAGATA GGGCACTGAG AACGCACGAA AAATATTGGC TAAAAAAACG GCTTCTAGAA 
AGGCGTTTTT TTTATCAAAA TTTAGATTAC AAATTAAAAA ACTTGGCATT TAAAGGTCCT 
CTCTTGTGGA AAAAGTTTTT ATCTAGCCAT CCAGAATTTT CTACAGATAT TGATTTAATC 
GAAGGCATCT ATGCGATCTC CAATCACTGT GAAAGTGGTA AAGGTAGCAC ACAGCCACTA 
AGAATAGATG ACATAGAAAG GAATTTAATT TGTGGAAGAA GTGTATCTTT CGAAAGTGAC 
GGATTTAGCT TTAACTCGCT TAAATTTTGC AAAAAAATAG GAGATTTCTT AAGTAAAAAT 
GGAATTAGTT TTTTTTACAA TACTGAGATT TCAAAGATAG ATTTTGCCAG CAATAAGAAG 
CTTAAGTATG TGATTTCATC ACGTGGCGAA ATTTTCCATG GGAAAAACTA TTTTATTGCC 
ATAGGAGCCA ACTCTTTTGG TTATAATGAC TATTTCAATT TACGAAAATT AACTCAACCA 
ATTGTTGGTG CATGGTACCT TGTACATGAT GTGAATCTCA AACATCCGTG CAAGTATAAT 
AACTATGTTG GTCCAACCCT GACTTTTTGG CAAAACTACA CTCCGGTTTC CTATAACGAT 
TTTATCAAAT CTGAAAATCC CAACTCTCAA GATGGGAAAA AAGCTGTAGT TGTAGGTACC 
GGTTGTATGT GGAAAGGGTC AATTTATGGT AGTGGTCATT TAAATGTCGA GTTTATCAAA 
AGAAACGAGA GACTTATAAA AGATTTATTT CCTGGAAAGG AAGTAACTCT ACTTGATGGA 
AACTGCCCAA GGAATCTTTC ATATAATTCT TTACCAATTA TTAATCACGG CGATAGCTTA 
AGTGGGAAGT ATCTTTCTGT ATCTGGTTCT GGAACATTTA CAACTGCAAA TGCAGTGAAT 
TCAGCATCTG AAGCGGTCGA ATTTTTTCTT AACAACAGAC GACGCTAG

Protein sequence

MYDYVVVGGG IESFLLCFLI LYNTGRSNIA FVTKSPPDMS KDSSLSKVGL RHVSTSEYTN 
FLSKFHINAF SRSVPSGGWN GIDRALRTHE KYWLKKRLLE RRFFYQNLDY KLKNLAFKGP 
LLWKKFLSSH PEFSTDIDLI EGIYAISNHC ESGKGSTQPL RIDDIERNLI CGRSVSFESD 
GFSFNSLKFC KKIGDFLSKN GISFFYNTEI SKIDFASNKK LKYVISSRGE IFHGKNYFIA 
IGANSFGYND YFNLRKLTQP IVGAWYLVHD VNLKHPCKYN NYVGPTLTFW QNYTPVSYND 
FIKSENPNSQ DGKKAVVVGT GCMWKGSIYG SGHLNVEFIK RNERLIKDLF PGKEVTLLDG 
NCPRNLSYNS LPIINHGDSL SGKYLSVSGS GTFTTANAVN SASEAVEFFL NNRRR