Gene NSE_0719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NSE_0719
Symbol
ID	3931923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Neorickettsia sennetsu str. Miyayama
Kingdom	Bacteria
Replicon accession	NC_007798
Strand	-
Start bp	640403
End bp	641503
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	40%
IMG OID	637900875
Product	putative membrane-associated zinc metalloprotease
Protein accession	YP_506595
Protein GI	88607986
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGGTT TACTTTTATA TCTCGCATCC TTTCTGCTAG TGGTTTCTGT GATCGTCTTC 
GCGCATGAGT TTGGGCACTA TATTTTTGCC AAAATGTTTG GTGTGAAAGT AGAGGAGTTT 
TCTATTGGAT TTGGGAAAGA ATTATTTGGC TTCAGTGATA AGTCAGGAAC CAGATGGAAG 
CTCTCTATGA TTCCGGCTGG TGGGTATGTG AAAATGTTCG GAGATTTAGA CAAGAGCAGT 
GCTGTGGATT TTGAGAAAAT TCATATGATG GATGATTGCA TGAAAGCTCA AACCCTGAAT 
TATAAACCTC TATATCAAAA AGCACTTGTT ATTTTTGGTG GTCCTTTTGC TAATTTTGTT 
TTTGCCTTTT TGGTTTTGTC TTTCCTATAT GGTTATTTTG GAAAAGTTAC GGTTGAGCCA 
GTTGTAGCAT CTGTTATTAG CGATAGTCCG GCAGCACATG CGGGATTCAG AGTTGGGGAC 
AGGATCTTAA CGATGAACAA TAAGCCTATT GCAAGTTTCG ACGAAATCAG AAAGTTCATT 
TACCTGAATC GTGATAGTGC AGTATCTTTC ACTGTGTTAA GGAATGGGGA TGAGATATCT 
ATGTCTGTAA CTCCAAGGAT TGAGGTTGGA GAAGATATAT TCGGTAATCG TGAAGAGCTA 
CCAAAGCTTG GAATAGAAGC ATCAAAGATT CAGCGTAGCG AAATTGGAGT CGTGGGTGCA 
ATGCGATTCT CTTTGATTGA GATTGGTAAT GTTATTCATT CAACACTAAA GCTGCTCTGG 
CAGACGATTA CAGGGAAAGC TAAAACCAAT GCTATAGGTG GTCCAATAAA AATTGCTAAA 
TACTCCGGAC AGTCCATGCG AATGGGATTC ACCATGGTTT TGTGGTTTAT GGCAATGTTA 
TCGATCAATC TTGGTTTGTT TAATCTTTTT CCTATACCGA TGCTTGATGG TGGGCACCTG 
CTTTTCTATT TGATTGAATG GATTAAGGGT GATAGAGTAG CAATTGGCTT TCAGCAATGG 
GCAGGAAGAG CAGGGATGTT GTTATTGATA GCTATCCTTG TTTTTGCTGT TTTTAACGAT 
ATTCGTTTTG TTCTCAGGTA G

Protein sequence

MGGLLLYLAS FLLVVSVIVF AHEFGHYIFA KMFGVKVEEF SIGFGKELFG FSDKSGTRWK 
LSMIPAGGYV KMFGDLDKSS AVDFEKIHMM DDCMKAQTLN YKPLYQKALV IFGGPFANFV 
FAFLVLSFLY GYFGKVTVEP VVASVISDSP AAHAGFRVGD RILTMNNKPI ASFDEIRKFI 
YLNRDSAVSF TVLRNGDEIS MSVTPRIEVG EDIFGNREEL PKLGIEASKI QRSEIGVVGA 
MRFSLIEIGN VIHSTLKLLW QTITGKAKTN AIGGPIKIAK YSGQSMRMGF TMVLWFMAML 
SINLGLFNLF PIPMLDGGHL LFYLIEWIKG DRVAIGFQQW AGRAGMLLLI AILVFAVFND 
IRFVLR