Gene YpsIP31758_0549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_0549
Symbol
ID	5388221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	646198
End bp	647376
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	47%
IMG OID	640863520
Product	HNH endonuclease domain-containing protein
Protein accession	YP_001399542
Protein GI	153950788
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.663462
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCACTC ATTACTCTGT TATGGATTTA GGGGAAAGAT ATGGCGCACG ATTTTCCACT 
TTGGAGGAAA TGGTTCCTTG CTTCGGTATA GATGCTAATG TGTTCATCCA GGCGTGGCTT 
GAAGGGCGGC TTCCTCTTTA CATTTACTTC GGTAATGAGA GCCGACCATG TACGATCAGG 
CGCTGTGTTT CCGCTAAAGT ACATGAACAC GTCATGCATG ACATACTTTA TGGCCGTGAT 
TTCTATCAGA GCAAAGCGAG TCCAGACAAC GATGTATTGA TGTTTGTACC AGAAACTCCG 
TTAGTCTGTA AGACTAAATT CAGGGGGGAT TACAGATTAT CAACCGGAAC TCATGCCAAC 
GTGGAGAAAG GAACACATGG ACACGTTAAC AACCGCTACC CCATCGGTGT TAGCGCCCGT 
GGTCGTATTG CTGATGGCGC GGTAGGTACC CTTGAGGGGC TAGGTACTTT GATGGGGCCT 
TCCGCCCAAG AATATATGGC TGGTGCCTTT AATCCAGAGC AGGCCGCAAT AAATAAAGTC 
CGACAGCAAA ATCAACAAGC CGCTGGCAAG GCTATTTATG ATAATACGAA AGGGGCGGTG 
ACAGACGCTT ATCAGCGCAA TGGATTAGCC GGTGCGGCCG CCATGGTAGT CACGGCATCC 
GTGGCGGAGT TGGCGGGTAC TAAGGGGTTG GGAACGGTAG AAAAAGTTGG CACATTAGGC 
GATGTCGCTA AGTTAGGGAA AGCTATTGAG CTGGAAAAAC TAGAGGGGTA CCTTGGCACT 
TATAAAGGTC AGAAAGTATT GCTACAAAAC GTCGATGTTG TGAAGATGGA TTATTTCCGA 
CGAGACCGTG CAGAGGCCGC TATGTTGCGA AGCCAATTCC GCTCTGTTCG GACTAAATTT 
GTTAAATCTA TAGCAAATAA TCCCGACGTT GCTAAGCGCT TTACTTTAGA GCAAATAGAC 
GGCTTGTCTA ATGGCATTAC ACCTAGCGGC TGGGTTGTGC ATCACAAACT ACCCTTAGAC 
GACAGCGGAA CTAATGCGTT AGATAATCTA GTGCTTATCA AAGACAGCCC AGAGCATACT 
GTTCTGACTA ATGCGCAAAA GAAAATCACT AACGGATTGC CACACGAGGC TTCGAAAGAA 
GTGCTTTGGC CGATTCCTCA AGGTCTTGTT TACCCATAG

Protein sequence

MRTHYSVMDL GERYGARFST LEEMVPCFGI DANVFIQAWL EGRLPLYIYF GNESRPCTIR 
RCVSAKVHEH VMHDILYGRD FYQSKASPDN DVLMFVPETP LVCKTKFRGD YRLSTGTHAN 
VEKGTHGHVN NRYPIGVSAR GRIADGAVGT LEGLGTLMGP SAQEYMAGAF NPEQAAINKV 
RQQNQQAAGK AIYDNTKGAV TDAYQRNGLA GAAAMVVTAS VAELAGTKGL GTVEKVGTLG 
DVAKLGKAIE LEKLEGYLGT YKGQKVLLQN VDVVKMDYFR RDRAEAAMLR SQFRSVRTKF 
VKSIANNPDV AKRFTLEQID GLSNGITPSG WVVHHKLPLD DSGTNALDNL VLIKDSPEHT 
VLTNAQKKIT NGLPHEASKE VLWPIPQGLV YP