Gene YpAngola_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_0114
Symbol
ID	5798449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010158
Strand	+
Start bp	94496
End bp	95518
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	52%
IMG OID	641338005
Product	IS110 family transposase
Protein accession	YP_001604622
Protein GI	162417837
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	114
Plasmid unclonability p-value	4.57339e-19
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1.5997e-89
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCATCA CTACTGTCGG TATCGATCTT GCTAAAAACG TGTTCGCTGT TCACTGCGTT 
GATCAGAATG GTAAAACGGT TCTGGTTAAG CCCAAAGTAT CGCGTGCTGC ACTTCCTGAG 
CTGATTGCAG GTTTACCTCC CTGTGTTATC GGGATGGAGG CATGCTCCGG GGCGCACTAC 
TGGGCGAGGC TGTTTCGAGA GTATGGTCAT GAACCGCGCC TGATGGCTGC AAAGTTTGTA 
TCGCCTTACC ACATGGCCGG TAAATCAGGA AAGAATGATG CTGCCGATGC TCAGGCTATC 
TGTGAGGCTG TCCGTCGTCC GCATATGCGG TTTGTGCCAG TGAAGGACGA AAGCCAGCAG 
GCTATGCAGT GTTTACATCG TACCCGACAG GGTTTTATCG AAGAGAAAAC AGCAACGTAT 
AATCGCCTGA GAGGATTGAT CTCTGAATTT GGCGTCATCG CCCCGCAGAG TACTGATGCC 
TTACGCCGCA TGGTTTCTGA GCAGAAGAAT TCTTTACCGT TCCAGGTTCA GCAATGTATT 
GATGATTTGC TGGAGCACGT TGATCGCATT GAAGCCAACA TTGCTGACTA TGACCGAATT 
TTGTCCCGCA TGGCCAAAAC AGATCACCGC AGTCAGCGAC TGATGGAGCT GAAGGGAGTT 
GGCCCCACAA CGGCCTGTGC GCTGGTCGCC AGTATCGGTA ATGCACATGA TTTTAAGAAT 
GGGCGTCAAC TGGCCGCCTG GCTGGGGCTC ACGCCTTCAC AGTACAGCAG CGGCGGAAAA 
TCAAAGCTTG GCAGGATAAC GAAAGCTGGC GATTCGTATC TGCGAACACT GCTGGTTCAG 
GGGGCCCGTT CAGTTCTGAT TGGCGCTGAT AAAAGGACTG ATTCTTTCAG TCGTTGGGTT 
TGTACGCTGG TTGAACGCAG AGGATACTGG CGTGCTGTTG TTGCCATCGC CGCCAAAAAC 
GCAAGGCTGT GCTGGGCATC ATTGCATTAC GGTGATGATT TCCGGCTGTA CTCAGCCAGC 
TAA

Protein sequence

MTITTVGIDL AKNVFAVHCV DQNGKTVLVK PKVSRAALPE LIAGLPPCVI GMEACSGAHY 
WARLFREYGH EPRLMAAKFV SPYHMAGKSG KNDAADAQAI CEAVRRPHMR FVPVKDESQQ 
AMQCLHRTRQ GFIEEKTATY NRLRGLISEF GVIAPQSTDA LRRMVSEQKN SLPFQVQQCI 
DDLLEHVDRI EANIADYDRI LSRMAKTDHR SQRLMELKGV GPTTACALVA SIGNAHDFKN 
GRQLAAWLGL TPSQYSSGGK SKLGRITKAG DSYLRTLLVQ GARSVLIGAD KRTDSFSRWV 
CTLVERRGYW RAVVAIAAKN ARLCWASLHY GDDFRLYSAS