Gene YpAngola_0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_0039
Symbol
ID	5798367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010158
Strand	-
Start bp	28285
End bp	29370
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	54%
IMG OID	641337939
Product	Ser/Thr protein phosphatase family protein
Protein accession	YP_001604556
Protein GI	162417843
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	74
Plasmid unclonability p-value	1.16094e-34
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	467
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTGC CATACGGGGT GATATCAGAT CCCCATTATC ATCGTTGGGA TGCTTTTGCG 
ACAACAAACG CTGACGGGCT GAACTCTCGA CTGGAGATCC AACTGGATGC CACGAAAGAA 
GCTGCCAAAG CCATGAAAGC TGCGGGCTGC AAGCACATGC TGGTGGCTGG TGATACTTTC 
CATGTTCGTG GTGCTATATC GCCTTCCGTC CTGCATTTCG TGACCGAAAC TTACGAGTGG 
ATCATCAAAG AGTTGGGCCT CGAAGTGGTT ATGCTGGCCG GCAACCACGA CCTCGAAACC 
AACGATTCCG TATACAGCGC CAATGCAGCG GCCTCTCTGC GCTCAATCGG TGTGGAAATC 
GTCTGCGGCA AACGTCCTCA CTCCATCAAA ATTGGCGACG TTACCGTCCA TCTGATTAGC 
TGGCGCAATA ACCACGCAGA GCTTATCAGC GACCTCAAAA CACTGCGTTC CGGGCTGGAT 
GGCGACAATC ACGATGTCGT TGTGCATACC TCGATCAACA AAGCGATCCC TACCATGCCT 
GATGTCGGCA TCGACGCACA GGAACTGAAA GATATCGGCT TCCGTTTGTT GTTGTCCGGA 
CACTACCACA ACCACAAAGA AGTGCTGCCT GGGGTGGTTA GCATCGGGGC GCTGACGCAC 
CAGAATTGGG GTGATGTTGG CTCGCTGGCT GGCTTCATGA TCGTCAACCC TGACGGCACA 
TTCACCCACC ACGAAACCTC TGCACCCAAG TTCGTGAACC TTGAGGACGA TGTGGAAGAC 
GATCAAATTC GCGGTAACTA CGTGCGCTTT CGTGCCGTTG TTGAGAACGA TGAAGAAGGC 
ATCAAACTCC AGAACGTCCT GAAAACAATG GGCGCGAAGG GTGTCGTCTG CAACTTCATC 
CGCAAGGCAT CGATGATGGA AGGCTCTGCC AGTACTGCGG AGACCAGCAA AATAGACAGC 
CTGGGCGAGT CCGTCGCGGC GTACTGCAAG ATCGTTCACG ACACTGATGG CGGCTTCGAC 
CTGAGCAAGC TGGACATGCT GTGTCAGGAA ATCCTGACCG AAGCGGAGAG TGCGGAGGCA 
GTGTGA

Protein sequence

MTLPYGVISD PHYHRWDAFA TTNADGLNSR LEIQLDATKE AAKAMKAAGC KHMLVAGDTF 
HVRGAISPSV LHFVTETYEW IIKELGLEVV MLAGNHDLET NDSVYSANAA ASLRSIGVEI 
VCGKRPHSIK IGDVTVHLIS WRNNHAELIS DLKTLRSGLD GDNHDVVVHT SINKAIPTMP 
DVGIDAQELK DIGFRLLLSG HYHNHKEVLP GVVSIGALTH QNWGDVGSLA GFMIVNPDGT 
FTHHETSAPK FVNLEDDVED DQIRGNYVRF RAVVENDEEG IKLQNVLKTM GAKGVVCNFI 
RKASMMEGSA STAETSKIDS LGESVAAYCK IVHDTDGGFD LSKLDMLCQE ILTEAESAEA 
V