Gene YpAngola_A3148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3148
Symbol
ID	5801622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3335090
End bp	3336694
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	42%
IMG OID	641340982
Product	sulfatase
Protein accession	YP_001607510
Protein GI	162421716
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGGCC CTGCATATGC TGATGATGTC AAACTCAAAG CAACAAACAC CAATGTTGCT 
TTCGCTGATT TTACGCCAAA AGAATACAGC ACGAAGAATA AGCCAAATAT CATTGTCTTA 
ACCATGGATG ACTTAGGTTA TGGGCAGCTC CCTTTTGATA AGACCTCCTT TGACCCTAAG 
TCGATGGAAG ATCGGGACGT TGTTGATACC TACAAAATAG GCATTGATAA AGCCATTGAA 
GCCGCCAAAA AGTCCACGCC AACACTACTC TCGTTGATGG ATGAAGGGGT TCGTCTGACG 
AATGGCTACG TTGCTCATGG CGTATCAGGG CCTTCGCGGG CGGCCATTAT GACGGGCCGG 
TCCCCTGCAA GGTTTGGTGT TTACTCCAAT ACCGATGCTC AGAATGGGAT TTCATTAGAA 
GAGACATTCC TGCCTGAGTT ATTGCAAAAC AATGGCTATT ACACGGCGGC CATCGGAAAA 
TGGCATCTTT CAAAAATCAG TAATGTTCCT GTTCCTGAAG CGGAGCAAAC GCGCGATTAC 
CACGATAACT TTACAACTTA CTCAGCCGAT GAATGGCAGC CTCAAAACCG AGGCTTCCAG 
TATTTTATGG GTTACCATGC CGCGGGAACG GCTTATTATA ATTCCCCGTC TCTTTTCCAT 
AATAAAGAGC GGGTGAAAGC CAAAGGTTAT ATCAGTGATC AACTTACCGA TGAGGCTATC 
GGTGTTGCCA ATAGAGCTAA ATCCTTAGAT GAGCCATTCA TGATGTATTT GGCTTACAGT 
GCTCCCCATT TACCTAATGA TAATCCAGCG CCGGATGAAT ATCAGAAACA CTTTAATACA 
GGTAGCCAAA CTGCTGATAA CTTCTATGCC TCTGTCTATT CTGTTGACCA GGGCGTAAAA 
CGGCTTCTTG AGCAGCTTAA AAAGAATGGT CAATATGACA ATACGATAAT TATGTTTACC 
TCTGATAACG GTGCCGTTAT CGATGGGCCA TTACCGTTGA ACGGTAATCA GAAAGGGTAT 
AAAAGCCAAA CATTTCCTGG CGGAACCCAT ACTCCAATGT TTATTTGGTG GAAGGGGAAA 
TTGCAAACAG GAAATTATGA CAAGTTGATC TCTGCAATGG ATTTCATGCC TACAGCGCTT 
GAAGCCGCTG AGATTGATGC TCCAAATAAT TTAGATGGTG TCTCACTGCT TCCTTATTTG 
ACGGGGAAAA GCAAAGCTGA ACCGCATAAA TATCTTACCT GGGTGACATC CTATACCCAC 
TGGTTCGATG AAGAGAATAT TCCATTCTGG GATGGTTACC ATAAATTTGT GCGTAATGAA 
TCCAATGAAT ATCCTAAAAA CCCAAATACC GAAGATCTTA GTCAATTCTC TTATACCATC 
CGCAGTAATG GCTACTCTTT AACCTATACC TATGAAGGTA ATAAGTTAAA TCTGTATAAA 
CTGAGTGATT TAAATCAAAA ACAAGACCTT GCAAGTACCC ATCCTGATGT TGTTAAGGTA 
ATGCAAGCCG AGATGAGGAA CTTCATTAAT CAGAGTCAAT CTCCTGTTAG TGAAGTTAAT 
CAGGATAAAT TTAATAAAAT TAAGCAATCG CTTGGTATGA ATTAA

Protein sequence

MGGPAYADDV KLKATNTNVA FADFTPKEYS TKNKPNIIVL TMDDLGYGQL PFDKTSFDPK 
SMEDRDVVDT YKIGIDKAIE AAKKSTPTLL SLMDEGVRLT NGYVAHGVSG PSRAAIMTGR 
SPARFGVYSN TDAQNGISLE ETFLPELLQN NGYYTAAIGK WHLSKISNVP VPEAEQTRDY 
HDNFTTYSAD EWQPQNRGFQ YFMGYHAAGT AYYNSPSLFH NKERVKAKGY ISDQLTDEAI 
GVANRAKSLD EPFMMYLAYS APHLPNDNPA PDEYQKHFNT GSQTADNFYA SVYSVDQGVK 
RLLEQLKKNG QYDNTIIMFT SDNGAVIDGP LPLNGNQKGY KSQTFPGGTH TPMFIWWKGK 
LQTGNYDKLI SAMDFMPTAL EAAEIDAPNN LDGVSLLPYL TGKSKAEPHK YLTWVTSYTH 
WFDEENIPFW DGYHKFVRNE SNEYPKNPNT EDLSQFSYTI RSNGYSLTYT YEGNKLNLYK 
LSDLNQKQDL ASTHPDVVKV MQAEMRNFIN QSQSPVSEVN QDKFNKIKQS LGMN