Gene YpAngola_A3149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3149
Symbol
ID	5801623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3336752
End bp	3337927
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	39%
IMG OID	641340983
Product	putative sulfatase regulator
Protein accession	YP_001607511
Protein GI	162421309
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.997665
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATATCA CGGCTAAACC AACCAGCTAC CAGTGTAATT TAAAGTGTGA TTACTGCTTT 
TATCTCAGTA AAGAAAACAT TTTTCAGCAC AAAGGTTGGA TGACTGAAGA AACCCTTGAA 
ACATTTATCG AGCGATATAT CAGTGCATCG GGGCATGATG TGTATTTCAC TTGGCAAGGG 
GGTGAGCCTA CCATGGCTGG GCTGGATTTC TTTGAGAAAG CGATACAGTA TCAGAACCGC 
TATAAAGGGA CTAAAAAAAT ACACAACGCT TTACAAACTA ACGGTATTTT ATTAGATGAT 
GCATGGTGTC TCTTTCTAAG AGAAAATCAT TTTTTAGTCG GTGTGTCTAT TGATGGCCCT 
AAAGAGTTAC ACGATCGCTA CCGTGTGACT CGCTCAGGCA AAGGATCGTT TGATAAAGTG 
ATGGCAGGTA TTGAGCAACT CAAAAAACAT CAGGTAGAGT TTAATACATT AACCGTGATA 
AATCGTATCA ATGTAAAATA CCCCCTTGAA GTTTATCGAA CGTTAAAATC TATCGGTGCT 
AAACATATCC AATTTATTGA ACTGTTGGAA ACAACCGAGC CTAATATTGA TTTTTCAAAT 
CAAAAAAGCA CGTTTGAACT TATTGAGTTC ACTGTCCCTG CGGTTGATTA TGGCCATTTC 
ATGGCGGAGG TCTTCAAAGA ATGGGTTCGC CATGATGTAG GAACTCTCTT TATTCGCCAG 
TTTGAGTCTT TTGTCAGCCG ATTTATTGGC AATGGGCACA CGAGCTGTGT TTTCCAAAAA 
TCGTGCAAAA ATAATTTTGT GATGGAGTCC AATGGTGACA TTTATGAATG TGATCACTTT 
GTCTACCCTG AGTATAAAAT AGGCAATATT TACCACGATA AATTGGATTC GTTGGCGAGC 
GATAAATTAT CCGCGCAAAA AGAGGTGCTA TCTGAGTCAT GCCGTAAGTG TATGTATAAA 
GCCATTTGCT ATGGCGGTTG CCCAAAACAT AGGATTGATC AGGACAGCGA TGGGATGAAA 
TCCTATTTTT GCGCAGGGTA TAAAATACTC TTCTCGGTTA TGGTGCCTTA TATGAATGCG 
CTGGCTGAAT TAGAAAAAAA TGGTATTCCA TTGGATAAGA TCATGGGTAT CGTCGATGAC 
ATTGAATGTG GAATAAAATC ACAACAGCAG CATTAA

Protein sequence

MHITAKPTSY QCNLKCDYCF YLSKENIFQH KGWMTEETLE TFIERYISAS GHDVYFTWQG 
GEPTMAGLDF FEKAIQYQNR YKGTKKIHNA LQTNGILLDD AWCLFLRENH FLVGVSIDGP 
KELHDRYRVT RSGKGSFDKV MAGIEQLKKH QVEFNTLTVI NRINVKYPLE VYRTLKSIGA 
KHIQFIELLE TTEPNIDFSN QKSTFELIEF TVPAVDYGHF MAEVFKEWVR HDVGTLFIRQ 
FESFVSRFIG NGHTSCVFQK SCKNNFVMES NGDIYECDHF VYPEYKIGNI YHDKLDSLAS 
DKLSAQKEVL SESCRKCMYK AICYGGCPKH RIDQDSDGMK SYFCAGYKIL FSVMVPYMNA 
LAELEKNGIP LDKIMGIVDD IECGIKSQQQ H