Gene YpAngola_A3166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3166
Symbol	thiL
ID	5801641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3351841
End bp	3352830
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	49%
IMG OID	641340999
Product	thiamine monophosphate kinase
Protein accession	YP_001607526
Protein GI	162421793
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATGTG GCGAATTTGA CCTCATTGCC CGCTACTTTG ACCGGTTTAG AAGTAACCGC 
CGGGATGTGG AGCTGGGTAT TGGAGACGAC TGCGCACTTC TTACAGTGGC AGAGAAACAG 
CTGTTGGCCA TCAGTACCGA TACACTGGTG TCCGGTGTTC ATTTCCTTCC GGATATCGAT 
CCGGCCGATC TTGGTTACAA ATCTCTAGCG GTAAACCTCA GCGATTTATC TGCGATGGGT 
GCCGATCCTG CCTGGTTATC GCTTGCTTTG ACTCTGCCAT CGGTAAATGA AGATTGGCTA 
CAGGCATTCA GTGACAGCTT ATTTGATCAA CTCAATTACT ATGGTATGCA ATTGATCGGT 
GGTGATACCA CCCGTGGGCC ATTGAGTCTG ACACTGACTA TTCACGGTTT TGTCCCCGAA 
GGCCGTGCAT TGGCCCGTGC TGGTGCGCGG ATTGGTGACT GGATCTATGT TACTGGCACA 
TTGGGTGACA GTGCTGCGGG TCTGGCTATT TTGCAAAATG AGCTGCGGGT AGATAACGAA 
ACCGATCGAG CGGCATTAAT TCATCGTCAT TTACGACCAC AACCCCGAGT TTTACAGGGG 
CAAGCATTGC GTATGCTTGC TAGTGCTGCC ATTGATATTT CTGATGGGTT AATTTCTGAT 
CTGCAGCACA TTCTGAAAGC CAGCCATTGT GGTGCTCGTA TTGAGCTCGA TATGTTGCCG 
TATTCCGATG CATTAAAAAA TCAGGTTGAT ACTGAGCAAG CTCTCCGCTG GGCATTGAGT 
GGGGGTGAAG ACTATGAACT GTGCTTTACC GTACCCGAGA TCAACCGGGG CGCGTTGGAA 
GTGGCACTCA GTAATACCGG AGCGGGTTAT ACCTGTATTG GCCAAATAGG CCCTCAATCG 
GAAGGCGTTA AATTCTTCCG TGAAGGTAAA ATAGTCAAAC TGGATTTCCG CGGTTTTGAT 
CATTTCTCAA CAGGTAAATC TCATGGATGA

Protein sequence

MACGEFDLIA RYFDRFRSNR RDVELGIGDD CALLTVAEKQ LLAISTDTLV SGVHFLPDID 
PADLGYKSLA VNLSDLSAMG ADPAWLSLAL TLPSVNEDWL QAFSDSLFDQ LNYYGMQLIG 
GDTTRGPLSL TLTIHGFVPE GRALARAGAR IGDWIYVTGT LGDSAAGLAI LQNELRVDNE 
TDRAALIHRH LRPQPRVLQG QALRMLASAA IDISDGLISD LQHILKASHC GARIELDMLP 
YSDALKNQVD TEQALRWALS GGEDYELCFT VPEINRGALE VALSNTGAGY TCIGQIGPQS 
EGVKFFREGK IVKLDFRGFD HFSTGKSHG