Gene Sbal223_2025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2025
Symbol
ID	7086859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2392674
End bp	2394626
Gene Length	1953 bp
Protein Length	650 aa
Translation table	11
GC content	49%
IMG OID	643460928
Product	thiamine-phosphate pyrophosphorylase
Protein accession	YP_002357952
Protein GI	217973201
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0351] Hydroxymethylpyrimidine/phosphomethylpyrimidine kinase [COG0352] Thiamine monophosphate synthase
TIGRFAM ID	[TIGR00097] phosphomethylpyrimidine kinase [TIGR00693] thiamine-phosphate pyrophosphorylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00308953
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGGGTA TTCATGGGGA TAATGTGCCC ATGAATACCG AGCGTCCCGC GTTTGTCTGG 
ACCATAGCTG GTTCAGACAG TGGCGGTGGT GCCGGTATTC AGGCGGACTT AGCGACAATT 
CAAGATTTGG GCTGTCACGG TTGCAGTGTG GTCACCACAG TGACGGCGCA AAGTTCTGTG 
GCGGTCACTT TAGTCGAGCC CGTATCAGCG GCGATGTTAA TGGCTCAGCT GACGACTTTA 
CTTTCCGACT TGCCACCCAA AGCAATTAAA ATCGGCTTAC TGGCAGATCA AACTCAAGTG 
GCATTGCTGG CAGATTGGAT CGCGAGTTTT AAAATCCACT ATCCATCTGT GCCTGTGATT 
GTCGATCCTG TGATGGTCGC CAGTTGTGGC GATGCTTTAG CAGTCGATAA CTGTCAGGAT 
ATAAAAAGTG CGGCCAAATC AGCCTTAGAT TTTAAGCATT TCAAAGGTTT AATCGAACTT 
ATAACGCCCA ATGTGCTTGA ACTTGGGCGG TTAACTCACA GTGATGTTTC AACGAAAGCG 
CAATTCGCTG CCGCGGCACT GGCTTTATCC CAGAGCCTTG ATTGCAGTGT GCTCGCCAAA 
GGTGGCGATG TGAGCTTTGG CAGCACTGAC ATTCTTGATG ATACTCATGC TCAAACTCAC 
GATAACACTT ATGCTCAAAC TCAGGCTAAC GTTCATGTTA TCGCTCTTGA TAGCAACGGC 
TGGGACCTTG AACTTGCCGA GGATTATCTA GTTTGTCGTC AAGTACGCGC GAGCTCTAAA 
CTACATCAAA ACGGGCGTTT CTGGTTAGCC AGCCAGCGGG TTAATACCCG CCATAATCAT 
GGTAGCGGCT GCACTTTGTC ATCAGCCATT GCTGCCGTGT TAGCGCAAGG TTTTGTATTG 
CAAGATGCGG TGGTTGTTGC GAAAGCTTAT GTGAGTCAAG GCTTAAGCGC GGCGATTGGT 
TTAGGGCAAG GTCCAGGGCC GTTGGCCCGT ACGGGTTGGC CTAATAACTT GTCCCGCTAT 
GCCAAGATAA ATCTGTGTGA TGGCAATTTT ATTAGTCATC AACTCAACCA ACACCTTGAT 
GTTTTAAATG ATTTAGTTGC AACAGTTTTA TCCGCAACAG ATCAGGCAAC CGCTCAGGTA 
AAAATAGCCT CGACGCCACC TCAAAATATT TTATCCCACG GTTTTAAAGT GCTCGATGCC 
GATCTTGGTG TTTATCCCGT GGTGAGTGAC TTAACCATGC TGGAAAGTTT ATTAGCGGCA 
GGCGTTAAAA CCGTCCAGTT ACGGATAAAA ACCGATTCCA GCGAGTCAAC CGCTGCAGCG 
TTAGCCGAAT CTGATTTAGG TAAATCTGCG CTAAGTAGAT GTGAGTCAGG CAAATCTAAG 
TCAGGTGAAC CTGAGTTAAT TGGCTCCGAA TTAGAAGCAC AAATTCAAAC GGCCATTGCC 
TTAGGCAAGC ATTTTAATGC GCAGCTTTTT ATCAATGATC ACTGGCGGTT AGCGATAAAA 
TACCATGCCT TTGGGGTACA TTTAGGCCAA GAAGATCTCG CCGTTACTGA CTTAGCGGCC 
ATTCAAGCCG CGGGGCTCGC GCTAGGCATA TCGAGCCACA GTTACTTCGA GTTGCTATTG 
GCGCACCAAT ACTCGCCATC CTACATAGCG CTTGGGCATA TATTCCCAAC CACGACGAAG 
CAAATGCCTT CGGCGCCCCA AGGGCTCGCA AAACTTAAAC ACTATGTGGC GTTACTCCAA 
GGCCATTATC CCTTGGTCGC CATTGGCGGT ATTGACTTAA CAAATCTGGC AAAGGTGAAA 
GCCACGGGGG TGGGCAATAT TGCTGTGGTG CGCGCAATAA CGAACGCTAA GGATCCGTTA 
GCCGCCTTTG CAGAGCTGAG CCAAGCTTGG GAGCAATGTA GCTTGTCTGA AGAACTGGCT 
GTAAACCATG AGTTGGGTGC TAAGCATGAG TAA

Protein sequence

MLGIHGDNVP MNTERPAFVW TIAGSDSGGG AGIQADLATI QDLGCHGCSV VTTVTAQSSV 
AVTLVEPVSA AMLMAQLTTL LSDLPPKAIK IGLLADQTQV ALLADWIASF KIHYPSVPVI 
VDPVMVASCG DALAVDNCQD IKSAAKSALD FKHFKGLIEL ITPNVLELGR LTHSDVSTKA 
QFAAAALALS QSLDCSVLAK GGDVSFGSTD ILDDTHAQTH DNTYAQTQAN VHVIALDSNG 
WDLELAEDYL VCRQVRASSK LHQNGRFWLA SQRVNTRHNH GSGCTLSSAI AAVLAQGFVL 
QDAVVVAKAY VSQGLSAAIG LGQGPGPLAR TGWPNNLSRY AKINLCDGNF ISHQLNQHLD 
VLNDLVATVL SATDQATAQV KIASTPPQNI LSHGFKVLDA DLGVYPVVSD LTMLESLLAA 
GVKTVQLRIK TDSSESTAAA LAESDLGKSA LSRCESGKSK SGEPELIGSE LEAQIQTAIA 
LGKHFNAQLF INDHWRLAIK YHAFGVHLGQ EDLAVTDLAA IQAAGLALGI SSHSYFELLL 
AHQYSPSYIA LGHIFPTTTK QMPSAPQGLA KLKHYVALLQ GHYPLVAIGG IDLTNLAKVK 
ATGVGNIAVV RAITNAKDPL AAFAELSQAW EQCSLSEELA VNHELGAKHE