Gene MARTH_orf098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MARTH_orf098
Symbol	thiI
ID	6418256
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycoplasma arthritidis 158L3-1
Kingdom	Bacteria
Replicon accession	NC_011025
Strand	+
Start bp	87313
End bp	88458
Gene Length	1146 bp
Protein Length	381 aa
Translation table	4
GC content	31%
IMG OID	642715289
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_001999748
Protein GI	193216506
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00000238711
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCAAA AAATTCTAAT AAGATATGGC GAACTTACGC TCAAAGGCCA AAATAAACGG 
GATTTTATTA ATGATTTAAA ACGTAATTTA ATGTTCCATA TACCAAAAGA GCAAATTAAA 
ATGGAATACG ATCGTGCTTT TTTGGATTTT AGTTTGACTA ATTTAGATGC TCTTAAGTAT 
GTTTTTGGTA TTTCTTCTTA TTCATGCGTT TATGAAGTAG AAAGCTCTTT GGCAGCAATT 
ACTTCAAAAG TACTAGATAT TGCTAAACAA AAATATCCTT TTAAAACTTT TGCTATTGCA 
GCAAGAAGAC ATAATAAAAA TTTTGAAATG AATTCCAATG ATTTAAATAG ACATTTAGGC 
TGTGCTATTC TAAGTAATTT CGAAGTAAAA GTAAATTTAG AAGAGCCTGA TTTAAAAATA 
TATGTTGAGG TTAGGGATGC TTCAACTTAT ATTTTTATTG ATTATATTGC CGGCCTTGGT 
GGCATGCCTT TAAATTCTGC TGGTCAAGTT TTGCATCTAA TGAGTGGTGG CATTGATTCA 
CCAGTAGCGG CTTATTTACT ACAAAAACGA GGTCTAAGAA TTAATTTTTT AAATTTCATC 
ACGCCACCTC ATACTGATGA AAAAACCACA CAAAAAGTTG ATGAATTAAT TAAAGTTATC 
GCTAAATACC AAGGGAGCGC CAAACTATAT CAAGTTAATT TTACAGATAT CATGAATTAT 
ATTGGCCTCG TAAGTAATCA AAAATATAAA ATTATCTTAA TGCGACGTTC TTTTTATCGG 
ATCGCTCAAA TGCTTGCAAA AAAATTGCAC ATTAAAGCTT TATCTAACGG TGAAAATTTG 
GCACAAGTGG CATCACAAAC ATTAGAAGCA ATTCACACAG TTAGTGCTCC GATTACACTT 
CCGATTTTTA GACCACTTCT TAGTTTTGAT AAAAACGAAA CGATTAAGAT TGCCGAAAAA 
ATAGGAACTA TGCCAATTTC AATTTTAAAA GCTTGTGAAA CTTGCGAACT TTTTGCTCCT 
AAAAATCCAA TTATTAAACC AACGCCCGAA GAAGCAAGCG AGCTAGAAAA AGAATTAGAT 
AAACTACCAG AGCTAGAAAA ATTAGCTGTT GAAAATGTAA CTATTAAAAC AATTAGCACC 
TTATAA

Protein sequence

MYQKILIRYG ELTLKGQNKR DFINDLKRNL MFHIPKEQIK MEYDRAFLDF SLTNLDALKY 
VFGISSYSCV YEVESSLAAI TSKVLDIAKQ KYPFKTFAIA ARRHNKNFEM NSNDLNRHLG 
CAILSNFEVK VNLEEPDLKI YVEVRDASTY IFIDYIAGLG GMPLNSAGQV LHLMSGGIDS 
PVAAYLLQKR GLRINFLNFI TPPHTDEKTT QKVDELIKVI AKYQGSAKLY QVNFTDIMNY 
IGLVSNQKYK IILMRRSFYR IAQMLAKKLH IKALSNGENL AQVASQTLEA IHTVSAPITL 
PIFRPLLSFD KNETIKIAEK IGTMPISILK ACETCELFAP KNPIIKPTPE EASELEKELD 
KLPELEKLAV ENVTIKTIST L