Gene LGAS_1223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	LGAS_1223
Symbol
ID	4439581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Lactobacillus gasseri ATCC 33323
Kingdom	Bacteria
Replicon accession	NC_008530
Strand	-
Start bp	1225549
End bp	1226766
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	36%
IMG OID	639673060
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_815030
Protein GI	116629858
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000164675
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	98
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATA CAGAAGTAAT GGTTCGCTAT GGCGAGCTAT CCACTAAAGG AAAAAATCGT 
AAAGATTTTA TTGGAAGATT AGCTGGTAAC GTAACTAGAG CTTTACAAGA TTTCCCAGAA 
ATTGAAATAC ATCCTAAACA TGATCGAATG CACATTGTTT TAAATGGAGC TCCATTTGAT 
AAAATCGATC AGCGATTAAA GCTTGTTTTT GGTATTCAAA CTTATTCGCC AACCATAAAA 
GTTGAAAAGA ATCTTGATGC TATCAAAAAA GCTTCACTTG AATTAATGCA AGCGACTTTT 
AAGGATGGAA TGACTTTTAA AGTTAATACT AGACGTAGTG ACCATGAATT TGAATATGAC 
ACTAATCAAT TAAACACTAT GATTGGTGAT TACTTATTTG ATAATATGGA TAACTTAAAG 
GTAAAAATGA AGAAGCCTGA TTTAGTCTTG AGAATTGAAG TTCGCCAAGA TGCTATCTAT 
ATTTCAAATC AACTTCTTCA TGGTGCAGGT GGGATGCCAG TTGGTACGGC AGGAAGAGCA 
GTGATGATGC TTTCAGGTGG AATTGATTCA CCAGTAGCTT CTTATCTCGC AATGAAGCGT 
GGAGTTGAAA TTGATATGGT TCACTTCTTT AGTCCACCAT ATACTACAGA AAAAGCGCTA 
GCTAAAGCAA AGGAACTTAC TGGAATTTTA GCTAACTATT CCGGAAAGAT TAATTTTATT 
GCAGTACCTT TTACTGAAAT TCAAGAACAA ATTAAAGAAA AATTGCCAGA AGGTTATTTG 
ATGACCATTC AGCGTCGCTT TATGCTTCAA CTAGCAGATC GTATTCGTGC AAAGCGTGGT 
GGTTTAGCAA TTTTTAATGG AGAGTCAGTT GGTCAAGTAG CTTCACAAAC CTTAGAGTCA 
ATGGTAGCGA TTAATGATGT TACTTCGACA CCTGTCCTTC GTCCTGTAGC CACAATGGAT 
AAAACTGAAA TCATTAAGCT AGCTGAACAA ATTGGTACTT TTGATCTTTC TATTGAACCA 
TTTGAAGATT GTTGTACTAT TTTTGCGCCA CCTCGTCCAA AGACTAAGCC TAAGCTAGAT 
GAGGCTCGTA AGTTAGAAAA TAGACTTGAT GCCGAGAAAA TGATTCAACG CGCAATTGAT 
GGAATGAAAA TTACACCAAT TTATCCAAAT CAAAAATTCT TGGATGATAA GGCTCAAGAA 
GATGCAGACT TATTGTAA

Protein sequence

MQYTEVMVRY GELSTKGKNR KDFIGRLAGN VTRALQDFPE IEIHPKHDRM HIVLNGAPFD 
KIDQRLKLVF GIQTYSPTIK VEKNLDAIKK ASLELMQATF KDGMTFKVNT RRSDHEFEYD 
TNQLNTMIGD YLFDNMDNLK VKMKKPDLVL RIEVRQDAIY ISNQLLHGAG GMPVGTAGRA 
VMMLSGGIDS PVASYLAMKR GVEIDMVHFF SPPYTTEKAL AKAKELTGIL ANYSGKINFI 
AVPFTEIQEQ IKEKLPEGYL MTIQRRFMLQ LADRIRAKRG GLAIFNGESV GQVASQTLES 
MVAINDVTST PVLRPVATMD KTEIIKLAEQ IGTFDLSIEP FEDCCTIFAP PRPKTKPKLD 
EARKLENRLD AEKMIQRAID GMKITPIYPN QKFLDDKAQE DADLL