Gene Sama_2431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2431
Symbol
ID	4604680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	2924723
End bp	2926177
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	53%
IMG OID	639781828
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_928305
Protein GI	119775565
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase [COG0607] Rhodanese-related sulfurtransferase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTTA TCGTTAAGCT GTATCCCGAA ATCATGATTA AGAGCAAACC GGTAAGAATG 
CGTTTTACCA AGATGCTCGA GTCCAATATC CGCAATGTGC TGAAAAAAAT CGATGAGGAT 
GCCAAGGTAC AGCGCCAATG GGACAAGATC ATGGTGAAGG TGCCCAAAGA CAAGCCTGAG 
CTTACCGAGC TCTTTGCCGA GCGTCTGGCT CATATTCCAG GTATTCATCA TGTGCTGCAG 
GTGGCCGAGT ACGACTTTGA AACCGTGGAT GATATCTATC AGCTCGCGCT GCCTGTGTAT 
CGCGACATGC TCAAGGACAA AACCTTTTGT GTGCGGGTAA AGCGTGCCGG TCAACACGAT 
TTCAACTCCA TCGAGGTTGA GCGTTATGTT GGCGGCGGTT TAAACCAGTT TACCGAAGCC 
AAGGGCGTGC AGCTGAAGAA CCCGGATGTG ACCATCCAGC TCGAAATCGA TCGCGACAAG 
CTCTATATGG TCAGCCAGCG CATCGAGGGT TTGGGGGGCT TCCCCATTGC CGCTCAGGAA 
GACGTGCTGT CTTTGATTTC CGGTGGCTTT GACTCGGGCG TGGCCAGCTT CCAGTTTATT 
AAAAAGGGTT CCCGTACCCA TTATTGTTTC TTCAATCTTG GTGGCGCCCA GCACGAAATC 
GGCGTGAAAC AAGTGGCCTA CCACCTGTGG AAGACCTACG GCGAGTCGCA CAAAGTGAAG 
TTTGTGTCTG TGCCCTTCGA AGAAGTGGTA ACAGAAATCC TCGAGCGTAT CGAAAACGGT 
CAGATGGGTG TGGTGCTTAA GCGCATGATG ATGCGCGCCG CCACCCGTGT GGCCGAACGC 
ATGGGTATTC AGGCTCTGGT CACTGGTGAG AGCCTGGGTC AGGTGTCGAG CCAGACCCTG 
ACCAACCTTA ATGTCATTGA CCGCAGCACC GACCTCTTGA TCCTGCGTCC GCTGATCAGC 
ATGGATAAAC CGGACATTAT CCGCGAAGCG CGCCGCATAG GTACCGAAGA TTTCGCGGCC 
TCCATGCCCG AGTATTGTGG TGTGATTTCC CAGCGCCCTA CCGTGAAGGC GGTACTCTCC 
AAGGTGGAAG CCGAAGAGCA GAAGTTTTCT GAAGACCTGC TCGACCGCGT GCTGGCGAAA 
GCAGAAGTGA TTGATATCCG TGATATTGCT GTTGCCACCA GTGAGCGAGT GACTGAAACC 
GAGACCGTCT CCAGTGCGGC CGGAAACGAA GTTATCATCG ACATTCGCGC GCCAGAAGAA 
GAAGAGTCCA GACCCCTGGA CGTGGACGGC GTTGAAGTGA AGGTAATCCC CTTCTTCAAA 
CTGGCGACTG CTTTTGCCGA GCTCGATAAA GACAAAACGT ATCTGCTTTA CTGCGAACGT 
GGCGTTATGA GTAAGCTGCA AGCCCTGTAT CTGCAAGAGC AGGGCTACAA TAACGTGAAG 
GTATATCGTC CCTGA

Protein sequence

MKFIVKLYPE IMIKSKPVRM RFTKMLESNI RNVLKKIDED AKVQRQWDKI MVKVPKDKPE 
LTELFAERLA HIPGIHHVLQ VAEYDFETVD DIYQLALPVY RDMLKDKTFC VRVKRAGQHD 
FNSIEVERYV GGGLNQFTEA KGVQLKNPDV TIQLEIDRDK LYMVSQRIEG LGGFPIAAQE 
DVLSLISGGF DSGVASFQFI KKGSRTHYCF FNLGGAQHEI GVKQVAYHLW KTYGESHKVK 
FVSVPFEEVV TEILERIENG QMGVVLKRMM MRAATRVAER MGIQALVTGE SLGQVSSQTL 
TNLNVIDRST DLLILRPLIS MDKPDIIREA RRIGTEDFAA SMPEYCGVIS QRPTVKAVLS 
KVEAEEQKFS EDLLDRVLAK AEVIDIRDIA VATSERVTET ETVSSAAGNE VIIDIRAPEE 
EESRPLDVDG VEVKVIPFFK LATAFAELDK DKTYLLYCER GVMSKLQALY LQEQGYNNVK 
VYRP