Gene Sama_2533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2533
Symbol
ID	4604780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	3042011
End bp	3043036
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	52%
IMG OID	639781928
Product	thiamin biosynthesis lipoprotein ApbE
Protein accession	YP_928405
Protein GI	119775665
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.903036
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA CCTTATCTAA CTGGCTGGTC CTCGTCGGAC TGGCCTTTTT TATTTCAGCT 
TGTTCTAAAG CACCTGAGGT TGTCAGCCTG TCTGGCAGCA CCATGGGCAC CACGTATCAC 
ATCAAGGTGG TTCCCAGTGA CGCCTTACCC CAAAGCCAGC TGCTGCAGGC AGAAATTGAC 
CTGGCGTTGG AGCGCGTGAA TGACCAGATG TCTACTTACC GTCCCACCTC TGAGCTGAGC 
CGCTTCAATC AGTTGCCATT GGAGCAGGGT GTTGAGGTGT CGGATGACAC TATCAAGGTG 
GTCCGAGAGG GAATTCGCTT AAATGAGCTA ACCGACGGCG CGCTGGATAT TACTCTGGGC 
CCACTGGTCA ATATCTGGGG GTTTGGACCG GACAAGCGAC CAACTAAATC CCCCACCGAA 
GCTGAAATCG CCGACGCCAA GACTCGCACC GGTATTCAGA ACATCAGCAT TGAAGGTAAC 
CGCCTCTTTA AGCGCAACGC TCACCTTTAT GTGGATTTGT CATCCATTGC CAAGGGCTAT 
GGCGTGGATG TGATTGCCGA TTTACTGGAT AAGTATCACA CCAGCGGTTA TCTGGTAGAA 
ATTGGCGGTG AACTGCGTAT CAAGGGCACC AAGGGTGATG GTAGCAGCTG GCGTGTAGCC 
GTTGAAAAGC CACAGGCTGA AGGCCGTGCG GTGTCTCAGG TAATAGAACC CGGTGATATG 
GGTATGGCTA CCTCTGGCGA TTATCGCAAT TACTTCGAAG AAAATGGCAA ACGCTTCTCA 
CATCTGATAG ACCCAAGGAC CGGTTATCCC ATCGAGCACA CCCTCGCATC TGTGACAGTG 
CTGCATCCAA GCTGTATGAC TGCCGACGGC CTGGCGACGG CCATGATGGT GCTCGGCACG 
GAAGCGTCAT TGATTCTTGC CAAACAGCAG GGACTGGCGA TAATGCTGAT TGAAAAACAG 
GGCGAAGAGT TTGTGGTACA CTACAGCGAC GCATTTTTGC CCTTCGTTAA GTCCACTCAG 
GAGTGA

Protein sequence

MKKTLSNWLV LVGLAFFISA CSKAPEVVSL SGSTMGTTYH IKVVPSDALP QSQLLQAEID 
LALERVNDQM STYRPTSELS RFNQLPLEQG VEVSDDTIKV VREGIRLNEL TDGALDITLG 
PLVNIWGFGP DKRPTKSPTE AEIADAKTRT GIQNISIEGN RLFKRNAHLY VDLSSIAKGY 
GVDVIADLLD KYHTSGYLVE IGGELRIKGT KGDGSSWRVA VEKPQAEGRA VSQVIEPGDM 
GMATSGDYRN YFEENGKRFS HLIDPRTGYP IEHTLASVTV LHPSCMTADG LATAMMVLGT 
EASLILAKQQ GLAIMLIEKQ GEEFVVHYSD AFLPFVKSTQ E