Gene Sama_2097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2097
Symbol
ID	4604347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	2541383
End bp	2542420
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	56%
IMG OID	639781482
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_927972
Protein GI	119775232
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.385
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACTC CTACCCCACT GAGCTATAAA GACGCCGGTG TCGATATCGA TGCAGGCAAC 
GCACTGGTGC AAAACATCAA GTCTGCCGTT AAGCGCACCC GCCGCCCTGA AGTGATGGGC 
AACCTGGGTG GTTTTGGTGC CCTGTGTGAA CTGCCGACCA AATACAAGCA CCCAGTGCTG 
GTATCCGGTA CCGACGGCGT GGGAACCAAG CTGCGTCTGG CCATTGACTT CAAGAGCCAC 
GACACCGTGG GTATTGATCT GGTCGCCATG TGTGTGAACG ACCTGATTGT GCAGGGCGCT 
GAGCCACTGT TCTTCCTCGA CTACTATGCC ACCGGCAAGC TGGACGTAGA GACAGCCACC 
TCTGTAGTAA ATGGTATTGG TGAAGGCTGT TTCCAGTCAG GTTGCGCCCT GATTGGTGGT 
GAAACCGCCG AAATGCCCGG CATGTACGAA GGCGAAGACT ACGACCTGGC CGGTTTCTGC 
GTAGGTGTGG TTGAAAAGGC CGACATCATC GACGGCACCA AGGTAAAAGC CGGTGATGCG 
CTGATTGCAC TCGCCTCAAG TGGTCCTCAC TCAAACGGTT ATTCTCTTAT CCGTAAGGTA 
CTGGAAGTGA GCAAGGCCGA TCCTCAAATG GATCTGAACG GCAAGCCGCT CATCAAGCAC 
CTGCTGGAAC CCACCAAGAT TTATGTCAAA TCACTGCTGA AGCTGATTGC CGAAAGCGAC 
GTACACGCCA TGGCGCACAT CACCGGCGGT GGTTTCTGGG AAAACATCCC ACGCGTACTG 
CCTGACAACT GCAAAGCCGT GGTTCAGGGC GATTCCTGGC AGTGGCCTGT GGTATTCGAC 
TGGCTGCAAA CTGCCGGCAA TATCGAAACC TACGAAATGT ACCGCACCTT TAACTGCGGC 
GTGGGCATGA TTGTTGCCCT GCCCGCCGAC AAGGTTGACG CGGCCCTTGA ACTCCTTAAG 
GCCGAAGGTG AAAACGCCTG GCACATCGGC CATATCGCCG CGCGTAATGG CGATGAAGAG 
CAGGTGGAGA TCCTCTGA

Protein sequence

MSTPTPLSYK DAGVDIDAGN ALVQNIKSAV KRTRRPEVMG NLGGFGALCE LPTKYKHPVL 
VSGTDGVGTK LRLAIDFKSH DTVGIDLVAM CVNDLIVQGA EPLFFLDYYA TGKLDVETAT 
SVVNGIGEGC FQSGCALIGG ETAEMPGMYE GEDYDLAGFC VGVVEKADII DGTKVKAGDA 
LIALASSGPH SNGYSLIRKV LEVSKADPQM DLNGKPLIKH LLEPTKIYVK SLLKLIAESD 
VHAMAHITGG GFWENIPRVL PDNCKAVVQG DSWQWPVVFD WLQTAGNIET YEMYRTFNCG 
VGMIVALPAD KVDAALELLK AEGENAWHIG HIAARNGDEE QVEIL