Gene SbBS512_E0986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0986
Symbol	amn
ID	6272679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	906987
End bp	908135
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	50%
IMG OID	641725134
Product	AMP nucleosidase
Protein accession	YP_001879658
Protein GI	187733016
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0775] Nucleoside phosphorylase
TIGRFAM ID	[TIGR01717] AMP nucleosidase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00000563719
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGTATC AGGATTATGG TGCGCATATC TCAGTGCAAC CCTCGCAGCA TGAAATCCCT 
TATCCTTATG TCATCGATGG CTCTGAATTG ACACTTGATC GCTCAATGAG CGCTGGGTTA 
ACTCGCTACT TTCCGACAAC AGAACTGGCG CAAATTGGCG ATGAAACTGC AGACGGCATT 
TATCATCCAA CTGAATTCTC CCCGCTATCG CATTTTGATG CGCGCCGCGT CGATTTTTCC 
CTCGCACGGT TGCGCCATTA TACCGGTACG CCAGTTGAAC ATTTTCAGCC GTTCGTCTTG 
TTTACCAACT ACACACGTTA TGTGGATGAA TTCGTTCGTT GGGGATGCAG CCAGATCCTC 
GATCCTGATA GTCCCTACAT TGCCCTTTCT TGTGCTGGCG GGAACTGGAT CACCGCCGAA 
ACCGAAGCGC CAGAAGAAGC CATTTCCGAC CTTGCATGGA AAAAACATCA GATGCCAGCA 
TGGCATTTAA TTACCGCCGA TGGTCAGGGT ATTACTCTGG TGAATATTGG CATAGGACCG 
TCAAATGCTA AAACCATCTG CGATCATCTG GCAGTGCTAC GCCCGGATGT CTGGTTGATG 
ATTGGTCACT GTGGCGGATT ACGTGAAAGT CAGGCCATTG GCGATTATGT ACTTGCACAC 
GCTTATTTAC GCGATGACCA CGTTCTTGAT GCGGTTCTGC CGCCCGATAT TCCTATTCCG 
AGCATTGCTG AAGTGCAACG TGCGCTTTAT GACGCCACCA AGCTGGTGAG TGGCAGGCCC 
GGTGAGGAAG TCAAACAGCG GCTACGTACT GGTACTGTGG TAACCACAGA TGACAGGAAC 
TGGGAATTAC GTTACTCAGC TTCTGCACTT CGTTTTAACT TAAGCCGGGC CGTAGCAATT 
GATATGGAAA GTGCAACCAT TGCCGCGCAA GGATATCGTT TCCGCGTGCC ATACGGGACA 
CTACTGTGTG TTTCAGATAA ACCGTTGCAT GGCGAGATTA AACTTCCCGG TCAGGCTAAC 
CGTTTTTATG AAGGCGCTAT TTCCGAACAC CTACAAATTG GCATTCGGGC GATCGATTTG 
CTGCGCGCAG AAGGCGACCG ACTGCATTCA CGTAAATTAC GAACCTTTAA TGAGCCGCCG 
TTCCGATAA

Protein sequence

MLYQDYGAHI SVQPSQHEIP YPYVIDGSEL TLDRSMSAGL TRYFPTTELA QIGDETADGI 
YHPTEFSPLS HFDARRVDFS LARLRHYTGT PVEHFQPFVL FTNYTRYVDE FVRWGCSQIL 
DPDSPYIALS CAGGNWITAE TEAPEEAISD LAWKKHQMPA WHLITADGQG ITLVNIGIGP 
SNAKTICDHL AVLRPDVWLM IGHCGGLRES QAIGDYVLAH AYLRDDHVLD AVLPPDIPIP 
SIAEVQRALY DATKLVSGRP GEEVKQRLRT GTVVTTDDRN WELRYSASAL RFNLSRAVAI 
DMESATIAAQ GYRFRVPYGT LLCVSDKPLH GEIKLPGQAN RFYEGAISEH LQIGIRAIDL 
LRAEGDRLHS RKLRTFNEPP FR