Gene SeAg_B1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B1952
Symbol	purB
ID	6797012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	1893285
End bp	1894655
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	52%
IMG OID	642776178
Product	adenylosuccinate lyase
Protein accession	YP_002146809
Protein GI	197247372
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAT CCTCACTGAC CGCCGTTTCC CCTGTCGATG GACGCTACGG CGATAAAGTC 
AGCGCGCTGC GCGGAATTTT TAGCGAATAC GGTTTGCTGA AATTTCGTGT ACAAGTCGAA 
GTACGTTGGC TGCAGAAATT AGCCGCGCAC GCAGCGATCA AGGAAGTTCC TGCTTTTGCT 
GCCGACGCAA ACGGTTACCT GGATACGCTT GTGGCAAACT TCAATGAAGA AGATGCCGCG 
CGCATTAAAA CCATTGAGCG TACGACTAAC CATGATGTGA AGGCAGTTGA GTATTTCCTG 
AAAGAAAAAG TCGCCGCGAT CCCGGCGCTA CATGACGTTT CCGAATTTAT CCACTTTGCC 
TGCACTTCTG AGGACATTAA CAACCTGTCG CACGCGTTAA TGCTCAAAAC CGCGCGCGAT 
GAAGTGATCC TGCCTTACTG GCGTCAGGTG ATTAACGCGG TTAAAGATCT CGCCACGCAG 
TATCGCGACA TTCCTCTGCT CTCCCGCACC CACGGCCAGC CGGCAACGCC TTCCACTCTG 
GGTAAAGAGA TGGCGAACGT GGCGTATCGT ATGGAGCGTC AGTTCCGCCA GCTCAACCAG 
GTGGAGATCC TCGGTAAAAT CAACGGCGCC GTAGGCAACT ATAACGCGCA TATCGCCGCC 
TATCCGGAAG TTGACTGGCA TCAGTTCAGC GAAGAGTTCG TCACCTCGCT GGGCATCCAG 
TGGAACCCTT ACACCACCCA GATTGAACCG CATGATTATA TTGCGGAACT GTTTGACTGT 
ATCGCGCGCT TTAACACCAT CCTGATCGAT TTCGATCGCG ATGTCTGGGG CTATATTGCG 
TTGAACCATT TCAAACAGAA AACCATCGCC GGGGAGATCG GTTCTTCTAC CATGCCGCAT 
AAAGTTAACC CCATTGACTT TGAAAACTCA GAAGGCAACC TCGGTCTGTC TAATGCAGTG 
TTGCACCATC TGGCAAACAA ACTGCCGGTT TCCCGCTGGC AGCGCGATCT GACCGACTCA 
ACCGTCCTGC GTAACCTGGG TGTCGGCATC GGCTATGCGC TTATCGCTTA TCAGTCCACC 
CTGAAGGGCG TCAGCAAGCT GGAAGTAAAC CGCGATCATC TGCTTGACGA ACTGGATCAC 
AACTGGGAAG TATTAGCCGA GCCGATCCAG ACCGTCATGC GCCGCTATGG TATTGAAAAA 
CCCTATGAAA AACTGAAAGA ATTGACCCGT GGCAAGCGTG TTGATGCCGA AGGAATGAAA 
CAGTTTATTG ATAGTCTGGC CCTGCCGGAA GCAGAAAAAA CGCGCCTTAA AGCCATGACG 
CCGGCAAATT ATATCGGTCG CGCTGTGACT CTGGTCGACG AACTTAAATA A

Protein sequence

MELSSLTAVS PVDGRYGDKV SALRGIFSEY GLLKFRVQVE VRWLQKLAAH AAIKEVPAFA 
ADANGYLDTL VANFNEEDAA RIKTIERTTN HDVKAVEYFL KEKVAAIPAL HDVSEFIHFA 
CTSEDINNLS HALMLKTARD EVILPYWRQV INAVKDLATQ YRDIPLLSRT HGQPATPSTL 
GKEMANVAYR MERQFRQLNQ VEILGKINGA VGNYNAHIAA YPEVDWHQFS EEFVTSLGIQ 
WNPYTTQIEP HDYIAELFDC IARFNTILID FDRDVWGYIA LNHFKQKTIA GEIGSSTMPH 
KVNPIDFENS EGNLGLSNAV LHHLANKLPV SRWQRDLTDS TVLRNLGVGI GYALIAYQST 
LKGVSKLEVN RDHLLDELDH NWEVLAEPIQ TVMRRYGIEK PYEKLKELTR GKRVDAEGMK 
QFIDSLALPE AEKTRLKAMT PANYIGRAVT LVDELK