Gene SeHA_C4784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4784
Symbol	purA
ID	6490824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4663035
End bp	4664333
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	642744836
Product	adenylosuccinate synthetase
Protein accession	YP_002048409
Protein GI	194451596
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0104] Adenylosuccinate synthase
TIGRFAM ID	[TIGR00184] adenylosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0521229
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	0.599456
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAACA ACGTCGTCGT ACTGGGCACC CAATGGGGTG ACGAAGGTAA AGGAAAGATC 
GTCGATCTTC TGACTGAACG GGCTAAATAT GTTGTACGCT ACCAGGGCGG TCACAACGCA 
GGCCATACTC TCGTAATCAA CGGTGAAAAA ACCGTTCTCC ATCTTATTCC ATCAGGTATT 
CTTCGCGAGA ATGTAACCAG CATCATCGGT AACGGTGTTG TGCTGTCTCC GGCCGCGCTG 
ATGAAAGAGA TGAAAGAACT GGAAGACCGT GGCATCCCCG TTCGTGAGCG TCTGCTGCTG 
TCTGAAGCCT GTCCGCTGAT CCTTGATTAT CACGTTGCGC TGGATAACGC GCGTGAGAAA 
GCGCGTGGCG CGAAAGCGAT CGGCACCACC GGTCGTGGAA TCGGGCCTGC TTATGAAGAT 
AAAGTGGCAC GTCGCGGTCT GCGTGTTGGT GACCTTTTCG ACAAAGAAAC CTTCGCTGAA 
AAACTGAAAG AAGTGATGGA ATATCACAAC TTCCAGTTGG TTAACTACTA CAAAGCTGAA 
GCGGTTGATT ACCAGAAAGT TCTGGATGAT ACGATGGCTG TTGCCGACAT CCTGACTTCT 
ATGGTTGTTG ACGTTTCGGA CCTGCTCGAC CAGGCGCGTC AGCGTGGCGA TTTCGTCATG 
TTTGAAGGTG CGCAGGGTAC CCTGCTGGAT ATCGACCACG GTACTTATCC GTACGTAACT 
TCTTCTAACA CCACTGCAGG TGGCGTGGCG ACCGGTTCCG GCCTGGGCCC GCGTTATGTT 
GATTACGTTC TGGGTATCCT CAAAGCTTAC TCCACTCGCG TAGGTGCGGG TCCGTTCCCG 
ACCGAACTGT TTGATGAAAC CGGCGAGTTC CTCTGCAAGC AGGGTAACGA ATATGGCGCT 
ACTACCGGCC GTCGTCGTCG TACCGGCTGG CTGGACACCG TTGCCGTTCG TCGTGCGGTA 
CAGCTGAACT CCCTGTCTGG CTTCTGCCTG ACCAAACTGG ACGTGCTGGA TGGCCTGAAA 
GAGGTGAAAC TCTGCGTGGC TTACCGTATG CCGGATGGTC GCGAAGTGAC TACCACTCCG 
CTGGCAGCTG ACGACTGGAA AGGTGTAGAG CCGATTTACG AAACCATGCC GGGCTGGTCT 
GAATCCACCT TCGGCGTGAA AGATCGTAGC GGTCTGCCGC AGGCGGCGCT GAACTACATC 
AAGCGTATTG AAGAACTGAC CGGCGTGCCG ATTGATATTA TTTCTACCGG CCCCGATCGT 
ACTGAGACGA TGATTCTGCG CGACCCGTTC GACGCGTAA

Protein sequence

MGNNVVVLGT QWGDEGKGKI VDLLTERAKY VVRYQGGHNA GHTLVINGEK TVLHLIPSGI 
LRENVTSIIG NGVVLSPAAL MKEMKELEDR GIPVRERLLL SEACPLILDY HVALDNAREK 
ARGAKAIGTT GRGIGPAYED KVARRGLRVG DLFDKETFAE KLKEVMEYHN FQLVNYYKAE 
AVDYQKVLDD TMAVADILTS MVVDVSDLLD QARQRGDFVM FEGAQGTLLD IDHGTYPYVT 
SSNTTAGGVA TGSGLGPRYV DYVLGILKAY STRVGAGPFP TELFDETGEF LCKQGNEYGA 
TTGRRRRTGW LDTVAVRRAV QLNSLSGFCL TKLDVLDGLK EVKLCVAYRM PDGREVTTTP 
LAADDWKGVE PIYETMPGWS ESTFGVKDRS GLPQAALNYI KRIEELTGVP IDIISTGPDR 
TETMILRDPF DA