Gene SeD_A2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2040
Symbol	astB
ID	6871676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1970367
End bp	1971710
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	56%
IMG OID	642785154
Product	succinylarginine dihydrolase
Protein accession	YP_002215820
Protein GI	198242760
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3724] Succinylarginine dihydrolase
TIGRFAM ID	[TIGR03241] succinylarginine dihydrolase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGC ATGAAGTTAA TTTTGATGGG CTGGTGGGGC TTACGCACCA TTATGCCGGG 
CTATCCTTCG GCAATGAGGC ATCGACCCGC CACCGTTTTC AGATGTCGAA TCCTCGTCTG 
GCGGTAAAGC AGGGGCTGCT AAAGATGAAG GCTTTGGCGG ATGCCGGCTT TCCCCAGGCG 
GTGATCCCGC CGCATGAGCG GCCTTTTATT CCGGCGTTGC GTCAGCTCGG CTTCACGGGT 
AGCGATGAGC AGATTCTGGA TAAGGTTGCG CGTCAGGCGC CACGCTGGCT TTCTAGCGTG 
AGTTCCGCGT CGCCAATGTG GGTTGCGAAT GCGGCGACGG TTTGCCCATC GGCAGACGCG 
CTGGACGGGA AAGTTCACCT GACGGTGGCG AATTTAAACA ATAAATTTCA TCGCGCTCTT 
GAGGCGCCTG TTACCGAAGC GCTGCTACGC GCCATATTTC GCGATGAAAG TCAGTTTTCA 
GTGCATAGCG CGTTACCGCA GGTCGCATTA TTGGGAGATG AAGGCGCGGC GAATCATAAC 
CGTCTGGGCG GCGAGTATGG TTCGGCAGGC GTGCAGCTTT TTGTCTATGG GCGCGAAGAG 
GAGAATGAAA TACGACCCGC TCGTTATCCG GCGCGCCAGA GCCGCGAAGC CAGCGAGGCC 
GTGGCGCGTC TTAATCAGGT GAATCCGCAA CAGGTTATCT TCGCTCAGCA GAACCCGGAG 
GTCATCGATC AAGGCGTATT CCATAATGAT GTCATCGCCG TTTCGAATCG ACAGGTATTG 
TTTTGTCACG AAGCGGCGTT TGCCCGGCAG AAAGTGCTCA TTAATCAGTT GCGTACGCGC 
GTTGACGGTT TTATGGCGAT AGAGGTGCCC GCCGGAGAGG TTTCTGTATC AGATGCTGTG 
GCGACCTACC TGTTTAATAG TCAGTTGTTA AGCCGTGACG ACGGCTCAAT GCTGCTAGTG 
TTGCCGCGGG AATGTCAGGA TCATGTCGGC GTCTGGCGCT ATCTGAATAA GCTGGTGGCG 
GAGGATAACC CCATCAGCGC GATGCAGGTG TTTGATTTGC GAGAAAGTAT GGCTAACGGT 
GGCGGGCCGG CCTGTCTGCG ATTACGCGTG GTGTTAACAG AAGAAGAACG ACGGGCGGTG 
AATCCAGCGG TAATGATGAA TGACGCTCTG TTTACGGCCC TTAACGCGTG GGCGGATCGT 
TATTATCGCG ATCGCCTGAC CGCTGCCGAT CTGGCCGATC CGTTATTATT GCGAGAAGGC 
CGGGAGGCGC TGGATGTGTT AACGCGTCTG CTGGATTTGG GGTCGGTTTA TCCTTTCCAG 
CAAACGGGGG CGGCTGATGG ATAA

Protein sequence

MTAHEVNFDG LVGLTHHYAG LSFGNEASTR HRFQMSNPRL AVKQGLLKMK ALADAGFPQA 
VIPPHERPFI PALRQLGFTG SDEQILDKVA RQAPRWLSSV SSASPMWVAN AATVCPSADA 
LDGKVHLTVA NLNNKFHRAL EAPVTEALLR AIFRDESQFS VHSALPQVAL LGDEGAANHN 
RLGGEYGSAG VQLFVYGREE ENEIRPARYP ARQSREASEA VARLNQVNPQ QVIFAQQNPE 
VIDQGVFHND VIAVSNRQVL FCHEAAFARQ KVLINQLRTR VDGFMAIEVP AGEVSVSDAV 
ATYLFNSQLL SRDDGSMLLV LPRECQDHVG VWRYLNKLVA EDNPISAMQV FDLRESMANG 
GGPACLRLRV VLTEEERRAV NPAVMMNDAL FTALNAWADR YYRDRLTAAD LADPLLLREG 
REALDVLTRL LDLGSVYPFQ QTGAADG