Gene SeD_A4850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4850
Symbol	arcA
ID	6874391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4701772
End bp	4702992
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID	642787737
Product	arginine deiminase
Protein accession	YP_002218331
Protein GI	198242990
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGC ATTTTGTCGG TTCTGAAATC GGTCAATTAC GCAGCGTAAT GTTGCATCGG 
CCCAATCTCA GCCTAAAAAG ACTTACCCCT TCAAATTGTC AGGAATTACT TTTTGACGAT 
GTATTATCCG TAGAGCGCGC TGGCGAAGAG CATGACATTT TTGCCAACAC GCTGCGCCAG 
CAAGGGATAG AAGTGTTGCT GTTAACCGAC CTGCTCACCC AAACGCTGGA TGTGGCTGAC 
GCTAAAGCCT GGCTACTGGA TACGCAAATT TCCGATTATC GCCTTGGGCC CACCTTTGCC 
GCAGATATTC GTGCCTGGCT GGCGGATATG CCGCACCGTG AACTGGCTCG CCATTTAAGC 
GGCGGTTTAA CTTACGGCGA AATCCCCGCC TCCATAAAAA ATATGGTGGT CGATACTCAC 
GATATTAATG ACTTTATTAT GAAGCCATTA CCGAATCACC TATTTACCCG TGACACGTCC 
TGCTGGATAT ATAACGGCGT CTCAATTAAC CCCATGGCGA AACCTGCACG CCAACGTGAA 
ACGAATAATT TACGTGCCAT TTATCGCTGG CATCCTCAAT TCGCAGGCGG TGATTTCATT 
AAATATTTCG GCGACGAGGA CATTAATTAC GACCACGCCA CTTTAGAGGG CGGCGATGTG 
CTGGTGATTG GCCGCGGCGC GGTGTTGATC GGTATGTCTG AACGTACTAC GCCGCAGGGC 
GTCGAGTTCC TGGCGCAGGC ATTGTTTAAA CATCGTCAGG CGGAACGCGT CATTGCCGTT 
GAACTGCCAA AACATCGCTC CTGTATGCAC CTTGACACCG TCATGACCCA CATTGATATC 
GACACCTTCT CTGTCTATCC GGAAGTCGTT CGCCCGGACG TTCAGTGCTG GACGCTGACG 
CCAGACGGAC GCGGCGGTCT GAAACGAACC CAGGAGAGCA CGCTGGTTCA TGCTCTTGAA 
AAAGCGCTTG GCATCGATCA GGTGCGCTTA ATCACCACTG GCGGCGACGC ATTTGAAGCT 
GAGCGCGAAC AGTGGAATGA CGCCAATAAC GTGCTCACCC TGCGTCCCGG CGTGGTGGTG 
GGCTATGAGC GCAACATCTG GACCAACGAA AAATACGACA AAGCCGGCAT TACCGTCCTT 
CCCATTCCCG GCGATGAACT GGGTCGCGGG CGCGGAGGCG CACGCTGCAT GAGCTGTCCA 
CTGGAACGCG ATGGTATTTA A

Protein sequence

MEKHFVGSEI GQLRSVMLHR PNLSLKRLTP SNCQELLFDD VLSVERAGEE HDIFANTLRQ 
QGIEVLLLTD LLTQTLDVAD AKAWLLDTQI SDYRLGPTFA ADIRAWLADM PHRELARHLS 
GGLTYGEIPA SIKNMVVDTH DINDFIMKPL PNHLFTRDTS CWIYNGVSIN PMAKPARQRE 
TNNLRAIYRW HPQFAGGDFI KYFGDEDINY DHATLEGGDV LVIGRGAVLI GMSERTTPQG 
VEFLAQALFK HRQAERVIAV ELPKHRSCMH LDTVMTHIDI DTFSVYPEVV RPDVQCWTLT 
PDGRGGLKRT QESTLVHALE KALGIDQVRL ITTGGDAFEA EREQWNDANN VLTLRPGVVV 
GYERNIWTNE KYDKAGITVL PIPGDELGRG RGGARCMSCP LERDGI