Gene SeAg_B4751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4751
Symbol	arcA
ID	6795586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	4642029
End bp	4643249
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID	642778823
Product	arginine deiminase
Protein accession	YP_002149385
Protein GI	197251484
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGC ATTTTGTCGG TTCTGAAATC GGTCAATTAC GCAGTGTAAT GTTGCATCGG 
CCCAATCTCA GCCTAAAAAG ACTTACCCCT TCAAATTGTC AGGAATTACT TTTTGACGAT 
GTATTATCCG TAGAGCGCGC TGGCGAAGAG CATGACATTT TTGCCAACAC GCTGCGCCAG 
CAAGGGATAG AAGTGTTGCT GTTAACCGAC CTGCTCACCC AAACGCTGGA TGTGGCTGAC 
GCTAAAGCCT GGCTACTGGA TACGCAAATT TCCGATTATC GCCTTGGGCC CACCTTTGCC 
GCAGATATTC GCGCCTGGCT GGCGGATATG CCGCACCGTG AACTGGCTCG CCATTTAAGC 
GGCGGTTTAA CTTACGGCGA AATTCCCGCC TCCATAAAAA ATATGGTGGT CGATACTCAC 
GATATTAATG ACTTTATTAT GAAGCCATTA CCGAATCACC TATTTACCCG TGACACGTCC 
TGCTGGATAT ATAACGGCGT CTCAATTAAC CCCATGGCGA AACCTGCACG CCAACGTGAA 
ACGAATAATT TACGTGCTAT TTATCGCTGG CATCCTCAAT TCGCAGGCGG TGATTTCATT 
AAATATTTCG GCGACGAGGA CATTAATTAC GACCACGCCA CTTTAGAGGG CGGCGATGTG 
CTGGTGATTG GCCGCGGCGC GGTGTTGATC GGTATGTCTG AACGTACTAC GCCGCAGGGC 
GTCGAGTTCC TGGCGCAGGC ATTGTTTAAA CATCGTCAGG CGGAACGCGT CATTGCCGTT 
GAACTGCCAA AACATCGCTC CTGCATGCAC CTTGACACCG TCATGACCCA CATTGATATC 
GACACCTTCT CCGTCTATCC GGAAGTCGTT CGCCAGGACG TTCAGTGCTG GACGCTGACG 
CCAGACGGAC GCGGCGGTCT GAAACGAACC CAGGAGAGCA CGCTGGTTCA TGCTCTTGAA 
AAAGCGCTTG GCATCGATCA GGTGCGCTTA ATCACCACTG GCGGCGACGC ATTTGAAGCT 
GAGCGCGAAC AGTGGAATGA CGCCAATAAC GTGCTCACCC TGCGTCCCGG CGTGGTGGTG 
GGCTATGAGC GCAACATCTG GACCAACGAA AAATACGACA AAGCCGGCAT TACCGTCCTT 
CCCATTCCCG GCGATGAACT GGGTCGCGGG CGCGGGGGCG CACGCTGCAT GAGCTGTCCA 
CTGGAACGCG ATGGTATTTA A

Protein sequence

MEKHFVGSEI GQLRSVMLHR PNLSLKRLTP SNCQELLFDD VLSVERAGEE HDIFANTLRQ 
QGIEVLLLTD LLTQTLDVAD AKAWLLDTQI SDYRLGPTFA ADIRAWLADM PHRELARHLS 
GGLTYGEIPA SIKNMVVDTH DINDFIMKPL PNHLFTRDTS CWIYNGVSIN PMAKPARQRE 
TNNLRAIYRW HPQFAGGDFI KYFGDEDINY DHATLEGGDV LVIGRGAVLI GMSERTTPQG 
VEFLAQALFK HRQAERVIAV ELPKHRSCMH LDTVMTHIDI DTFSVYPEVV RQDVQCWTLT 
PDGRGGLKRT QESTLVHALE KALGIDQVRL ITTGGDAFEA EREQWNDANN VLTLRPGVVV 
GYERNIWTNE KYDKAGITVL PIPGDELGRG RGGARCMSCP LERDGI