Gene SeHA_C4869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4869
Symbol	arcA
ID	6491546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4740335
End bp	4741555
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID	642744917
Product	arginine deiminase
Protein accession	YP_002048490
Protein GI	194449128
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.99557
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	98
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGC ATTTTGTCGG TTCTGAAATC GGTCAATTAC GCAGCGTAAT GTTGCATCGG 
CCCAATCTCA GCCTAAAAAG ACTTACCCCT TCAAATTGTC AGGAATTACT TTTTGACGAT 
GTATTATCCG TAGAGCGCGC TGGCGAAGAG CATGACATTT TTGCCAACAC GCTGCGCCAG 
CAAGGGATAG AAGTGTTGCT GTTAACCGAC CTGCTCACCC AAACGCTGGA TGTGGCTGAC 
GCTAAAGCCT GGCTACTGGA TACGCAAATT TCCGATTATC GCCTTGGGCC CACCTTTGCC 
GCAGATATTC GCGCCTGGCT GGCGGATATG CCGCACCGTG AACTGGCTCG CCATTTAAGC 
GGCGGTTTAA CTTACGGCGA AATTCCCGCC TCCATAAAAA ATATGGTGGT CGATACTCAC 
GATATTAATG ACTTTATTAT GAAGCCATTA CCGAATCACC TATTTACCCG TGACACGTCC 
TGCTGGATAT ATAACGGCGT CTCAATTAAC CCCATGGCGA AACCTGCACG CCAACGTGAA 
ACGAATAATT TACGTGCTAT TTATCGCTGG CATCCTCAAT TCGCAGGCGG TGATTTCATT 
AAATATTTCG GCGACGAGGA CATTAATTAC GACCACGCCA CTTTAGAGGG CGGCGATGTG 
CTGGTGATTG GCCGCGGCGC GGTGTTGATC GGTATGTCTG AACGTACTAC GCCGCAGGGC 
GTCGAGTTCC TGGCGCAGGC ATTGTTTAAA CATCGTCAGG CGGAACGCGT CATTGCCGTT 
GAACTGCCAA AACATCGCTC CTGTATGCAC CTTGACACCG TCATGACCCA CATTGATATC 
GACACCTTCT CCGTCTATCC GGAAGTCGTT CGCCCGGACG TTCAGTGCTG GACGCTGACG 
CCAGACGGAC GCGGCGGTCT GAAACGAACC CAGGAGAGCA CGCTGGTTCA TGCTCTTGAA 
AAAGCGCTTG GCATCGATCA GGTGCGCTTA ATCACCACTG GCGGCGACGC ATTTGAAGCT 
GAGCGCGAAC AGTGGAATGA CGCCAATAAC GTGCTCACCC TGCGTCCCGG CGTGGTGGTG 
GGCTATGAGC GCAACATCTG GACCAACGAA AAATACGACA AAGCCGGCAT TACCGTCCTT 
CCCATTCCCG GCGATGAACT GGGTCGCGGG CGCGGGGGCG CACGCTGCAT GAGCTGTCCA 
CTGGAACGCG ATGGTATTTA A

Protein sequence

MEKHFVGSEI GQLRSVMLHR PNLSLKRLTP SNCQELLFDD VLSVERAGEE HDIFANTLRQ 
QGIEVLLLTD LLTQTLDVAD AKAWLLDTQI SDYRLGPTFA ADIRAWLADM PHRELARHLS 
GGLTYGEIPA SIKNMVVDTH DINDFIMKPL PNHLFTRDTS CWIYNGVSIN PMAKPARQRE 
TNNLRAIYRW HPQFAGGDFI KYFGDEDINY DHATLEGGDV LVIGRGAVLI GMSERTTPQG 
VEFLAQALFK HRQAERVIAV ELPKHRSCMH LDTVMTHIDI DTFSVYPEVV RPDVQCWTLT 
PDGRGGLKRT QESTLVHALE KALGIDQVRL ITTGGDAFEA EREQWNDANN VLTLRPGVVV 
GYERNIWTNE KYDKAGITVL PIPGDELGRG RGGARCMSCP LERDGI