Gene SeSA_A4721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4721
Symbol	arcA
ID	6519030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	4585345
End bp	4586565
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID	642749654
Product	arginine deiminase
Protein accession	YP_002117387
Protein GI	194734217
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.560166
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.160752
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGC ATTTTGTCGG TTCTGAAATA GGTCAATTAC GCAGCGTAAT GTTGCATCGT 
CCCAATCTCA GCCTAAAAAG ACTTACCCCT TCAAATTGTC AGGAATTACT TTTTGACGAT 
GTATTATCCG TAGAGCGCGC TGGCGAAGAG CATGACATTT TTGCCAACAC GCTGCGCCAG 
CAAGGGATAG AAGTGTTGCT GTTAACCGAC CTGCTCACCC AAACGCTGGA TGTGGCTGAC 
GCTAAAGCCT GGCTACTGGA CACGCAAATT TCCGATTATC GCCTTGGGCC CACCTTTGCC 
GCAGATATTC GCGCCTGGCT GGCGGATATG CCGCACCGTG AACTGGCTCG CCATTTAAGC 
GGCGGTTTAA CTTACGGCGA AATCCCCGCC TCCATAAAAA ATATGGTGGT CGATACTCAC 
GATATTAATG ACTTTATTAT GAAGCCATTA CCGAATCACC TATTTACCCG TGACACGTCC 
TGCTGGATAT ATAACGGCGT CTCAATTAAC CCCATGGCAA AACCTGCACG CCAACGTGAA 
ACGAATAATT TACGAGCTAT TTATCGCTGG CATCCTCAAT TCGCAGGCGG TGATTTCATT 
AAATATTTCG GCGACGAGGA CATTAATTAC GACCACGCCA CTTTAGAGGG CGGCGATGTG 
CTGGTGATTG GCCGCGGCGC GGTGTTGATC GGTATGTCTG AACGTACTAC GCCGCAGGGC 
GTCGAGTTCC TGGCGCAGGC ATTGTTTAAA CATCGTCAGG CGGAACGCGT CATTGCCGTT 
GAACTGCCAA AACATCGCTC CTGCATGCAC CTTGATACCG TCATGACCCA CATTGATATC 
GACACCTTCT CCGTCTATCC GGAAGTCGTT CGCCCGGACG TTCAGTGCTG GACGCTGACG 
CCAGACGGAC GCGGCGGTCT GAAACGAACC CAGGAGAGCA CGCTGGTTCA TGCTCTTGAA 
AAAGCGCTTG GCATCGATCA GGTGCGCTTA ATCACCACTG GCGGCGACGC ATTTGAAGCT 
GAGCGCGAAC AGTGGAATGA CGCCAATAAC GTGCTCACCC TGCGTCCCGG CGTGGTGGTG 
GGCTATGAGC GCAACATCTG GACCAACGAA AAATACGACA AAGCCGGCAT TACCATCCTT 
CCCATTCCCG GCGATGAACT GGGTCGCGGG CGCGGGGGCG CACGCTGCAT GAGCTGTCCA 
CTGGAACGCG ATGGTATTTA A

Protein sequence

MEKHFVGSEI GQLRSVMLHR PNLSLKRLTP SNCQELLFDD VLSVERAGEE HDIFANTLRQ 
QGIEVLLLTD LLTQTLDVAD AKAWLLDTQI SDYRLGPTFA ADIRAWLADM PHRELARHLS 
GGLTYGEIPA SIKNMVVDTH DINDFIMKPL PNHLFTRDTS CWIYNGVSIN PMAKPARQRE 
TNNLRAIYRW HPQFAGGDFI KYFGDEDINY DHATLEGGDV LVIGRGAVLI GMSERTTPQG 
VEFLAQALFK HRQAERVIAV ELPKHRSCMH LDTVMTHIDI DTFSVYPEVV RPDVQCWTLT 
PDGRGGLKRT QESTLVHALE KALGIDQVRL ITTGGDAFEA EREQWNDANN VLTLRPGVVV 
GYERNIWTNE KYDKAGITIL PIPGDELGRG RGGARCMSCP LERDGI