Gene SNSL254_A4814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4814
Symbol	arcA
ID	6482146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4687862
End bp	4689082
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID	642740028
Product	arginine deiminase
Protein accession	YP_002043706
Protein GI	194444027
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.514213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGC ATTTTGTCGG TTCTGAAATC GGTCAATTAC GCAGCGTAAT GTTGCATCGG 
CCCAATCTCA GCCTAAAAAG ACTTACCCCT TCAAATTGTC AGGAATTACT TTTTGACGAT 
GTATTATCCG TAGAGCGCGC TGGCGAAGAG CATGACATTT TTGCCAACAC GCTGCGCCAG 
CAAGGGATAG AAGTGTTGCT GTTAACCGAC CTGCTCACCC AAACGCTGGA TGTGGCTGAC 
GCTAAAGCCT GGCTACTGGA TACGCAAATT TCCGATTATC GCCTTGGGCC CACCTTTGCC 
GCAGATATTC GCGCCTGGCT GGCGGATATG CCGCACCGTG AACTGGCTCG CCATTTAAGC 
GGCGGTTTAA CTTACGGCGA AATCCCCGCC TCCATAAAAA ATATGGTGGT CGATACTCAC 
GATATTAATG ACTTTATTAT GAAGCCATTA CCGAATCACC TATTTACCCG TGACACGTCC 
TGCTGGATAT ATAACGGCGT CTCAATTAAC CCCATGGCGA AACCTGCACG CCAACGTGAA 
ACGAATAATT TACGTGCTAT TTATCGCTGG CATCCTCAAT TCGCAGGCGG TGATTTCATT 
AAATATTTCG GCAACGAGGA CATTAATTAC GACCACGCCA CTTTAGAGGG CGGCGATGTG 
CTGGTGATTG GCCGCGGCGC GGTGTTGATC GGTATGTCTG AACGTACTAC GCCGCAGGGC 
GTCGAGTTCC TGGCGCAGGC ATTGTTTAAA CATCGTCAGG CGGAACGCGT CATTGCCGTT 
GAACTGCCAA AACATCGCTC CTGCATGCAC CTTGACACCG TCATGACCCA CATTGATATC 
GACACCTTCT CCGTCTATCC GGAAGTCGTT CGCCCGGACG TTCAGTGCTG GACGCTGACG 
CCAGACGGAC GCGGCGGTCT GAAACGAACC CAGGAGAGCA CGCTGGTTCA TGCTCTTGAA 
ACAGCGCTTG GCATCGATCA GGTGCGCTTA ATCACCACTG GCGGCGACGC ATTTGAAGCT 
GAGCGCGAAC AGTGGAATGA CGCCAATAAC GTGCTCACCC TGCGTCCCGG CGTGGTGGTG 
GGCTATGAGC GCAACATCTG GACCAACGAA AAATACGACA AAGCCGGCAT TACCGTCCTT 
CCCATTCCCG GCGATGAACT GGGTCGCGGG CGCGGGGGCG CACGCTGCAT GAGCTGTCCA 
CTGGAACGCG ATGGTATTTA A

Protein sequence

MEKHFVGSEI GQLRSVMLHR PNLSLKRLTP SNCQELLFDD VLSVERAGEE HDIFANTLRQ 
QGIEVLLLTD LLTQTLDVAD AKAWLLDTQI SDYRLGPTFA ADIRAWLADM PHRELARHLS 
GGLTYGEIPA SIKNMVVDTH DINDFIMKPL PNHLFTRDTS CWIYNGVSIN PMAKPARQRE 
TNNLRAIYRW HPQFAGGDFI KYFGNEDINY DHATLEGGDV LVIGRGAVLI GMSERTTPQG 
VEFLAQALFK HRQAERVIAV ELPKHRSCMH LDTVMTHIDI DTFSVYPEVV RPDVQCWTLT 
PDGRGGLKRT QESTLVHALE TALGIDQVRL ITTGGDAFEA EREQWNDANN VLTLRPGVVV 
GYERNIWTNE KYDKAGITVL PIPGDELGRG RGGARCMSCP LERDGI