Gene CPF_0161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0161
Symbol	arcA
ID	4202802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	191622
End bp	192863
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	31%
IMG OID	638081042
Product	arginine deiminase
Protein accession	YP_694625
Protein GI	110800897
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGATG ACAGAGCATT AAATGTTACT TCTGAAATAG GAAGATTAAA AACAGTTCTA 
TTACATAGAC CTGGAGAAGA AATTGAAAAC TTAACACCAG ATCTATTAGA TAGACTACTA 
TTTGATGACA TTCCATACTT AAAAGTTGCA AGAGAAGAAC ATGACGCTTT TGCACAAACT 
TTAAGAGAAG CAGGAGTAGA AGTGCTTTAT TTAGAAGTTC TTGCTGCTGA GGCAATAGAA 
ACTAGTGATG AGGTTAAACA ACAATTTATA AGTGAATTTA TTGATGAGGC TGGAGTTGAA 
AGCGAAAGAT TAAAAGAAGC ATTAATAGAA TACTTCAACT CATTTAGTGA TAATAAAGCA 
ATGGTTGATA AGATGATGGC TGGGGTAAGA AAGGAAGAGC TTAAAGATTA CCACAGAGAA 
TCATTATATG ACCAAGTAAA TAATGTATAT CCATTTGTAT GTGATCCAAT GCCAAATCTT 
TATTTTACAA GAGATCCATT TGCAACAATT GGACATGGTA TTACATTAAA CCACATGAGA 
ACAGATACAA GAAATAGAGA AACAATATTT GCTAAATACA TATTTAGACA TCATCCAAGA 
TTTGAAGGAA AGGATATTCC ATTCTGGTTT AATAGAAATG ATAAAACTTC TCTTGAAGGT 
GGAGATGAAT TAATACTTTC AAAAGAAATT TTAGCAGTTG GTATATCACA AAGAACTGAT 
TCAGCATCAG TTGAAAAATT AGCGAAAAAG TTACTTTACT ATCCAGATAC AAGTTTTAAA 
ACTGTATTAG CATTTAAAAT ACCAGTATCA AGAGCATTTA TGCATTTAGA TACAGTATTT 
ACTCAAGTAG ATTATGATAA ATTTACAGTT CACCCTGGTA TAGTAGGACC TTTAGAAGTT 
TATGCATTAA CTAAAGATCC AGAAAATGAT GGACAACTAC TTGTAACAGA AGAAGTTGAT 
ACTTTAGAAA ATATATTAAA GAAATATCTA GATAGAGATA TTAAATTAAT AAAATGTGGT 
GGCGGAGATG AAATAATAGC TGCTAGAGAA CAATGGAATG ATGGTTCAAA TACACTTGCT 
ATTGCTCCTG GAGAAGTTGT AGTTTACTCA AGAAACTATG TAACTAATGA AATATTAGAA 
AAAGAAGGAA TCAAATTACA CGTTATACCT TCATCTGAAT TATCAAGAGG TAGAGGGGGC 
CCTAGATGTA TGTCAATGCC TCTAATAAGA GAAGATTTAT AA

Protein sequence

MRDDRALNVT SEIGRLKTVL LHRPGEEIEN LTPDLLDRLL FDDIPYLKVA REEHDAFAQT 
LREAGVEVLY LEVLAAEAIE TSDEVKQQFI SEFIDEAGVE SERLKEALIE YFNSFSDNKA 
MVDKMMAGVR KEELKDYHRE SLYDQVNNVY PFVCDPMPNL YFTRDPFATI GHGITLNHMR 
TDTRNRETIF AKYIFRHHPR FEGKDIPFWF NRNDKTSLEG GDELILSKEI LAVGISQRTD 
SASVEKLAKK LLYYPDTSFK TVLAFKIPVS RAFMHLDTVF TQVDYDKFTV HPGIVGPLEV 
YALTKDPEND GQLLVTEEVD TLENILKKYL DRDIKLIKCG GGDEIIAARE QWNDGSNTLA 
IAPGEVVVYS RNYVTNEILE KEGIKLHVIP SSELSRGRGG PRCMSMPLIR EDL