Gene CPF_0682 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0682
Symbol	argH
ID	4201776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	812918
End bp	814318
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	28%
IMG OID	638081567
Product	argininosuccinate lyase
Protein accession	YP_695134
Protein GI	110798800
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAT GGGGCGGAAG ATTCACTCAC CAAGTTGATG ATCTAGTTAA CACTTTTAAT 
TCCTCTATTT CTTTTGATTC AAGAATGTAT AAAGAAGATA TAATTGGAAG TATAGCTCAT 
GTTACTATGC TTGGTGAAGA AAAAATTATT CCAAAGGAAG ATAGCAAAAA AATTGCTTCT 
GGTTTATATG AAATATTAAA TAAATTAAAT CAAGGAGTAT TAAAAATAGA TAACTCTTCA 
GAAGATATAC ACAGTTTTAT AGAAAGTACT CTTACAGATT ACATTGGTGA AGAAGGAAAA 
AAACTACATA CTGGTAGAAG TAGAAATGAT CAAGTAACCT TAGACACAAA ATTATATTTA 
AAAGGATATA TTAAAATTTT AATATGTGAA ATTTTAAACC TTGAAAAAAC TCTATTAAAT 
CTTTCTTCAG AAAATAAAGA AACTATTATG CCAGGATATA CCCATATGCA AAAGGCTCAA 
CCTATTACAT TTGCTCATCA TATTTTAGCA TATAGTGAAA TGTTTAAAAG AGATATATCT 
AGATTACTAG ATTGTTATAA AAGACTTGAT GAAATGCCTT TAGGCAGTGG TGCTTTAGCA 
ACTACTACTT ACCCTATAAA TCGTGAAAAA GTTGCAAATC TACTAGGCTT TTCAAAAGTT 
ACACTAAATA GTTTAGATTC TGTTTCTGAT AGGGATTATG CTATTGAAAC ACTTTCTTGC 
CTCTCTTTAC TTATGATGCA TCTTTCTAGA TTTTCAGAGG AAATAATCAT CTGGTCTACT 
GATGAATTTA AATTTATTGA ATTAGATGAT AGTTATAGTA CTGGAAGCAG TATTATGCCA 
CAAAAAAAGA ATCCTGATGT TGCAGAATTA GTAAGAGGAA AAACAGGACG TGTTTATGGA 
GATTTAATGA CGCTATTAAC TGTTATGAAG GGACTTCCTT TAGCTTATAA TAAGGATATG 
CAAGAAGACA AAGAAGCTTT ATTTGATGGG TTAGATACTA CTCTACTTTC TATAAAAACT 
TTTAATGGAA TGATAAAAAC AATGAAAATT AATAAGAGTA TTATGAAAAC TTCAGCTTCT 
TCTGGATTTA CTAACGCCAC TGACGTCGCT GATTATCTAG TAAAAAAAGG GGTAGCTTTT 
AGAGATGCTC ATGAGATTGT AGGAAATTTA ATTCTTTATT GTATAGATGA AGGGAAATCT 
ATTGATAACT TATCTTTATC TGAATTTAAA ACTTTCTCAA ATAAGTTTGA AAATGATATA 
TATAAAGCTA TTAATCTTTT AACTTGTATA GAAGAAAGAA AAGTAATAGG TGGACCAAGT 
ATTTCATCTA TAAACATTCA AATTGAACAT TTAAATAATT TTATACAAGA AAGTAATGAA 
AAACTTAATC TTCTAAAATA G

Protein sequence

MKLWGGRFTH QVDDLVNTFN SSISFDSRMY KEDIIGSIAH VTMLGEEKII PKEDSKKIAS 
GLYEILNKLN QGVLKIDNSS EDIHSFIEST LTDYIGEEGK KLHTGRSRND QVTLDTKLYL 
KGYIKILICE ILNLEKTLLN LSSENKETIM PGYTHMQKAQ PITFAHHILA YSEMFKRDIS 
RLLDCYKRLD EMPLGSGALA TTTYPINREK VANLLGFSKV TLNSLDSVSD RDYAIETLSC 
LSLLMMHLSR FSEEIIIWST DEFKFIELDD SYSTGSSIMP QKKNPDVAEL VRGKTGRVYG 
DLMTLLTVMK GLPLAYNKDM QEDKEALFDG LDTTLLSIKT FNGMIKTMKI NKSIMKTSAS 
SGFTNATDVA DYLVKKGVAF RDAHEIVGNL ILYCIDEGKS IDNLSLSEFK TFSNKFENDI 
YKAINLLTCI EERKVIGGPS ISSINIQIEH LNNFIQESNE KLNLLK