Gene Dtox_0572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0572
Symbol
ID	8427507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	592107
End bp	593477
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	48%
IMG OID	645032937
Product	argininosuccinate lyase
Protein accession	YP_003190115
Protein GI	258513893
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGC TTTGGGGTGG TCGTTTTGAA AAAGAATCGG ATCACTTAAT GGAGGATTTT 
CATTCCTCCA TTTCTTTTGA TCAGAGATTG TATAAACAGG ATATTGCCGG CAGTATGGCC 
CACGCCAGGA TGCTGGGCAA AGCAGGCATT ATCTCTAAAG CAGAAGCGGA GCGGATAGTA 
GCAGGTTTAC AGGAAATACT GGCGGATATC GAAGCGGGTA AAATAGAGTT TTCCGTTGCC 
GCGGAAGATA TTCATATGAA TATCGAAGAA CTGTTAACTC AAAGAACCGG AGAAGTTGGC 
AAAAAACTGC ATACCGCTCG CAGCCGCAAT GACCAGGTGG CGCTGGACGT ACGCATGTAT 
TTAAAAGAAG AGATAACAGA GGTCATGAAT CTTATAAAAT ATCTGCAGGA TACACTGGCG 
GAGCTGGCCG AAGAACATCT GGATACGGTA CTGCCCGGCT ATACTCATTT ACAGAGGGCA 
CAACCGGTAA CCCTGGCACA TCACCTGATG GCTTATTATC AGATGTTTAG CCGTGATCTG 
GACAGGCTTG GCGACTGTTA CCGCCGCACT GATGTAATGC CTTTGGGTTC CGGGGCTCTG 
GCCGGCACCA CGTTTGCCCT GGACCGGCAG TATGTGGCCG AACAGCTTGG GTTTGCCCGT 
ATCAGTGAAA ACAGCCTGGA TGCCGTGGCG GATCGTGATT TTGCCGTAGA GTTTGCTTCG 
GCCGCCTCTT TGATTATGAT GCACCTGAGC CGGTTTTGTG AAGAAATAAT TCTCTGGTCT 
ACAGCGGAAT TTGCGTTCAT TGAATTGGAT GATGCTTACA GTACCGGCAG CAGCATGATG 
CCTCAAAAGA AAAACCCGGA TGTGGCGGAA TTAATTCGTG GCAAAACAGG TAGAGTTTAC 
GGCGATTTGC AGGCTCTTTT GACTATGCTG AAGGGCTTGC CGCTGGCCTA TAACAAAGAT 
ATGCAGGAGG ATAAGGAAGC GCTGTTTGAT GCCGTTGATA CAGTAAAGAA ATGCTTAATG 
TTGTTCCGGC CCATGCTGGC CACTGTAAAG GTGAAGAAAG AAAATATGGC AAGAGCCGCC 
CGTGGTGGCT TTACCAACGC CACTGATTTA GCCGACTATT TGGTCTATAA GGGGGTACCT 
TTCCGCCAGG CTCATGAAAT AGCCGGAAGA CTTGTTTTGT ACTGTTTGGC CAAGAAAAAG 
ACACTGGAGG AAGTTAGCCT CGGGGAATAC AGGGAATTTT CCGATTTGAT AGCCGAGGAT 
ATTTACCAGG CTATTGATAT AAATCATTGT GTGGAAGCCA GAAAGGTTTA TGGCGGGCCG 
GCCAGGGCTG TTGTGCAGGA GGCTATAAAC AGAGCAAGGG GAAAGTTTTA A

Protein sequence

MAKLWGGRFE KESDHLMEDF HSSISFDQRL YKQDIAGSMA HARMLGKAGI ISKAEAERIV 
AGLQEILADI EAGKIEFSVA AEDIHMNIEE LLTQRTGEVG KKLHTARSRN DQVALDVRMY 
LKEEITEVMN LIKYLQDTLA ELAEEHLDTV LPGYTHLQRA QPVTLAHHLM AYYQMFSRDL 
DRLGDCYRRT DVMPLGSGAL AGTTFALDRQ YVAEQLGFAR ISENSLDAVA DRDFAVEFAS 
AASLIMMHLS RFCEEIILWS TAEFAFIELD DAYSTGSSMM PQKKNPDVAE LIRGKTGRVY 
GDLQALLTML KGLPLAYNKD MQEDKEALFD AVDTVKKCLM LFRPMLATVK VKKENMARAA 
RGGFTNATDL ADYLVYKGVP FRQAHEIAGR LVLYCLAKKK TLEEVSLGEY REFSDLIAED 
IYQAIDINHC VEARKVYGGP ARAVVQEAIN RARGKF