Gene Dole_0059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0059
Symbol
ID	5692873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	65937
End bp	67118
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	64%
IMG OID	641262635
Product	arginine biosynthesis bifunctional protein ArgJ
Protein accession	YP_001527946
Protein GI	158520076
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1364] N-acetylglutamate synthase (N-acetylornithine aminotransferase)
TIGRFAM ID	[TIGR00120] glutamate N-acetyltransferase/amino-acid acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTGCC CCGGTTTTCA ATGGGCCGGT GTGTGCGCGG GCATCAAAAA CTTGAAGAAA 
AAAGACCTGG GCCTGCTGGT GTCTGACACG CCGGCCGCCG TGGCCGCGGT GTTTACCGCG 
AACAGGGTCA AGGCTGCGCC CGTGCTGCTG GACATGGAGC GGGTGGCATC GGGCCGGTGC 
CGGGCCATTG TGGCCAACAG CGGCAATGCC AACTGCTGCA CCGGGGATGC GGGGATGGCC 
GCCGCCCTTG CCATGACAAA GGCCGTGGCC GAGGCCCTGG GCATTGATGA GGCCCTGGTG 
CTGGTGGCCT CCACCGGCGT TATCGGGGCG CCCATGCCCA CGGAAACCAT CACCGGCGCC 
GTGCCCGGCC TGGTAAAGGC GTTACGTCCG GACGGGCTGC CCGACTTTTC CGAAAGCATT 
TTAACCACAG ACCGGTTTGC CAAAAGTGCC CTGCGAAACG TTCGCCTGGA AAACGGAACA 
ACCGTCACGG TCTGCGCCAC GGCCAAGGGA GCCGGCATGA TCCGGCCGGA CATGGCCACC 
ATGCTCTGCT TTGTCTGCAC CGACCTTCAG GCTGATACCG ACGCTCTTTC CGGCATGCTT 
TCCGTTGCTG TGGACCGCTC CTTTAACCGC ATCACCGTGG ACGGCGACAC CAGCACCAAC 
GACACGGTGT TTTTAATGGC CGGCGGCGCG TCCGGCGCGG GCCTGCAAAC GGATGCCGAC 
CGGCAGGGAT TTCAACAGGC CCTGGACGAC GTGCTGACCG AGCTGGCCCG AATGATGGTG 
ACGGACGGGG AGGGGGCCAC CAAGCTGGTG GAGGTGCGGG TGAAGGGGGC CAAGTCTGAC 
GCCGATGCCC GGCGCGTGGC CGACACCGTG GCCAATTCCA GCCTTGTGAA AACCGCTTTT 
TTCGGCCAGG ACGCCAACTG GGGCCGGATC ATGGCCGCCG CGGGCCGGGC CGGGGTGGAC 
CTGTCCCCGG ACGCGGTGGA TATCTTTTTT GATGATGTGC AAATGGTGAA AAACGGCATG 
GGATGCGGCC CCGAAGCCGA ACGCAAGGCG TCGGGGGTGC TCAAACAGCC GACCATCTGC 
CTGGGCATTG ACCTGAACAC CGGCGGCACC GGCGCGGCAA CGGTGCTGAC CTGTGACCTG 
TCTATTGAGT ATGTGAAGAT CAACGCCGAC TACCGGACAT GA

Protein sequence

MECPGFQWAG VCAGIKNLKK KDLGLLVSDT PAAVAAVFTA NRVKAAPVLL DMERVASGRC 
RAIVANSGNA NCCTGDAGMA AALAMTKAVA EALGIDEALV LVASTGVIGA PMPTETITGA 
VPGLVKALRP DGLPDFSESI LTTDRFAKSA LRNVRLENGT TVTVCATAKG AGMIRPDMAT 
MLCFVCTDLQ ADTDALSGML SVAVDRSFNR ITVDGDTSTN DTVFLMAGGA SGAGLQTDAD 
RQGFQQALDD VLTELARMMV TDGEGATKLV EVRVKGAKSD ADARRVADTV ANSSLVKTAF 
FGQDANWGRI MAAAGRAGVD LSPDAVDIFF DDVQMVKNGM GCGPEAERKA SGVLKQPTIC 
LGIDLNTGGT GAATVLTCDL SIEYVKINAD YRT