Gene Pars_2113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2113
Symbol
ID	5054951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1888723
End bp	1889667
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	57%
IMG OID	640469665
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001154311
Protein GI	145592309
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.661925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATTG TAGTGACGGG CGGAGCCGGC TTTATAGGTA GCCACATCGT GGATAGACTC 
GTCGAGGAGG GCCACGAGGT GGTGGTTGTT GACAACTTAT CCAGCGGCAG GAGGGAGTTT 
GTGAACAAGT CTGCCGAGTT CCACGTAAGG GATCTAAAGG AAAGGGAGTG GGGTGTGGGA 
ATCAGGGGGG ATGTCGTCTT CCACTTTGCG GCGAATCCGG AGGTTAGGAT CTCCACTACG 
GAGCCCTCCG TCCACTTTAA CGAAAACGTG TTGGCAACGT TCAACGTCTT AGAGTGGGCG 
AGGCAGACGG GGGTGAGGAC CGTGGTGTTT GCCTCCTCTT CCACGGTATA CGGCGACGCC 
CAAGTTCTGC CCACCCCAGA GGAGGAGCCG CTTAGGCCTA TCTCGGTATA CGGCGCTGCA 
AAGGCGGCAG GCGAGATAAT GTGCGGAACC TACGCCCGGC TCTACGGCAT TCGCTGTCTG 
GCAATCCGCT ACGCCAATAT TGTTGGGCCG AGGCTGAGGC ACGGCGTCAT ATACGACTTC 
ATTATGAAGC TGAAGAAGAA CCCAAACGTC CTCGAAGTTC TCGGAGACGG GACACAGAGG 
AAGAGCTACC TCTATATAAA AGATGCCGTG GACGCCACGC TCCTTGCGTG GAGGAAATTC 
GAGGAGTTGG GCGAGCCGTT CTTGGCGCTG AACGTCGGAA ATGTTGACGC CGTTAGAGTG 
CTAGACATCG CCCAAATAGT GGCCGAAGTC CTCGGCCTCA AGCCTGAAAT AAAGCTAATC 
CCTACAACTC CAGATGGGAG GGGGTGGCCT GGGGATGTGA AGTACATGAC CCTCTCTATC 
AACAAGCTCT TAAAACTCAC TGGCTGGAAG CCGGCGATGA CAAGCGCCGA GGCGGTGCGA 
AAGACCGCCG AGGAACTCGC CGGGGAGCTA TGGCGGACAC CGTAG

Protein sequence

MRIVVTGGAG FIGSHIVDRL VEEGHEVVVV DNLSSGRREF VNKSAEFHVR DLKEREWGVG 
IRGDVVFHFA ANPEVRISTT EPSVHFNENV LATFNVLEWA RQTGVRTVVF ASSSTVYGDA 
QVLPTPEEEP LRPISVYGAA KAAGEIMCGT YARLYGIRCL AIRYANIVGP RLRHGVIYDF 
IMKLKKNPNV LEVLGDGTQR KSYLYIKDAV DATLLAWRKF EELGEPFLAL NVGNVDAVRV 
LDIAQIVAEV LGLKPEIKLI PTTPDGRGWP GDVKYMTLSI NKLLKLTGWK PAMTSAEAVR 
KTAEELAGEL WRTP