Gene Pars_1709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1709
Symbol
ID	5054565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1543075
End bp	1544424
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	56%
IMG OID	640469252
Product	UDP-glucose/GDP-mannose dehydrogenase
Protein accession	YP_001153912
Protein GI	145591910
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0677] UDP-N-acetyl-D-mannosaminuronate dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.676622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0907516
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGTCG AGCTTCTCAA GCGTGGTGAG CTCACAGTCG CGGTCTACGG CCTCGGCTAT 
GTCGGGATGG CCCTATCCGC CGCCTGGACG CTGGCTGGGG CTAGGGTCAT AGGCGTCGAC 
GTAGATGCGG TAAAAGTAGA GAAGCTGAAC AACGGTGTGG TGGAGTACCC AGAGAGAGAT 
GTCGTGGAGG TACTTCTACC AGCAGTGAAA AACGGGAGGT TTACTGCAAC TACTGACGGC 
GTCGTGGCGT CAATAAGAAG CCAAGCGAAG ATCGTGGCAG TTCCTGTCTT CCTCAAGAAG 
TCGGCTACCT CAGTGGAGGT GGACTTCTCT GCCCTCATCT CCGCCTCAAA GGCCATAGGG 
GCTGGCCTTA AAAAAGGCGA CTTAGTGATA ATAGAATCCA GCGTGCCGCC CGGCACCACA 
GAGGAGGTCG TTAAGCCTGT GCTAGAAAAC ACCTCCGGCC TTGAGGCGGA GGAGGACTTC 
TTCCTCGCCT ACAGCCCCGA ACGCATAATG GTAGGCCACG CCCTCAAGGA CATCGTGGAG 
AACTACCCCA AGGTAGTTGC CGGCGTCGGA CCGAAGAGCA CAGAAGAAGC CGCCGGGCTT 
TATAGACTAG TGTCCAAAAA AGGCGTAGTG GTGCTGAACA GCGCCAAGGA GGCTGAATTC 
GAAAAACTAC TAGAAGGCGT ATACAGAGAC GTCAACATAG CCCTAGCCAA CGAGATGGCG 
AAGCTGGCAA ACGCCCTAGG CATATCCTTC AGAAAGGCTA GGGAGGCCGC CAACAGCCAG 
CCCTACAGCC ACGTACACAA ACCAGGTTCA GGAGTCGGAG GCAACTGCAT CCCCGTATAC 
CCCTACTTCC TCATGTGGGT AGCGGCTAAA TACGGCGTAG ATCTCCCCCT TACGCGCGCA 
GCTAGGGCGA TAAACGAGAG GCAACCGTCA GAAGTGGCCT TCGCCGCGGT TAGGGCAATG 
CTCAAAAATA GAGTAAACCC AGCAACTGCC AAGATTGCGA TTCTAGGGCT GGCTTTTAGA 
GGCGACGTAG ACGACCCCCG CGAAAGCCCC ACATACGGCA TAATCTCCAC TCTACTAAAC 
ATCGGAATAA GGCCAGAGCA GATTGTGGTA CACGACCCCT ATATCAAGCA GGATCCCCAG 
CTGGCAAAGT GGGGCATCGC CATCTTCCAA GACCTAGAGG CGGCGGTGAA GGGGGCAGAC 
GCCGTCGTGG TGTCAACAGA CCACACAGTC TACAGGATAG AGGCAAGTAG AATAGCCAAG 
CTCATGAGAA CGCCTCTAAT TGTGGACGCC CGCGGGGTAC TTGTCCCAGA CGTCGAGATA 
TACTCAATCG ACGGAGGGCG CTGGCCTTAA

Protein sequence

MLVELLKRGE LTVAVYGLGY VGMALSAAWT LAGARVIGVD VDAVKVEKLN NGVVEYPERD 
VVEVLLPAVK NGRFTATTDG VVASIRSQAK IVAVPVFLKK SATSVEVDFS ALISASKAIG 
AGLKKGDLVI IESSVPPGTT EEVVKPVLEN TSGLEAEEDF FLAYSPERIM VGHALKDIVE 
NYPKVVAGVG PKSTEEAAGL YRLVSKKGVV VLNSAKEAEF EKLLEGVYRD VNIALANEMA 
KLANALGISF RKAREAANSQ PYSHVHKPGS GVGGNCIPVY PYFLMWVAAK YGVDLPLTRA 
ARAINERQPS EVAFAAVRAM LKNRVNPATA KIAILGLAFR GDVDDPRESP TYGIISTLLN 
IGIRPEQIVV HDPYIKQDPQ LAKWGIAIFQ DLEAAVKGAD AVVVSTDHTV YRIEASRIAK 
LMRTPLIVDA RGVLVPDVEI YSIDGGRWP