Gene Pars_1877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1877
Symbol
ID	5055729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1679996
End bp	1681219
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	51%
IMG OID	640469423
Product	nucleotidyl transferase
Protein accession	YP_001154080
Protein GI	145592078
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAAGAA TTGCCATCAT CCCTGTAGGG GGAGAGGCGG TTAGGCTCAG ACCCCTCACC 
GCGGAGACCT CGAAGGCTAT GGTCCGCTTC CTTAATCGGC CTTTGATAGA GCTTTCAATT 
TTGCACCTCG CCCGCCAGGG GGTTGAGGAG TTCTACTTCG GCGTGAAGGG GTATTACAAC 
TACCGTGACA TATACGATTA CTTCCGCGAG GGGAGGTGGT TTGCGGAGAA ATATGGCGTT 
GGTATAAGGG TCAGGTATAT GCCGAGAGTA GAAACGCGGG GGAATGCGGA GGCTGTTTAT 
GCCACCCTCA TGTATTATGA TATTAGGGAA CCCGTCTTGG TTATTCAGGG CGACAACGTT 
TTCCAGCTTG ATGTGAAAGA TATGTACGAG TTCCATAGAT CAAAGAAGGC ATTTATAACA 
ATCGCGCTTA AGGAGGAGAC AAGCGATCTG AGCGAATTCG GTGTGGCGGC GATTGGTGAG 
GATATGCGCA TTTTGAAGTT TGTCGAAAAA CCAAAAAGAA GAGAAGATGC GCTTAGTAAT 
TTAGTAAACA CCGGTATATA CCTCCTCTCT GAGGACTTCA AAGACTTCTT CAGCGGGGAG 
ATGGGAAGCA AGTTGTACTC CGAGGGGAGG CTGGACTTCG GCGGTGACGT CATACCTACT 
GTGATAGAGG CCGGCTTGCC TGTGTACGGT TATACAAGTA GGGGCTACTG GTTCGACGTG 
GGGACACCCG AGCGCTACCT CAAGGCAGTC CAGTTCCTTC TTAGACAACT AACGCCGGGG 
GAGCTAGAGG CGGAGGAGAT ACTGCCGTCG GTATACGCGC AGGGGGTTAG CGAACAGTCG 
AAGATATTAA AAGGCAAAAT CGCGGAGCGT ATTAAAAAAG GCGCGATTAA AGCAGAGGGC 
CACATCCTAC TGGGAAGACA CGTCCAACTC GGCGACAACG TCCACATACG CGACTCGGTT 
ATCGACAACT ACGTAGTAGT AGGTGACAAC AGCACGATAG AGGATTCGGT AGTGATGGAC 
CGGTCGCTGA TAGGGAGAAA TGTGACGATA AGACGGTCAA TAATCGGGCG CCACGTCTAC 
GTGAAAGACG GGTCTGTTAT AGAAGACTCA GTCGTAGCAG ACAACGTGGT GGTGGGCGAA 
GAGGCCTCTC TGAGAAGGGT AAAGGTGTGG CCGCACAAGA CGCTGGAAAA GGGAGTGAGA 
CTTGAGGGCT TTTCTCTGAT CTAA

Protein sequence

MVRIAIIPVG GEAVRLRPLT AETSKAMVRF LNRPLIELSI LHLARQGVEE FYFGVKGYYN 
YRDIYDYFRE GRWFAEKYGV GIRVRYMPRV ETRGNAEAVY ATLMYYDIRE PVLVIQGDNV 
FQLDVKDMYE FHRSKKAFIT IALKEETSDL SEFGVAAIGE DMRILKFVEK PKRREDALSN 
LVNTGIYLLS EDFKDFFSGE MGSKLYSEGR LDFGGDVIPT VIEAGLPVYG YTSRGYWFDV 
GTPERYLKAV QFLLRQLTPG ELEAEEILPS VYAQGVSEQS KILKGKIAER IKKGAIKAEG 
HILLGRHVQL GDNVHIRDSV IDNYVVVGDN STIEDSVVMD RSLIGRNVTI RRSIIGRHVY 
VKDGSVIEDS VVADNVVVGE EASLRRVKVW PHKTLEKGVR LEGFSLI