Gene Pars_1355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1355
Symbol
ID	5054061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1216748
End bp	1217824
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	56%
IMG OID	640468901
Product	geranylgeranyl reductase
Protein accession	YP_001153570
Protein GI	145591568
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR02032] geranylgeranyl reductase family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0520333
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTGACG TGATCATCGT CGGGGCCGGC CCAGCGGGAT CAACAGCCGC CCTTATAGCA 
GGGAGACTTG GGCTAAAAAC CCTAATCATA GATCGGTTAT CCCCGCCGAG GGAGAAGCCC 
TGCGGCGGCG GCCTCACCCC GCGTAGCTGG AAACTCCTAA ACGCACTAGG CGTTGAGTAC 
CCCGTCTACG GCATCTGCAA AGAGGTGGAG ACCAGAGCTG CGGGATATAG CTACGTGCTG 
AAAAAAGAAC CTATATACGT CACTAGGCGG CCCGATTTTG ACTACTCACT GCTTAAACAA 
AGCGGCGCCG AGTTTGTAAA AGACCAAGTC ATCTCGGTAA GACAGAACGA AGTAGTGGGC 
AGAGCCGGCG TGTACCAAGG AAGAATAATC ATCGGCGCAG ACGGCGCCAC TAGCACAGTG 
GCGAGGTCCA TAGGCATTGC CAACTACCGC CGGGAGAAGA CACACGCAAT TGCCTACATG 
ACAATTGCCA AGGGACCAAC AAGCGAGACT TGCGTCGTCG ACTTTGACGC CGTTATTGAC 
GCCACCGGAA ATGTGGGCTA CGCATGGATC TTCCCACTGG CAGAGGGCGC CAACATCGGC 
GCTGGGATAG GAGGAGGGAG GTGGGCAGAT CTGCGCCAGT TAGTAGAGGA ATACGCCGCC 
AAACACGGCT ATAAGCCAGG AAAAGTCATG GGCCACCCAC TCTCTCTTGG CTACGTGGCG 
GGGCTGGGAA GAGGAAATGT ACTCCTCGCA GGAGAAGCGG CAGGCCTAGT AGATGCCACC 
ACCGGAGAGG GCATATACTA CGCCGTTGCC AGCGGAGCCG CTGCCGCCAT CGCGGCATAC 
ACGGCACTTA GGATGTGGGG CAGGGAAAAG TACGCGTTGC CAATCTACCA CGAACTTGTA 
AAGCCGTATG TAGAAGAGGT CAAGAAGACG CGAACGCTCT ACCATTTGGC GAAAGCCATA 
GGCACAAAGA AATGGGCAGT CAAGCTTTTA GGCAGAAGGC TTGTTAGGCT CTACTCCGCG 
GTTTACACAG GTGAGGCAAC CTACAGCCTC TTACTAAAGC CAGTACAGAG GCTATAG

Protein sequence

MFDVIIVGAG PAGSTAALIA GRLGLKTLII DRLSPPREKP CGGGLTPRSW KLLNALGVEY 
PVYGICKEVE TRAAGYSYVL KKEPIYVTRR PDFDYSLLKQ SGAEFVKDQV ISVRQNEVVG 
RAGVYQGRII IGADGATSTV ARSIGIANYR REKTHAIAYM TIAKGPTSET CVVDFDAVID 
ATGNVGYAWI FPLAEGANIG AGIGGGRWAD LRQLVEEYAA KHGYKPGKVM GHPLSLGYVA 
GLGRGNVLLA GEAAGLVDAT TGEGIYYAVA SGAAAAIAAY TALRMWGREK YALPIYHELV 
KPYVEEVKKT RTLYHLAKAI GTKKWAVKLL GRRLVRLYSA VYTGEATYSL LLKPVQRL