Gene Pars_0485 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0485
Symbol
ID	5055606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	430226
End bp	431374
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	57%
IMG OID	640468049
Product	hypothetical protein
Protein accession	YP_001152734
Protein GI	145590732
COG category	[C] Energy production and conversion
COG ID	[COG1139] Uncharacterized conserved protein containing a ferredoxin-like domain
TIGRFAM ID	[TIGR00273] iron-sulfur cluster-binding protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.964373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTGGG AAGAAGCAGT AGAGAGAGCG AGGTTGCATA TTATACCAAG GACGTACGAC 
GTTCTTTCGC GCTTTGGCTA TATCACGAGT TTGGCTAAAG AGGTGAGGAA AGTAAAAGAA 
GAGGTTATTA GAAACCTTGA TAATTACATA GAAGAGACCA GAAAGGCTGT AGAGAGGATA 
GGGGGCAGGT TTATCTTGGC GTCAACCGCC ACAGAGGCAG TAGAGTCGGC GGTTAAAATT 
GTGGGGCAAG GCAAGGTGGT TGTCATGAGT AAAAACAACG TGGCGACAGA GACAGGTCTG 
CGCCAAGGTC TAGAAAGGGC TGGAAACGAA GTGTGGGAGA CGGATTTGGG GGAGTTCCTG 
GTACAATTAG CTAATGACGA GCCTAGCCAC ATATTAGCAC CGGCTGTCCA CATGACTAAG 
GAGAGGGCTG CAGAGGTCTT GGCAAAGAGG CTAGGAATGG CGGTGCCGCC TGAGCCCGAG 
GCCATTGCGC AGAGGGCGAG GGAGTTTCTC CGCAACAAGT TCATAAAGGC AGACGTCGGG 
ATCACGGGGG CCAACGCCAT CGCCGCAGAT ACGGGGGCTG TGGTGCTGGT GGAGAACGAG 
GGCAACATAA GGCTGACGTC TGGCCTCCCC CCAGTGCACA TAGTCTACGA CGGCGTGGAG 
AAAATCGTGC CGACACTGGT AGACGCCATG GCCGCGGCGG CGGTGCAGTC CGCCTACGCC 
GGCCTCTACC CCCCCACCTA TATAAACATC TCCGCCGGCC CCAGCTCCAC GGCAGACGTG 
GAGATGCACA GAGTTTCACC CGCCCAAGGG CCAAAGGAGT TTTACATGAT CTTGGTAGAC 
AACGGCCGCA GAGCCGTTGC GAGGGATCCG GTGTTGTGGG AGGCACTCCT CTGCATACGG 
TGCGGCCGTT GCCACCTCCA CTGCCCAGTC TACCGCGCCT TGGGGAGGGA GTTCGGCGTG 
CCGCCCTACA CCGGCCCCAT GGGCGTGATG TGGACCGCCG TGACGAGAGG CATAGAGGAG 
GCCGGCCCCC ATGCGCTCAA GTGCGTCCAC GCGGGCAACT GCAAAGAGGT ATGCCCAATG 
GGCATAGACA TCCCCGGGGT GATACACGAG GTGAAGAAAA GGTACCTATC TCCAACTGGG 
TCCAAGTAA

Protein sequence

MSWEEAVERA RLHIIPRTYD VLSRFGYITS LAKEVRKVKE EVIRNLDNYI EETRKAVERI 
GGRFILASTA TEAVESAVKI VGQGKVVVMS KNNVATETGL RQGLERAGNE VWETDLGEFL 
VQLANDEPSH ILAPAVHMTK ERAAEVLAKR LGMAVPPEPE AIAQRAREFL RNKFIKADVG 
ITGANAIAAD TGAVVLVENE GNIRLTSGLP PVHIVYDGVE KIVPTLVDAM AAAAVQSAYA 
GLYPPTYINI SAGPSSTADV EMHRVSPAQG PKEFYMILVD NGRRAVARDP VLWEALLCIR 
CGRCHLHCPV YRALGREFGV PPYTGPMGVM WTAVTRGIEE AGPHALKCVH AGNCKEVCPM 
GIDIPGVIHE VKKRYLSPTG SK