Gene Pars_0929 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0929
Symbol
ID	5054268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	822955
End bp	824085
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	54%
IMG OID	640468485
Product	cytochrome c biogenesis protein, transmembrane region
Protein accession	YP_001153161
Protein GI	145591159
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0785] Cytochrome c biogenesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.505775
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGTTCT TGGCGATTTT GCTGGTGTTG TCTCTTCTCC TCTCTGCGGC ATATGTGGAG 
AAGGGGGCTC TTCAATTCAA GCTCGTGGAC TCGCCTTACG ATGTGGAGGG CAAGTTTTTC 
CTCTACATAT ACCAGCCTCT GTGCGAGGAG TGTAAGAAGT TAGAGGCTTT GTTCGGTAGG 
GAGGACGTTG CTGCGGCGTT GTCGGGGTAT AGGTTGTATG CTCTTGACTT GTCGAAATCG 
GGCGTTGCCG CAGTCGACGT CTATGTGGAG GGGCAGGTAG TATATGTAGA TCACGGAGTT 
GTTAAGTACT TCGCCGCCTC TGGGAGGAGG AGTTTTCTAA TTCCCGGAAC GCCCACAGTG 
TTGATCGGCA TTAAGGAGAA CGGCACGGTG AGACTTCTAG GTTTTTGGAC TGGGGCTGAT 
ATGCCGCCTG GCGAGGACTT GGGTGCGGCG TTTGTGCGTT TTCTAGGCGA GGTGTCGGAG 
TCCGGTAGTG CGGCTGAGTC GAGTTACCGC GTTGATGTAT TATGGGTGTT TCCGCTTGCG 
TTTATCATGG GCGCCGTAAG CGCTTTTTCG CCCTGCGTAT TGCCTGTTCT CGGCATAGCG 
GCGGTTACGC ACTTCGCGAG GAGGAGTCTG GGCAGAGTTC TAGCAGGCAT GGTGGTTTCT 
TACGCGGCTA TCGGCGCGTT AGTCGCGGCG TCGGGCGTGG CGGCGGCTTC CGTAAGGCCC 
TTGCTTGCGG CTATAGGCGG CGTCCTACTC GTGGCGCTGG GCGCAGTTCT CTTAGTAGAG 
AGACTTAATG TAAAATACGC CACTGCTATG TCTAGGATTC AGACCTCTGC TTATAAAAAG 
CTCTCCAAGG CTGGGGACTT CTTGGTAGGA GTGTCGCTCG GCGCCGTGTG GGTTCCATGT 
ATCCTCCCCT ATATGGGCTT TGCCACTGTG CTGGCCCTCA TATCGCTTGC AGGGGATTAT 
CTCTTGTTGC TAACGGCTCT GCTGATGTAC GGAGGGGGAC TTGCGTTGAT GGTATACGTA 
ATTGTTAGGG GACTTCTTAA ACGTGTGAAA CCAAAGAGGT GGTATGAGAA AGCCGTGGGT 
GTTTTATCGA TTCTAATCGG CTTTTACCTC GTGGCGTCGG TATGGATTTA G

Protein sequence

MRFLAILLVL SLLLSAAYVE KGALQFKLVD SPYDVEGKFF LYIYQPLCEE CKKLEALFGR 
EDVAAALSGY RLYALDLSKS GVAAVDVYVE GQVVYVDHGV VKYFAASGRR SFLIPGTPTV 
LIGIKENGTV RLLGFWTGAD MPPGEDLGAA FVRFLGEVSE SGSAAESSYR VDVLWVFPLA 
FIMGAVSAFS PCVLPVLGIA AVTHFARRSL GRVLAGMVVS YAAIGALVAA SGVAAASVRP 
LLAAIGGVLL VALGAVLLVE RLNVKYATAM SRIQTSAYKK LSKAGDFLVG VSLGAVWVPC 
ILPYMGFATV LALISLAGDY LLLLTALLMY GGGLALMVYV IVRGLLKRVK PKRWYEKAVG 
VLSILIGFYL VASVWI