Gene Pars_2372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2372
Symbol
ID	5055325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	2119922
End bp	2120962
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	54%
IMG OID	640469923
Product	electron transfer flavoprotein, alpha subunit
Protein accession	YP_001154567
Protein GI	145592565
COG category	[C] Energy production and conversion
COG ID	[COG2025] Electron transfer flavoprotein, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTGCA GACTCTGGCC TCCAATAAAT AAAGAGGATT ATAGAGGAGT TTGGGTATAC 
CTAGAAAGGG AGGGAGAGAG GCTGAAGGAT GTGGGCCTTG AGCTGTTGGG CAAGGCCAGG 
GACCTGGCCC AAAAATTGGG CGGCGTTGAG GTGGCTGGGG TGCTCGTTGC CGGTGGCGAG 
GAATTGGCAC GTGAGGCAAT ATACCACGGC GCGGACAAGG TAGTAATAAT AGATAACCCG 
GATCTCAAGA TCTATACTCC TGCGGAGTAC GCCGAGGCCA TAGCTAGAGT AGTCCAGAAA 
TATAGGCCTG AAATATTCCT AATAGGGGCT ACTAAGCGTG GCAGAGAGCT CGCTGCGTAT 
ATTGCAAACA CGCTGGCCAC GGGCATTACG GCTGACTGCA CGGCCCTGGA AATCGACCCG 
AAAACCCGCG ACTTGTTGCA GATACGCCCA ACATTCGGGG GGACCCAACT GGCTACAATA 
AGAACCCCGC AGAGGCGTCC CCAAATGGCG AGTGTGAGAC CAGGCGTCTT CCCCAAGCCG 
CCAAGAGATC CGAGCAGGAC CGGCGAAATC ATAGTAGAGA AGGTAGAAGT CGCGAAGAGG 
AGGACGCGCC TAGTATCTAT AGAGAAGCGT CTGGAGAAAG ACGTAGCAGA TCTGCCACCA 
GTAGAGTCCT CAGACGTAGT TGTGGCGGGG GGCAGGGGGC TTGGCACCGC TGAGGGGTTT 
AAGCTACTGA TAGAATTAGC TAAGTTGCTA AACGGAACAG TGGGCGCCTC GCTCATGGCA 
GTACGTGCCG GCTGGGCCCC CCACACGCGG CAAATAGGCC AGACAGGCAA GACAATTAGG 
CCTAAGCTTT ACATCGCAGT GGGGATAAGC GGCGCCATAC AACACCTGAT GGGGATAACA 
GAGGCGAAGA TGATAATTGC CATAAACCCT GATCCCCACG CCCCGATTAT GGAAAACGCA 
GACTACGCCG TCGTGGGCGA CTACAAGCAG ATTATTCCCC TGCTCATCGA GGAATTAAAG 
AGGCTTAAGA ATCAGTCGTA A

Protein sequence

MPCRLWPPIN KEDYRGVWVY LEREGERLKD VGLELLGKAR DLAQKLGGVE VAGVLVAGGE 
ELAREAIYHG ADKVVIIDNP DLKIYTPAEY AEAIARVVQK YRPEIFLIGA TKRGRELAAY 
IANTLATGIT ADCTALEIDP KTRDLLQIRP TFGGTQLATI RTPQRRPQMA SVRPGVFPKP 
PRDPSRTGEI IVEKVEVAKR RTRLVSIEKR LEKDVADLPP VESSDVVVAG GRGLGTAEGF 
KLLIELAKLL NGTVGASLMA VRAGWAPHTR QIGQTGKTIR PKLYIAVGIS GAIQHLMGIT 
EAKMIIAINP DPHAPIMENA DYAVVGDYKQ IIPLLIEELK RLKNQS