Gene Pars_2277 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2277
Symbol
ID	5055214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	2038038
End bp	2039039
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	59%
IMG OID	640469829
Product	thiamine pyrophosphate binding domain-containing protein
Protein accession	YP_001154473
Protein GI	145592471
COG category	[C] Energy production and conversion
COG ID	[COG1013] Pyruvate:ferredoxin oxidoreductase and related 2-oxoacid:ferredoxin oxidoreductases, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00284034
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.307973
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTGG CGGAGGAGTA CCCCGGCTTG TACGAATACG CCAACTTCGA GCTACCGCAG 
GAGGAGCTAT TTTTGCCAGG CCATGGCCTA TGCGCTAGCT GTACAATAGG AGTAATCGCT 
AGGCATATGT TAAAGGTGCT GGGGCCTGAC ACCATTGTCG TAAACCCCAC GGGGTGCGCC 
GAAGTGTCCA CAGTGGTCTA CCCCCGCACC AACTGGGCGG TGCCTTGGAT TCATGTCGCC 
TTCGGCAACG GCGGCTCTGT AGCCTCCGGC ATAGAGGCGG CGATTAAGGT CTTGAAGAGA 
AGGGGGGTGA TAGATCCCAA CAGGAAAATA AACATAGTGG TATTCGCAGG CGACGGCGGC 
ACCGCCGACA TCGGCTTCCA AGCCCTCAGC GGCATGTTAG AGAGGGGCCA CAAGGTGATA 
TACGTAATGT ACGATAACGA AGGCTACATG AATACGGGGA TTCAGCGCTC AGGTACGACC 
CCCTTTGGCG CCTCCACCAC CACGGCCCCT GCGGGCAAGA AGGTGCCGGG AAACGTGACG 
CACAAGAAGC CGATGGTGGC AATCGCGGCC GCCCACGGCA TCCCCTACGC CGCCACGGCT 
AACCCTGCCT ATGTCCACGA TATGGTGTAC AAGTTCAAGA AGGCGGCGGA GGCAGACGGA 
CCCGCCTTCC TCCACATCCT CCAGTCGTGT ACCCCGGGCT GGCGCTTCGA GCCGAAGTAC 
GCAATTAGGG TGCTGGAGCT GGCCACCGAG ACGGGCTACT GGGTCAACTA TGAGATCGAC 
CACGGCGAGT TCAGAGTCAC CGTTCCTGTT CCCAAGAGAA AGCCGGTGAA GTGCTTCCTT 
CAGCTTCAGG GGAGGTTTAG GCATCTGAAG CCGGAGGAGA TAGACACCAT CCAGGCGCTG 
ATTGACAAAG ACGTAGCGGA GATTAACCGG ATTGTGGGCA GGGAGGTGAT TGGGCCGGTG 
GACCCCGGCC TAGAGTGCCT AACGCCTAGG GGGGCCCGGT AA

Protein sequence

MKVAEEYPGL YEYANFELPQ EELFLPGHGL CASCTIGVIA RHMLKVLGPD TIVVNPTGCA 
EVSTVVYPRT NWAVPWIHVA FGNGGSVASG IEAAIKVLKR RGVIDPNRKI NIVVFAGDGG 
TADIGFQALS GMLERGHKVI YVMYDNEGYM NTGIQRSGTT PFGASTTTAP AGKKVPGNVT 
HKKPMVAIAA AHGIPYAATA NPAYVHDMVY KFKKAAEADG PAFLHILQSC TPGWRFEPKY 
AIRVLELATE TGYWVNYEID HGEFRVTVPV PKRKPVKCFL QLQGRFRHLK PEEIDTIQAL 
IDKDVAEINR IVGREVIGPV DPGLECLTPR GAR