Gene Pars_0242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0242
Symbol
ID	5055703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	216130
End bp	217317
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	60%
IMG OID	640467821
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_001152509
Protein GI	145590507
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.225215
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCG AAGCAGCCTC TATGAAAAGG GTGGTGATAG TCGGTGGGGG CATCGCTGGC 
ATGACTGTGG CAAAGACGTT GCTAGAGGGC AAGATGCAGG CCGAGATAAC GGTGGTAAAC 
TCGGCGCCCC ACTACTTCGC GGGGCCCAGC AGGCCGCTCC TGCTGACGGG GGAGCAGTCA 
CTGGACCGCA TTGTGAGGAG TTATGAAGAG GTCGCTAGGA GAGGCGTCAA GGTGATGGTC 
GGCACAGTCT ACTCCGTGGA CCCGGCGAAT AGGAAGGTGC GGCTGGTCGG CGGCTACGCC 
TCGGACGGCG GCGTCAAGGA GCTTCAGTAC GACTACCTCG TATTGGCCCC GGGCGTGGTG 
CTAGACGGCT CTGGCATAAC GGGCTACGAC AAGTACAGGG GCAACGTGCT GAACGTCTAC 
GACCCCGGCA GGGTGCGCAC TTTGAAAGAG AGGGTGTGGA AAGCCGAGAA GGGCACCGTG 
GTCGTCTACG CCCCCAAGGC GCCGTACAGG TGCGCCCCAG CGCCTACCGA GACCGCCACC 
TTAATAGACG CCGTGCTTAG GCACAGGGGG GTAAGGGACA AGTTCAGGAT TATACACATA 
GACGCCAACG ACAAGACCCA GCCTCCAGTA ATCGCCGACG TGGTGGCCGA GCTGTACAGG 
AAGCTGGGCA TAGAGCTTGT CGTCAACCAG GAAATCGCGG AGATCGGGGA GAACTACGTC 
GTGACTAAGA GCGGCGAGAG GTACAACTAC GACATCTTGG CAATGCTGGA GCCCAACAGG 
GCGCCTAAGT TCATAGCCGA GGCCGGCTTG GGGGAGAACT GGATCAGCGT GCGCGGCCCC 
CAGGACCTCC GCCACCCCAA GTTCGACGAC GTACTCGCCG CAGGCGACGC CGCAAGTCTG 
CCGTTCCCCA AGAACCAAGA AATCGCCTTC GAGAGCGCCT TATTCGCCGC CAACAAAATA 
CTCGAGATGG AGGGGCTGAG CCACAGAGCC AGCGTCCAGT ACGCCTTCTT GGGCTGGGCC 
TATGTCGGCA ACCCTGAGGG GAGGCTGGAG ACTCTGTCCG TCATGTTCGG CCTAGACTTC 
ACCACACAGC CGCCTAAGCC GACCAAAGAC CCGCAGCCAA AGAGAGAGTA CACACAGCGA 
AAAGACAGCT GGGAGCAGAG CTACCTCGCC AACCTATTTG GGTACTAG

Protein sequence

MKFEAASMKR VVIVGGGIAG MTVAKTLLEG KMQAEITVVN SAPHYFAGPS RPLLLTGEQS 
LDRIVRSYEE VARRGVKVMV GTVYSVDPAN RKVRLVGGYA SDGGVKELQY DYLVLAPGVV 
LDGSGITGYD KYRGNVLNVY DPGRVRTLKE RVWKAEKGTV VVYAPKAPYR CAPAPTETAT 
LIDAVLRHRG VRDKFRIIHI DANDKTQPPV IADVVAELYR KLGIELVVNQ EIAEIGENYV 
VTKSGERYNY DILAMLEPNR APKFIAEAGL GENWISVRGP QDLRHPKFDD VLAAGDAASL 
PFPKNQEIAF ESALFAANKI LEMEGLSHRA SVQYAFLGWA YVGNPEGRLE TLSVMFGLDF 
TTQPPKPTKD PQPKREYTQR KDSWEQSYLA NLFGY