Gene Pars_2369 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2369
Symbol
ID	5056245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	2117561
End bp	2118835
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	50%
IMG OID	640469920
Product	FAD dependent oxidoreductase
Protein accession	YP_001154564
Protein GI	145592562
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATACG ACGTCGTAGT AGTCGGAGCT GGCCCGGCGG GCCTCGCGGC GGCGTACAAG 
CTTGCCTCTG CTGGTTTTAA AGTACTTGTC CTGGAAAGAG GTAGAGAGCC AGGCGCTAAG 
GAGTTGTACG GCGGACGTAT TTATGCTTAC TGGCTTGATA GATTTCTCCC TGAATTTCGT 
AAAGATGCTC CGGTCGATAG GTGGGTTAGG AAAGAAAGAG TGACTTTGCT GACAGAGAAC 
AAGGCTCTGA CTGTGGAGTC GGCGGTATTA GAGAAGGAGA GGTCTAGCTT CGTGGTGCCG 
TTGGTTTCTT TTGTTTCGTG GATGGCAAAG CTTGCACAAA ACGCAGGTGC GAAGATAGTG 
ACTGAGATCA CCGTTGATGC GTTGGTGAGA GATGAAAAAG GCAGATTTGT GGGCATCCAG 
TCTGGTTCTG ACATGGTGCA AGCCGACTTT ATAATAGACG CAGAGGGAGT TAACCGCTTG 
CTTCTAGAAA GGGCTGGTAT TGTGAAAAAA CTAGAGCCTC ACTACGTCGC CGTGGGAGTT 
AAGGAGGTGT TGAAATTTGA AAACAAGAAG GTGCTGGAAG AGAGGCTCGG CCTAGACGAA 
GACGAGGGGC TTGCGTGGGC TATTGCCGGC TATCCCACAG AATATCTGCC GGGCGGCGGC 
TTCATATATA CGTACAAGGA CTCTCTCGCA CTTGGAGTTG TTGTTTATTT GAAGAACTGG 
GAGAAGTTGA AGACTCCGGT ATACGATCTC GTGGAAAAAC TCCGCCTACA CCCCTACATA 
GCGTCTCTCG TCAAGGGGGC TACATTACAA GAGTACGGGG GGCACATGAC ACCTGTGGCG 
GGCATCAACA TGGCGCCGCC GAGGTTTTAC TATGATGGCC TACTGATAGC AGGAGACGCC 
GCAGGCTTCC TCCTCCATAC AGGTGTCCTT ATAAGAGGTG TCGACTTTGC CATAGCTTCG 
GGAGTATTGG CCGCGGAGGC TATAAAAGAG ACAAATAGCC CCTCTGCCGA GGATCTCTCT 
GTATACGAGA AAAAGCTTAG AACAAGCTTT ATACTGCCTC AGCTTGAAAA GTTTAGAAGC 
GCCGACAAGC TACTGGGCGA CGAGGCTCTC TTTAAGGACC TGGCTGTATT TTCCACGGAG 
GCGGCGTATA GGTACTTCAA CATTGATGAC AAGCACAGAA CGCTACTAGA GGCGGTACGC 
GAGGCGTCGA AGAAGACCGG AATAAGTACA CTAAAGATAA TGATAAATAT GCTAAGAGCG 
GTGAGGAGTC TATGA

Protein sequence

MKYDVVVVGA GPAGLAAAYK LASAGFKVLV LERGREPGAK ELYGGRIYAY WLDRFLPEFR 
KDAPVDRWVR KERVTLLTEN KALTVESAVL EKERSSFVVP LVSFVSWMAK LAQNAGAKIV 
TEITVDALVR DEKGRFVGIQ SGSDMVQADF IIDAEGVNRL LLERAGIVKK LEPHYVAVGV 
KEVLKFENKK VLEERLGLDE DEGLAWAIAG YPTEYLPGGG FIYTYKDSLA LGVVVYLKNW 
EKLKTPVYDL VEKLRLHPYI ASLVKGATLQ EYGGHMTPVA GINMAPPRFY YDGLLIAGDA 
AGFLLHTGVL IRGVDFAIAS GVLAAEAIKE TNSPSAEDLS VYEKKLRTSF ILPQLEKFRS 
ADKLLGDEAL FKDLAVFSTE AAYRYFNIDD KHRTLLEAVR EASKKTGIST LKIMINMLRA 
VRSL