Gene Pars_1436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1436
Symbol
ID	5054195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1293927
End bp	1295357
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	57%
IMG OID	640468977
Product	radical SAM domain-containing protein
Protein accession	YP_001153646
Protein GI	145591644
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.37868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.00181566
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGGCGTACA GAAAGAACGC GGTGAAAATC GCCCTGTTAT ACCCCTCCAC CTATTCAGTT 
GCCATGTCGT CTTCTATTTA CCACGTCTTG TATTTCAAGC TACAAGACGC CGGTTTCTAC 
GTAGAGAGGT TCACCGCCGA CCGCGGGCCC CGGGGCGTGG AAGACGGCAC TCCGCTTACC 
CACTTTGACC ACATCCTCGC CACTGTGCAC TACGAGCTGG ATTACATCAA CCTAGTGAAG 
ATGCTCATAG ACGCAGGCAT CCCGCCGGAG GCTGGTAGAA GGAAAAAGCC CAAGCTGATA 
ATCGGCGGCC CCCCCGTGAC GGCGAATCCA GAGCCGCTTG CAGAGTTTGC AGACGCCATG 
GCGCTGGGAG AACTGGAAGC CCTCTGGGAG CCGCTTCTCG CCTATCTCTC CACACGTGAG 
GAGGCCGAGG GACTTTACTA CCCCGCGCGG GGGTCGCATC CGGTGTCGAT TGCCTATGCG 
CCGGACGTCC GCGAAGTGGA CTACAGGAGG CTACCCGAGC CTGAGTCGGC CTTCAGTATT 
TCGATCGAGG CGGCGAGGGG TTGTCCCTTC TCCTGTTTAT TCTGCATGGA GAGCTACATA 
ACTAAGCCAT ACCGCCCCAG AGACTGGATA ACCGTCGTGA ACGAGGCGGA GAGGCTATAC 
AAGAAGTCCG GCGTTAGGCC GTCGCTTGTG GCACTCACCG CGAACTCACA TCCACATTTC 
AAGGAGATAC TCCGCGCGGC GGTTGAGAGG GGGTTGCCGC TATCTCTCCC CTCTCTCAGA 
GCTGAGTTGC TAGACGACGA GGCTCTGGAG CTCATAGCTA GACTAGGGCA GAGAACCTTG 
ACAATCGCCC CGGAGACCAG CGAGAGGCTG AGGAAGGCGC TTGGCAAAAA CTTCACAAAC 
CAAGACGTCA TAAGAGTGGC AAAGAAGGCG TCGCAGCTGG GGCTTAAGCT CAAGCTCTAC 
CTAATGGTAG GGTTGCCGTG CGAAAAGGAG GACGACCTCA AAGAGGTGGT GGAGCTCGCT 
AAACAAGTTA AGCGGGTCGG GGCCTACCTA TATCTCAGCG TAAATCCTTT TGTCCCAAAA 
CCACAGACGC CCCTCCAGTA CCATCCCATG GCCCCTCTTG GCTACTTAAG AAAAAGCCTC 
AGCGAAATCA GGAAAGCGCC TCACGACGAG TACTCGCAAT ACGACACAAC CCTAGCGGCA 
ATCCAGGCAG CGATCTCGCT AGGGGGCCGC GAGGTGTCAC GCCATATAGA GGCGTCCGCA 
AATAACCCCA GTCCCTTGGG TTATTGGAAG AGCCTATTAA GAAGAGGAGA GCTGGACTAC 
GTCTTCAAGC CGCGGGAAGA CCCCCTTCCC TGGGAGCACG TGCGGGGCTT CTATCAGCCC 
GGGGAGCTTA GAAAGAGGTA CGAGAAATTC CTAGAAGAGG CTTGTGCCTA G

Protein sequence

MAYRKNAVKI ALLYPSTYSV AMSSSIYHVL YFKLQDAGFY VERFTADRGP RGVEDGTPLT 
HFDHILATVH YELDYINLVK MLIDAGIPPE AGRRKKPKLI IGGPPVTANP EPLAEFADAM 
ALGELEALWE PLLAYLSTRE EAEGLYYPAR GSHPVSIAYA PDVREVDYRR LPEPESAFSI 
SIEAARGCPF SCLFCMESYI TKPYRPRDWI TVVNEAERLY KKSGVRPSLV ALTANSHPHF 
KEILRAAVER GLPLSLPSLR AELLDDEALE LIARLGQRTL TIAPETSERL RKALGKNFTN 
QDVIRVAKKA SQLGLKLKLY LMVGLPCEKE DDLKEVVELA KQVKRVGAYL YLSVNPFVPK 
PQTPLQYHPM APLGYLRKSL SEIRKAPHDE YSQYDTTLAA IQAAISLGGR EVSRHIEASA 
NNPSPLGYWK SLLRRGELDY VFKPREDPLP WEHVRGFYQP GELRKRYEKF LEEACA