Gene Pars_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1839
Symbol
ID	5056228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1645438
End bp	1646394
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	53%
IMG OID	640469385
Product	DNA-cytosine methyltransferase
Protein accession	YP_001154042
Protein GI	145592040
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.414211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.341933
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATAACG TTATTGATAT ATTTTCAGGT GGCGGCGGAT TCGGGCTGGG TTTTAGACAG 
GCGGGTTTTA AAATAAGGGT GGCGCTTGAT GTGGACAGAG ACGCGGTCAG GACGTACAGC 
GCCAACCACG TAAACACGGT AGTGTTGCAG AGGGACATTA GGGAGGTGAG CTACGAGGAT 
TTGGTCAAAT ACGGAGAGGC TGATGTGCTA ATTGGGAGCC CTCCCTGCGA GCCGTTCACA 
TCGGCAAATC CTAACAGAAT GGAAGACCCC GCCGACAGGC TTTACCTCGA TCCTGCCGGT 
CAGCTGACAC TTGAATTTAT CAGGATTGTA GGCGAACTCA GACCGAAGAT CTTCGTCATG 
GAGAACGTAG CGGCGTTGGC AGAGGAGCCA CTGAGGTCGT ACATTGAAAG GGAATTCAGA 
AGGGTGGGCT ACGAGGTGTA CTTCAATGTA CTCCACGCAG AGGACTACGG AGTCCCCAGC 
AGGAGGCGGA GGGTCTTCGT CTCAAACGTA GAAATTAGGC CACCTAAAAC ACGCATCATC 
ACGGTCCGAG AGGCGTTGCG CGACCTGCCT CCCCCCGACA GCGGCCTAGT GCCTAACCAC 
GACACGGTGA CGATAAGCAT GAAAAAACAG TATCAAATTG CCCGGCTGAG GCCTGGCGAG 
GCTTTAATGA AATACAGAGG AGCTACCGGT TTCTATGAAA ACTACATCCG GCTACGCTGG 
GACGAGGTGG CACCCACCGT AATGGGTACC CGGAGATTTG TCCACCCGGA GGAACACAGA 
GTCCTCACAG TACGCGAGCA GGCTAGACTA ATGGGCTACC CAGACTCATA CACCTTCTTC 
GGCTCTAAAG ACTCACAGTA TAACCAAGTT GGAGAAAGCG TGCCGCCCCC GCTGGCTTAT 
GCAATTGCGC TTGAGATACG AAAATATATA GACGAGAAGG TTTATCGACG TGGCTAG

Protein sequence

MYNVIDIFSG GGGFGLGFRQ AGFKIRVALD VDRDAVRTYS ANHVNTVVLQ RDIREVSYED 
LVKYGEADVL IGSPPCEPFT SANPNRMEDP ADRLYLDPAG QLTLEFIRIV GELRPKIFVM 
ENVAALAEEP LRSYIEREFR RVGYEVYFNV LHAEDYGVPS RRRRVFVSNV EIRPPKTRII 
TVREALRDLP PPDSGLVPNH DTVTISMKKQ YQIARLRPGE ALMKYRGATG FYENYIRLRW 
DEVAPTVMGT RRFVHPEEHR VLTVREQARL MGYPDSYTFF GSKDSQYNQV GESVPPPLAY 
AIALEIRKYI DEKVYRRG