Gene Pars_2219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2219
Symbol
ID	5054155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1988910
End bp	1990154
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	56%
IMG OID	640469772
Product	Fmu (Sun) domain-containing protein
Protein accession	YP_001154417
Protein GI	145592415
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.437229
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTGGA CTCCTGGAGA GCTGATATCC TTCACTGCCA AGGTTCTCTA CGAAATAAGC 
AAAGGTCTTA CTCTTGACTA CGCTTTTCAA AAGGTAAAGA GGGGGTGGCG TGAGTTAGAT 
AGCTTCAAGG TATTTTACGA CGTGGTCTAC GACGCTGTGC GCCATTACTA TTTTCTCCAA 
TTCGCCGCTT CGAAGATGTT CGGCTCTTCT GGCGCAAAAG CCATAGCTAA GGCGTGGTTT 
ATTTTTAGGG CAGACTCTCT CCTCTACAAC AAAGACATGG TTTACAGCGT GCGGAAACGG 
CTGTTAAAAA GGGCTCTGAC AAAGCCGGAC CACGTAATGG CGGCGTTGGA GGAGTTAAGG 
GAGGATCGCG CCAGATACTT CTCGGTGAAG TACAGCTATC ACCCCAACAT AGTGTCGACA 
CTGCTGTCGC ATTTCCCGCC GGAGGAAGTG GAGAGGTTGC TAGAAGCGGG GAATCACACC 
TGGATTTGGC TGAGGATAAA CACGCTGAAG GCGGACGTGG ACAAGGCGTT GAGGCTGTTG 
GAGGCCGAGG CCGAGGTGGA GCCCCATCCT AAAATTCCCT TCGCCGTGTT GCTTAAATCA 
GCTAAGAGGC CTGTCCAGTA CCTAGAGGCC GTGAGGCGGT TTGTGGCCGT TCCCCAAGAC 
CTGGCCTCAA TATACGCCGT GCTTTCGCTT AGGCCAGAGC CTGGCGACAG GATAATCGAC 
CTCGCCGCGG CGCCGGGGAT GAAGACCAGC CTAATAGCCC AGCTAGCGGA GGGAAGAGCC 
AAAATCGTTG CCGTGGACCT CTCGGCGAAG CGCGTTGCGA GGATGAGGCA CCTCCTGAAA 
AACCTAGGAG CAGGGGACTT TGTAGAGGTC GTCAGGGCAG ACTCTCGGGT CTTAAAGACA 
AGGAAGTTCG ACAAGGCGCT TCTAGACGCG CCTTGCACCT CCAGCGGGGC GTTCACCAAG 
GAGCCCGCCG TAAAGATATA CCCCCGGGTC GAGGAGGCGC CTAAGTACTC CGCCGTGCAG 
AAGGCCCTCA TCAAAAACGC ATTGGCGCTG GCAGAGGAGG TGGTGTACGC CGTCTGTAGC 
ATCCTTCCAC AAGAAGGCGA AGAGGTGGCG GCGTCTGCCG GCGCAGAGGC GGAAAAGCCC 
CATCCTGACC TCGCCCCGTC GTACACGCCC GGCGTCGGCG GGAGAACCTT CCCCCACATC 
CACAGAAGCG AGGCCTTCTT CATATCGCGC TTGAGGAAAA GATAG

Protein sequence

MKWTPGELIS FTAKVLYEIS KGLTLDYAFQ KVKRGWRELD SFKVFYDVVY DAVRHYYFLQ 
FAASKMFGSS GAKAIAKAWF IFRADSLLYN KDMVYSVRKR LLKRALTKPD HVMAALEELR 
EDRARYFSVK YSYHPNIVST LLSHFPPEEV ERLLEAGNHT WIWLRINTLK ADVDKALRLL 
EAEAEVEPHP KIPFAVLLKS AKRPVQYLEA VRRFVAVPQD LASIYAVLSL RPEPGDRIID 
LAAAPGMKTS LIAQLAEGRA KIVAVDLSAK RVARMRHLLK NLGAGDFVEV VRADSRVLKT 
RKFDKALLDA PCTSSGAFTK EPAVKIYPRV EEAPKYSAVQ KALIKNALAL AEEVVYAVCS 
ILPQEGEEVA ASAGAEAEKP HPDLAPSYTP GVGGRTFPHI HRSEAFFISR LRKR