Gene Pars_1814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1814
Symbol
ID	5056026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1629242
End bp	1630540
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	640469360
Product	actin/actin family protein
Protein accession	YP_001154017
Protein GI	145592015
COG category	[Z] Cytoskeleton
COG ID	[COG5277] Actin and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.347081
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCTCCG ATGCCTATAG GCTGAAGTAC ACCTTCGGCG TAGACTACGG TACCAGCTAC 
GTCAAGTACG GCCCTATCAC GCTTAATGAG CCAAGGGTTG TGCAGACCAG GGGGCTGTTC 
CTAAGGGACC TCCCTGAGTC GGTCAAGATG CGGATCCCCC CCGACGTGCT GTCGAGGGGG 
CTAGTGGTCG GCGACGAGGA GGTGAGGAAG TACCTCTCAA GTGTGAGGGA TGTGCAACGC 
AACCTAAAGT ACCCCCTTAG AGATGGCATA GCGAAGAGAG ATGATGAGGA CGCTTGGCGC 
GTGTTAAAAG AGCTCGCGAG ATTCACCTTA GGCCAGTTTC CGATATCGGA CAAGGAATTT 
GAGGGGTGGA TAATCTCCAT CGCCCTCTCC GCCTTGGCCC CCGACTATAT GTATAGGGCC 
TTTTTCGACA TATACACAGA GCTATCAGAC GAGTTCAAAA TATACGCAGT GACGATTTTA 
CCTCAGCCCC TAGCAGTGGC TATTGCGGAA AACGCCGTTA ACTGCATAAT TGTGGAGGGG 
GGTCATGGCA ATATCCAAAT TGCGCCGATT AGCTTCGCCC TTATTCGGGA GGGGCTAGTG 
GCGTTGAATA GAGGAGGCGC AGAGGCCAAC GCCATCACGA GGGAGATACT GAAAGACATG 
GGCTACAGCG ATATAGCCAG GGAGGAATAC GCGGTCGAGA CTGTGAAAAG GGCAGTGGGC 
CTAGTCCCGA AGAACTTGAA GGAGGCGATT AAGACAGCAA AGACTAACCC TGAGAGGTTC 
GTGACGAAGG TACGGCTTTC TCCAGTCGTT GAGGTGGAGT TCCCCAAGGA GTATGCGTGG 
ACTAGGTTCC TCATAGGAGA GATAGTATTT GATCCAAACC ACGAGGAGAT AAGTAGCTAC 
ATTGAGCAGT CCCGCTTAAC TATTGAAAAC GCCGTGATCG GCGACGTCAC GCTCTACGGT 
GAGATGGACG TGGCCACTGC GGTGATTACA TCGCTTAGGA ACGTCTCCGT GGAGATACAA 
GAGAGAGTTG CCTCTCAGGT AATTCTAAGC GGCGGGGCCT TCAATTGGCG CGTCCCAGCA 
GGTCTTGAAG ACGTGGCCGC CGACAGCGTC ACAAGGATTA AGATCGCTCT CGAGGAGAAA 
AACCCCGTTC TCGCCTCGCG AGTGAACATA AGGATGGTGT CAGAGCCCCA GTACTCCGTG 
TGGAGAGGTG CGGTGATCTA CGGCTACGCC CTACCCCTAA CTCTGGAGTG GTCTGATACC 
ACGAAGGAGG GGTGGATGTA CCCAAAAAAG ACTAAGTAG

Protein sequence

MVSDAYRLKY TFGVDYGTSY VKYGPITLNE PRVVQTRGLF LRDLPESVKM RIPPDVLSRG 
LVVGDEEVRK YLSSVRDVQR NLKYPLRDGI AKRDDEDAWR VLKELARFTL GQFPISDKEF 
EGWIISIALS ALAPDYMYRA FFDIYTELSD EFKIYAVTIL PQPLAVAIAE NAVNCIIVEG 
GHGNIQIAPI SFALIREGLV ALNRGGAEAN AITREILKDM GYSDIAREEY AVETVKRAVG 
LVPKNLKEAI KTAKTNPERF VTKVRLSPVV EVEFPKEYAW TRFLIGEIVF DPNHEEISSY 
IEQSRLTIEN AVIGDVTLYG EMDVATAVIT SLRNVSVEIQ ERVASQVILS GGAFNWRVPA 
GLEDVAADSV TRIKIALEEK NPVLASRVNI RMVSEPQYSV WRGAVIYGYA LPLTLEWSDT 
TKEGWMYPKK TK