Gene Pars_1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1904
Symbol
ID	5055363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1709832
End bp	1711010
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	53%
IMG OID	640469454
Product	aminotransferase, class I and II
Protein accession	YP_001154107
Protein GI	145592105
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGGCT TATCTCCCAG GATAGGGGCA CTCCGAGAGT CTCCTACACG TAAAATAGAC 
GAGCTTCGTG AAAGGCTTAG AAGAGAGAAA AGAGACGTAA TACTTCTCTC GACCGGTCAG 
CCCTCGATAC CCCCACCTCG TGAGGTAAGA GAGGCCATGG CGGAGTTGTT AAAGGTAGAC 
TCAATGGAGC TGTACGGCTA CACGCCCAGT CAGGGTATCT ACGAGACTAG AGAAGCCATA 
TCTGAGGATT TGAAGAAACT AGGCGGTCTA GAGGTGTCCC CCGAGCAGAT AGTGTTGACT 
GCTGGTGGCC AAGCCGCTAT GTTTTCCACG CTTGCCGTGC TGATAGAGCC CGGCGATGAG 
GTAGTGGTGA TGGATCCCAC ATACTTTGGG TATCGGCCGT TGTTGGAGTA CTTCGGAGCT 
GTGGTTAAGA CAGCGGGCAC TCGGCTGGAG AAGGGGTTCC AGCCTGAAGT GGAGGTGTTA 
AAATCTGTAG TGAGCAGGAG GACCAAGGCG ATGATAATAG TGACTCCAGA CAACCCCACT 
GGCCGTGTTC TTAGAGAGGA CGTGGCTAGG GCAATAGCCG ATTTGGCGAG AGATTTCGAC 
TTCTGGATTC TCACAGATGA GGCGTACAAG ACACTCATAT ATGAGGGCAA CCATGTCTAC 
TTCTATAAGC TGGCTCCAGA GCGCACCATT TCAATAAACA CCTTTTCAAA AGACCCCGCT 
ATACCTGGGT GGAGGCTCGG CTATGTCTAC GGCCCAGCTG AGGTTATGCC CAAGATTAAG 
CTGGTCAATG AGGAGATGGT GTACTGTCCG CCCTCGTTTG CCCAGAGACT TGTGGCCCTC 
TACCTACGCT CTGAGGTCAG AATGCGCTAT ATAAGAGAAG TTGTGGAGAT CTACCGCCAG 
AAGAGAGACG TGGCGGTGAC GGCGTTGCGG AAGTATATCC CCGAGGCCAA GTTCGCAGTG 
CCCGCCGGCT CGATGTTTAT CTTTGTGGAC CTATCTAGGT ACTTAAACGA CAGTGAGAGC 
TTCGCCAGAG ATCTACTGGA GAGACACGGC GTGGCCGTAG TGCCGGGGTC TTATTTCAGT 
GAGTACTACA AGGCGGCTGT GCGCATATCC TTTGTCACCG AGACGCCGCA GAGGATAGAC 
GAAGGAATTC GTAGAATAGG CGAAGCCCTC AACGCGTGA

Protein sequence

MRGLSPRIGA LRESPTRKID ELRERLRREK RDVILLSTGQ PSIPPPREVR EAMAELLKVD 
SMELYGYTPS QGIYETREAI SEDLKKLGGL EVSPEQIVLT AGGQAAMFST LAVLIEPGDE 
VVVMDPTYFG YRPLLEYFGA VVKTAGTRLE KGFQPEVEVL KSVVSRRTKA MIIVTPDNPT 
GRVLREDVAR AIADLARDFD FWILTDEAYK TLIYEGNHVY FYKLAPERTI SINTFSKDPA 
IPGWRLGYVY GPAEVMPKIK LVNEEMVYCP PSFAQRLVAL YLRSEVRMRY IREVVEIYRQ 
KRDVAVTALR KYIPEAKFAV PAGSMFIFVD LSRYLNDSES FARDLLERHG VAVVPGSYFS 
EYYKAAVRIS FVTETPQRID EGIRRIGEAL NA