Gene Pars_1870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1870
Symbol
ID	5055843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1673557
End bp	1674726
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	57%
IMG OID	640469416
Product	Serine--glyoxylate transaminase
Protein accession	YP_001154073
Protein GI	145592071
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0075] Serine-pyruvate aminotransferase/archaeal aspartate aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.856595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGTAA GTAGCGTGTA TCGTAGATTT GCGCAGAAGA GAGTCCTCAC TCCGGGGCCT 
ACAGAGTTGC CGCCGTGGGT TAGGGCCGCT TTGGCGAGGG AGACAACTAA CCCAGATTTA 
GATCCTGGGT TTTTGCGGGA GTATGAGGAG GTGGTAGAAA TGTTGAGGGC ACTTGTCGGT 
GCTTGGCAGT CTCGGGTGTA TGTGTGGGCT GGGGAGGCGA TGCTAGGTCT TGAGGCCGCC 
GTTGCGAACG CTGTGAGGCC TGGATCTAAG GTTTTGGTTG TAGACAACGG CGTGTACGGC 
GCTGGATTTG CCGACTTGGT GAAGATGTAC GGCGGGGAGC CGGTGTTGCT TGGACTTGAC 
TGGAGAAGTG CCGCCGATCC GGCGGCGGTG GATAGGGCGC TTGAGAGGGA GAGAGATGTG 
GAGGTAGTTA CGCTGGTTCA TTGCGATACG CCGACGGGTG TGTACAATGG CTTGGAGGAA 
ATTGCCAAGG TAGTGTCGGC CCATGGCGCG TTTCTAATAG TCGACGCAGT CTCCTCAGTG 
GGTGCTGATG TGATCGACGT AGACAGATGG GGTATAGGCG CGTTAATCGG CGGCTCGCAG 
AAAGCTCTAA ATGCGCCGCC TGGACTCACT ATAATGGCCG TGAGTAAAAG GGCGCTTGAG 
AGAGAGGCTG AGGTGGGGCG TAGGTCGTAC TACATGAGCT ACCGGGTGTG GGAGGAGTGG 
TTGGAGAAGG AGGGCTTCCC CTACACAATG CCAGATTTGT TGATATACGC ATTGAAGGAG 
AGTTTGAAGA AAATACAAGA AGAGGGCTTA CACTCCGTTG TCGCTAGACA CAAAGCCGCT 
AGGGCCGCGG CAAGGAGGGG TGTGGAGGCC CTAGGGCTAG AGCCTTTCGC TAGGCGTGTG 
GAGTGGAACT GCCCAACGGC CACAGCCTTC AAGACTCCGA TCCCGGCGCC GGAGTTCAGG 
AGGCATATTT GGGAAAAGTA CGGCATAATG CTGGCAGGAA GCTGGGGCCC AGTGGAGAGG 
GAGGTTATGA GAATTGGCCA CATGGGGGTA CAAGCCTCGG CTGATCACCT GGCGGTAGCG 
ATATCGGTGC TGGGAGCCGC GCTACGGGAC TACGGATTCA ACGTACCAGT GGGGAAGGCC 
GTAGAGGAGG CGCTGGAGGC GTTTAGGTAG

Protein sequence

MVVSSVYRRF AQKRVLTPGP TELPPWVRAA LARETTNPDL DPGFLREYEE VVEMLRALVG 
AWQSRVYVWA GEAMLGLEAA VANAVRPGSK VLVVDNGVYG AGFADLVKMY GGEPVLLGLD 
WRSAADPAAV DRALERERDV EVVTLVHCDT PTGVYNGLEE IAKVVSAHGA FLIVDAVSSV 
GADVIDVDRW GIGALIGGSQ KALNAPPGLT IMAVSKRALE REAEVGRRSY YMSYRVWEEW 
LEKEGFPYTM PDLLIYALKE SLKKIQEEGL HSVVARHKAA RAAARRGVEA LGLEPFARRV 
EWNCPTATAF KTPIPAPEFR RHIWEKYGIM LAGSWGPVER EVMRIGHMGV QASADHLAVA 
ISVLGAALRD YGFNVPVGKA VEEALEAFR