Gene Pars_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2065
Symbol
ID	5054797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1847000
End bp	1848283
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	52%
IMG OID	640469614
Product	Glu/Leu/Phe/Val dehydrogenase, C terminal
Protein accession	YP_001154263
Protein GI	145592261
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0334] Glutamate dehydrogenase/leucine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.86041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.202815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCG GCCTCCACAT AATGGCAAGC GAGCACGGCT TCCTCACGCA CGTACTGGGA 
AACCTGAGGA GGGGGGTTGA GCTCGGCGGA TTTCCAGAAG ACTTCTACAA GGTAATATCA 
AGGCCAAAGA GAGTGTTGCA AGTCTCAATA CCAGTAAAAA TGGACAACGG CCAGATTGAG 
GTCTTCGAGG GTTATCGTGT TCAGCATTGT GATGCTTTGG GGCCTTTTAA GGGTGGTATC 
CGTTTTCATC CGGAGGTTAC TCTTGCTGAT GATATTGCTC TTGCCATGTT GATGACGCTT 
AAGAATAGCC TCGCCGGCCT CCCATACGGC GGCGCTAAAG GCGCCGTCCG CGTCGACCCA 
AAAAAACTAT CGGCAAGAGA GCTTGAAGAG CTCTCCAGAG GCTACGCCAG AGCCATTGCG 
CCTTTAATAG GCGACGTCGT GGACATACCA GCCCCAGACG TAGGCACCAA CGCCCAGATA 
ATGGCGTGGA TGACAGACGA ATACTCCAAA ATAAAAGGCC ACAACACCCC CGGCGTATTC 
ACCTCCAAAC CACCAGAACT CTGGGGAAAC CCAGTAAGAG AATACGCCAC CGGCCTCGGA 
GTAGCAGTAA CCACAAGAGA AATGGCCAAA AGACTCTGGG GAGAAATAGA AGGAAAAACC 
GTGGCGATAC ACGGAGCTGG GAACACCGGG GCGTGGGCCG CCTACTGGCT TGGAAGAATG 
GGCGCCAAGA TAGTGGCTAT ATCAGATTCC AAAGGCTCTG TAATAAACGC CAAGGGGATC 
CCCGCTGAGG ATATCTTAGG AGTTTACAAG GAGAAGTCCG TAAACCCCCA GGTCTCCGTC 
ACTATGCTTG AGGGCAACAA GGGGTCTCCA GATGCCCCGT TGTATCAAGA CGTTGATGTT 
CTTATTCCTG CTACTATTGA GAATGTGATT CGGGGGGATA ATGTCGGTTT GGTTAAGGCT 
AGGCTGGTGG TGGAGGGTGC TAATGGGCCT ACTACTCCGG AGGCTGAGAG GGAGCTTTAC 
AAGAGGGGTG TGGTGGTGGT GCCCGACATC TTGGCCAACG CCGGCGGCGT CGTCATGTCG 
TACTTGGAGT GGGTGGAAAA CCTCCAGTGG TATTTCTGGG ATGAGGAGGA GACTAGAAAA 
AGACTAGAAG CCATAATGGT AAACAACGTG GCGAAGGTAT ACCACCGGTG GCAAAAAGAA 
AAAGAATGGA CCATGAGAGA CGCCGCCATA GTCACAGCCC TAGAAAGAAT ATACAAAGCA 
ATGAAAACAA GAGGATGGAT CTAA

Protein sequence

MKFGLHIMAS EHGFLTHVLG NLRRGVELGG FPEDFYKVIS RPKRVLQVSI PVKMDNGQIE 
VFEGYRVQHC DALGPFKGGI RFHPEVTLAD DIALAMLMTL KNSLAGLPYG GAKGAVRVDP 
KKLSARELEE LSRGYARAIA PLIGDVVDIP APDVGTNAQI MAWMTDEYSK IKGHNTPGVF 
TSKPPELWGN PVREYATGLG VAVTTREMAK RLWGEIEGKT VAIHGAGNTG AWAAYWLGRM 
GAKIVAISDS KGSVINAKGI PAEDILGVYK EKSVNPQVSV TMLEGNKGSP DAPLYQDVDV 
LIPATIENVI RGDNVGLVKA RLVVEGANGP TTPEAERELY KRGVVVVPDI LANAGGVVMS 
YLEWVENLQW YFWDEEETRK RLEAIMVNNV AKVYHRWQKE KEWTMRDAAI VTALERIYKA 
MKTRGWI