Gene Dret_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1930
Symbol
ID	8419775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2212082
End bp	2213278
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	65%
IMG OID	645038518
Product	phosphonopyruvate decarboxylase-related protein
Protein accession	YP_003198792
Protein GI	258406050
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3635] Predicted phosphoglycerate mutase, AP superfamily
TIGRFAM ID	[TIGR00306] 2,3-bisphosphoglycerate-independent phosphoglycerate mutase, archaeal form [TIGR02535] proposed homoserine kinase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCCCA AAATCGTTTT TTGTATTGCC GACGGCATGG GCGATTATCC CGTCCCCTCC 
CTTGGTGGAA AGACTCCCCT CGAAGCCGCG GAGACCCCGG AACTGGACGC GCTCTGCCCC 
AACGGTCTGC AGGGGCAGGC CCAGACCATC CCCGAGGGCA TGGGCCCGGG CTCAGACGTG 
GCCAATATGG CCCTGCTCGG GTATCCCCCG CGGACGTACC ACACCGGCCG GGGGCCCATC 
GAAGCCGCGG CCCAGGGACT TACGCTCGCC TCCAACGACA TTGTCTGGCG GCTCAACCTG 
GTCACCACCG ATGGGTGGAC GCCGGAAGCG GTCCTGCGCG ATTACGCCGC TGGCCATATC 
GATACGGCCA CGGCGCGGGA TATGATCCTT GAACTGAACG AGACCTTCGG CGACAGCACC 
TGGCAACTCG TCCCCGGCAT CCAGTACCGC CATCTCCTGG TCCAAAAAGG GGGTGCGGAC 
AGTCCGGAAG CTGAACTCGC CATCCGCCCG CCCCACGATA TCCTCGACCA GCCCATTGGC 
GCTGATCTCG AGGCTTTTGG TTCCAGTCCG GCGCTCAAGA CGTTGCTTGC CTCCTCGGCC 
GAACGTTTGG CAAGCCGGGG CGGAACCGCC ACGGCCCTTT GGCCCTGGGG CCAGGGCAAG 
TCGCTGCATC TGCCCGATTT CAGTGAACGG TTCGGCCTCA AGGGCCAAGT GGTATCGGCT 
GTGGATCTGG TCAAGGGACT GGGACGCGCC GCCCAGATGG ACGTGGCGGA AGTGCCTGGG 
GCCACTGGTC TGCTGGACAC CAACTACGCC GGGAAAGTCG AGGCCGCGCT GGAATTTCTC 
GACCAGGGCG ATTTTGTCTA CCTCCATGTC GAGGCCCCGG ATGAATGCGG TCACGCGGGC 
GACCCCGAGG CCAAGCAAGA GGCCATCGCC CGCTTTGACA GCCGCGTTCT CGCGCCCCTG 
CGCCAGGCTC TGGGGCAGAC CGCCTATTTC ATGGTCGCTT GCGATCACCT CACACCGGTC 
CGGGAACGCA CCCACACCAG CGATCCTGTC CCCTTTCTGC TCTCCGGGCC GGGGCTGCGC 
CCGAACACCG CGCACAGCAC GTTCACCGAA GCCACGGCCG ACAGCGCCGA ACTCAGCCTG 
TCCGCGGGAG AGGACCTGCT GCCGTTTGTC CTCAAAACCA TCGCCGATCT GAAATGA

Protein sequence

MLPKIVFCIA DGMGDYPVPS LGGKTPLEAA ETPELDALCP NGLQGQAQTI PEGMGPGSDV 
ANMALLGYPP RTYHTGRGPI EAAAQGLTLA SNDIVWRLNL VTTDGWTPEA VLRDYAAGHI 
DTATARDMIL ELNETFGDST WQLVPGIQYR HLLVQKGGAD SPEAELAIRP PHDILDQPIG 
ADLEAFGSSP ALKTLLASSA ERLASRGGTA TALWPWGQGK SLHLPDFSER FGLKGQVVSA 
VDLVKGLGRA AQMDVAEVPG ATGLLDTNYA GKVEAALEFL DQGDFVYLHV EAPDECGHAG 
DPEAKQEAIA RFDSRVLAPL RQALGQTAYF MVACDHLTPV RERTHTSDPV PFLLSGPGLR 
PNTAHSTFTE ATADSAELSL SAGEDLLPFV LKTIADLK