Gene Dole_1988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1988
Symbol
ID	5694828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2404484
End bp	2405449
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	60%
IMG OID	641264586
Product	low molecular weight phosphotyrosine protein phosphatase
Protein accession	YP_001529869
Protein GI	158521999
COG category	[R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0394] Protein-tyrosine-phosphatase [COG0655] Multimeric flavodoxin WrbA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0292793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGCAC TGGGATTGAT GGGCAGTCCG CGAAAAAAAG GCAACTCCGC CTACCTGCTT 
TCCGCCTTTC TCAAGGCGCT TGAAGCAAAG GGGGCTGTCA CCCATACCGT GGTGGTGGCG 
GAAAAAGAGG TGCTGCCCTG CATCGGCTGC ACCTACTGCG AAAAGCACGG CCGCTGTTTT 
CAGCAGACCG ATGACATGGC AAAGGAAATG TACGGCCTGT TCCGCCGGGC CGATATCGTG 
GTGGCGGCTA CGCCCATGTA TTTCTACAGT GCCCCGGCCC AGCTGAAGAT GGTGATCGAC 
CGGACCCAGA CCCTCTGGTC CCGCAACTAC CGGCTGAACC TGCGCGATCC CCGGGCCGGG 
AGCCGGGCCG GGTTCATGCT CTCCCTGGGC GCCACAAAAG GGAAAAACCT TTTTGAGGGC 
ATCAACCTCA CGGCCCGCTA TTTTTTTGAC GCGGTCAGCG CTGAATTTAC CGGCTGGCTG 
GGCTACCGCC GGATCGAGAA CCCCGGAGAC ATGGAAAAGC AGGAGGGGCT TGCCGCCGAT 
ATCGCGGCGG AAGTCAGCAA GCTGGACGCC CTGTTTGCCC GCAAAAAAAT GGTGTTTGTG 
GGCACGGACA ACACGTGCAC CAGCCGCATG GCCGAAGCGT TTGCCATGGC CATGGCCGGT 
GACCGGGTGG AAGCCATGAG CGCCGGTATG AGCCCGGCGG AAAAGATCGA TCCTGAAATG 
GAGGCCGCCA TGGCGGAAAA GGGTGTGGAC ATGGCTTTTG GCCGCCCCCG TTTAATGGAT 
GACGTGCTGT CGGAGATAAA ACCCGGTATC GTGGTGACCG TTGGCATCGT TCCCGATTTT 
ACCCCGGTGC CCGGCGCTCA GGTCGTGGCA TGGGAGATTC CGAATATCGA AGACCGATCC 
CCGGAAGGGG TGCGCCGCCT GCGGGATGAT ATTGAAGCGA GGGTGGCGGC ACTCATTCAG 
GGATAA

Protein sequence

MFALGLMGSP RKKGNSAYLL SAFLKALEAK GAVTHTVVVA EKEVLPCIGC TYCEKHGRCF 
QQTDDMAKEM YGLFRRADIV VAATPMYFYS APAQLKMVID RTQTLWSRNY RLNLRDPRAG 
SRAGFMLSLG ATKGKNLFEG INLTARYFFD AVSAEFTGWL GYRRIENPGD MEKQEGLAAD 
IAAEVSKLDA LFARKKMVFV GTDNTCTSRM AEAFAMAMAG DRVEAMSAGM SPAEKIDPEM 
EAAMAEKGVD MAFGRPRLMD DVLSEIKPGI VVTVGIVPDF TPVPGAQVVA WEIPNIEDRS 
PEGVRRLRDD IEARVAALIQ G