Gene Dred_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_3089
Symbol
ID	4956901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	-
Start bp	3353232
End bp	3354332
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	45%
IMG OID	640182277
Product	metal dependent phosphohydrolase
Protein accession	YP_001114416
Protein GI	134300920
COG category	[T] Signal transduction mechanisms
COG ID	[COG2203] FOG: GAF domain [COG2206] HD-GYP domain
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATA AGGTAAAAAA GAAAAGATGG TATCATTTAG AAGCCCTCTG GGAAATTACA 
AGAATCCTTC ATACATCTCT TGATCTGGAA GAAGTACTGG ACATGGCCCT TACTGAAGCG 
ATGAAAGCAG TCCATGCAGA GGCAGGTACC CTCTGGTTAA ACGATAACCA GACCAATGAA 
TTTATCCAAC CGGTTTTAGC AAGGGGTCCC AAGGCAGATG GGCTGAAAGG CTTAAAACTA 
AAGATAGGCG AAGGGATGGC CGGCTGGGTA ACCGCCAATG GTCAGTCCCA AATGGTCAGT 
GATGTTCTTA AAGATTCCCG CTGGTCCCAA CGATTTGACC AGTCCACCGG TTTTATTACC 
CGCTCTTTGC TTTGTGTACC ACTAATAACC CAAACTTCCT GTATTGGGTG TCTGCAACTG 
GTTAATAAGC TCGATGGTCA ACTATTCGAT GAGGATGATT TAAGCTTATG CGAAGCCCTG 
GCTGGAGTTA TTGGTATGGC TGTGGAAAAC AGTCGTCTTT ATACAGACTT AAAGACCATG 
TTTAAGAGTT TTCTGGTGGC CTTAGCCTCG GCCATTGATG CCCGGGACCC CTATACTCGA 
GGTCATTCAG AGCGAGTTAG CCAGTATAGC CTGATGATGG GAAAAGCCCT GGGACTTCCT 
GAACAGGATT TAGAATTATT AGAAAGAGCT GCTTTTCTGC ATGATATTGG GAAGATTGGT 
ATTAGAGACC ATATACTGCT AAAAGAATCG CCACTGGATA ATGAGGAATT TATAATTATG 
AAGACCCATA CCACCATTGG GCAAAATATT CTACAACAGA TTGAGCCTAA CTATTTGGTT 
CAGGAGATAT CCCAGGGAGC CGCCTGTCAT CACGAACGAT ATGACGGCAA GGGATACCCT 
CAGGGATTGC AAAGAGAAGA AATCCCCCTT GCTGCACGTA TTATGGCCAT TGCTGATACC 
TTTGACGCCA TGGTAACAGA CAGACCATAT CGCAAGGGGT TACCGGTGAA ATTAGCGTTA 
CAGGAAATAA AACGCTGTGC CGGCAGCCAG TTTGATCCCC AACTGGCAGA AATATTTTTA 
ACAGAAATGA AAAAGGAGTA A

Protein sequence

MSDKVKKKRW YHLEALWEIT RILHTSLDLE EVLDMALTEA MKAVHAEAGT LWLNDNQTNE 
FIQPVLARGP KADGLKGLKL KIGEGMAGWV TANGQSQMVS DVLKDSRWSQ RFDQSTGFIT 
RSLLCVPLIT QTSCIGCLQL VNKLDGQLFD EDDLSLCEAL AGVIGMAVEN SRLYTDLKTM 
FKSFLVALAS AIDARDPYTR GHSERVSQYS LMMGKALGLP EQDLELLERA AFLHDIGKIG 
IRDHILLKES PLDNEEFIIM KTHTTIGQNI LQQIEPNYLV QEISQGAACH HERYDGKGYP 
QGLQREEIPL AARIMAIADT FDAMVTDRPY RKGLPVKLAL QEIKRCAGSQ FDPQLAEIFL 
TEMKKE