Gene Msed_1675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1675
Symbol
ID	5105321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1615951
End bp	1616922
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	46%
IMG OID	640507569
Product	D-3-phosphoglycerate dehydrogenase
Protein accession	YP_001191754
Protein GI	146304438
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00128597
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.196753
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGACA ACTTTATGGA TGTTTCTCTA AATAAAGAAA ATCTAGCCAT ATTAATAACA 
GATCCTATAG ACGAGTATAT GATCAGGACG CTGAAGACTA AAGGGCTAAA GATTAACTAT 
CAACCTGACA TAGAGAGGGA GGAGCTACTT AAGGTAGTCG AGAACTACGA CGTACTTGTG 
GTAAGGAGCA GAACTAAGGT TGACAAGGAG GTCATAGAGA GGGGAAAGAG GCTAAAGGTT 
ATAGCGAGGG CAGGAATCGG AGTGGATAAC ATAGACACGG AGGAGGCGGA AAAGAGAAAA 
ATTAGGGTAG TATACGCTCC AGGGGCTTCC ACCGATTCTG CAGCAGAGTT AACCATAGGT 
CTCATGCTAG CTGGAGCTCG CAACATGTTT ACGTCTATGA CCTTAGCGAA ATCTGGAATC 
TACAAGAAGA CTGAAGGCGT GGAGTTGAGC GGAAAAACAA TTGGAATAAT TGGATTCGGA 
AGAATAGGGT ATAAGGTTGG GCTGATCGCA AGGGCAATGG GAATGAATGT TTTGGCATAC 
GACGTAGTTG ATGTTTCCAA GAGAGCTATG GAGATAGGGG CAAGAGCAGT TTCCCTTGAC 
GAATTGGTTA CCCAATCCGA CGTGATTAGT ATTCATGTGA CTGTGGGGAA GGACGCTAAA 
CCAATACTAA CCTCCAGAGA GTTCGAAATG ATGAAAAAGG GTGTTATAAT AGTTAACACG 
AGCAGGGCAG TCGCTGTTGA CGGAAAGGCC CTCCTCCACT ACATAAAGGA GGGGAAGATA 
ATGTCCTACG CTACAGATGT ATTCTGGCAC GAACCCCCGA AGGAAGAGTG GGAGTTGGAG 
TTACTTAAGC ATGAGAGGGT CACCGTAACC ACCCACATAG GAGCCCAGAC CAAGGAGGCC 
CAATACAGGG TAGCTGTTAT GACCACGGAA AACCTACTGA AGACCCTTCA GGAGCTCGGT 
GTTAAACTTT GA

Protein sequence

MADNFMDVSL NKENLAILIT DPIDEYMIRT LKTKGLKINY QPDIEREELL KVVENYDVLV 
VRSRTKVDKE VIERGKRLKV IARAGIGVDN IDTEEAEKRK IRVVYAPGAS TDSAAELTIG 
LMLAGARNMF TSMTLAKSGI YKKTEGVELS GKTIGIIGFG RIGYKVGLIA RAMGMNVLAY 
DVVDVSKRAM EIGARAVSLD ELVTQSDVIS IHVTVGKDAK PILTSREFEM MKKGVIIVNT 
SRAVAVDGKA LLHYIKEGKI MSYATDVFWH EPPKEEWELE LLKHERVTVT THIGAQTKEA 
QYRVAVMTTE NLLKTLQELG VKL