Gene Msed_1073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1073
Symbol
ID	5104454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1001637
End bp	1003019
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	52%
IMG OID	640506968
Product	phytoene dehydrogenase-related protein
Protein accession	YP_001191161
Protein GI	146303845
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02734] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCAG TTATAGTGGG TGGAGGGATT GGCGGACTCT CCACGGCCCT CCTCCTCAAG 
GGAAAGTTTG AGGAAGTGAC TGTAATAGAG AAGAACTCCA GTGTGGGAGG CAGGGCGAGG 
TCATTCAAGG CAGGAGAATT CAAGTTTGAC ATGGGGCCTT CCTGGTATCT AATGCCCGAG 
GTCTTCGAGA GGTTCTTCCA TGAGGTAGGC GAGAGTCCCC ATCCCGTGAT TGAGGTCAAT 
CCCCTAGTGC GGGTGGAGAA TGGTAAACTG GGGGAGAAAG GCGAATCCAT AACCTTCCAC 
GAGATCACAG AGGAGATGGA GGGTTACCTG AAGGACACGG GTTTCATGTA TGAGGTTTCC 
CTTAGAAAGT TCCTAAACAA GGAGATGACC TACCTTGACT TCCTGGACAA GGAGATTCTA 
TCAAATCTCG GGAGGATTCC CCTGTGGGAG AGCCTAGATA AGTTCAACTC AAGGTACTTC 
AACACCGACC TCATGAGGAA GGCCATGGGT TTCTCATCCG TTTTCCTGGG TGGTTCTCCC 
TTCAATACTC CTGCCGTGTA CGCCATGGTA AATTACGCGA TTTACGGTAA GGGCGTGTAT 
TACCCAAAGG GAGGGTTTGA GGGGTATGTG GATAAACTGT ATCAGGCGTG TAAGAGGGCG 
GGAGTAGAGT TCAGGCTAAA TTCACCCGTC ACGAAGGTAA AGGTTGACGG GAACAGGGTT 
AAGTCAGTGG TCACGCCCTC AGGCGAGGTT GAGGGCGACG TTTTCGTGTT TAACATGGAT 
TACCACTACT CTGATACCCT GTTACCTGAC GAGTTTCAGG TTGAAAGGGA GTGGTGGAGG 
AAGAGGCTGG CCCCCTCGAC GATCCTAGGT TACCTTGGGG TTGAGGGCGA GATGAACTTG 
CCACATCACA CGGTGGTCGT GAACGGAGAT TGGAAAGACC ACTTCAACTC CCTAGAGGAG 
AGGAGATTGC CTACCCCCGA GAACATGTCC TACTACGTGA GTTACAGGAG GGCTACGGAT 
GAGAACCTCC TGGGGAGGGA CCTTGTGATC CTAATACCAG TGGCTCCGGG TACCAGAACG 
AACCCAGAGT TAGTGAGAGT GGCACTGAGG GACCTTGAGA TCAAGACCGG TAGTAAGATA 
CAGGTCAAGT ACTCGAGGAT TTATGGTCCC GAGGACTTCG TGAGCGATTA CAACGCGTAT 
CAAGGGACTG CCTTTGGGTT ATCCCACACC CTGAACCAGA CAGGTCCCTT CAGGTTACCT 
ATGAGGAACA GGAAACTCAG GAACATGTAT TACGTGGGCC AATATACCCA ACCTGGAATA 
GGAGTTCCCA TGGTGACACT CTCGGCCTTG CTCGTCAGGG ATAAGATACT GAAGGAGTTG 
TGA

Protein sequence

MRAVIVGGGI GGLSTALLLK GKFEEVTVIE KNSSVGGRAR SFKAGEFKFD MGPSWYLMPE 
VFERFFHEVG ESPHPVIEVN PLVRVENGKL GEKGESITFH EITEEMEGYL KDTGFMYEVS 
LRKFLNKEMT YLDFLDKEIL SNLGRIPLWE SLDKFNSRYF NTDLMRKAMG FSSVFLGGSP 
FNTPAVYAMV NYAIYGKGVY YPKGGFEGYV DKLYQACKRA GVEFRLNSPV TKVKVDGNRV 
KSVVTPSGEV EGDVFVFNMD YHYSDTLLPD EFQVEREWWR KRLAPSTILG YLGVEGEMNL 
PHHTVVVNGD WKDHFNSLEE RRLPTPENMS YYVSYRRATD ENLLGRDLVI LIPVAPGTRT 
NPELVRVALR DLEIKTGSKI QVKYSRIYGP EDFVSDYNAY QGTAFGLSHT LNQTGPFRLP 
MRNRKLRNMY YVGQYTQPGI GVPMVTLSAL LVRDKILKEL