Gene Msed_1363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1363
Symbol
ID	5103422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1334056
End bp	1335318
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	48%
IMG OID	640507252
Product	FAD dependent oxidoreductase
Protein accession	YP_001191445
Protein GI	146304129
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCTC TAGTGATAGG GGCTGGACAT AACGGACTGA TAGCCTCTTA TTACCTCAGA 
AAACTAGGTC TAGACGTAAC GGTTCTTGAG GCATCTCACA GGATCGGTGG AATGACTGAG 
AGCGCGGTAG AGGCCAAGGC TGTGATAAGT AGGGCCTCAT ACGTCCTAGG GATTATGCCT 
GAGTCTCTAC GAAGGGAATT TGAGATACCC ATAATTGAGA GCGAGATCTT TCAGACCATT 
GAATATGACG GAGAACTCAT ACCGTTTTAT CGTGAGCCAA GGAGGAGAAG AGAGGTTCTT 
GGTAAATATT TTCCTAAGTT CTCCGAGTTT GAGGATAAAC TCTTCAAGAT GAAAGAGATT 
ATGTCATGGT TTACCTTTAC CTCAAGCCCT CCTTCAAGGG AAAAAATTCT CGAGGTAGCA 
GAGAGGGAGG GCGTACCAGA AATGGTTAAG GACACCTCAG CTCACTTTCT GAAAGAATAT 
CTCCCAAGGG AGGTGCACAG GTACTTCATA TACCCTTCCA TGGAGGACGC CCCAGCCTAT 
ATGGTGGCTT ACTTCTATAA CGAGTGGTCC CTTGTTCCAA GCGGAATGGG CACAATTCCA 
AGCCTCATAG AGAAGAAAGC TAGATCCCTG GGTGTGGAGA TCAAGACTAG GAGCAAGGTG 
GATCAAATCG TGATTAGGAA CGGCAAGGTA ACAGGAGTGA AAGTTGGAGA TAGGGAATTG 
AAGGCAGACT TGGTCGTGTC TGCAATTAGC CCCGTTGCTA CTTTCTCGAT GACAGAGCCG 
TTGATGGACC TGAAACTGGA TCCGGGGAAA GGAGGATGGG TCAAGTACAA CGTGGTATTT 
AGGGATGGAG TCAAGGTTAG GGACGATCTC AAGCCATACT TGCAGGGTAT AATTGACCTA 
GAGGTGGGCG AAATTATAAT GCCCTCAGTC TTAGATGAGA CGAGAGGAGC CCCAGTCCTA 
GAGTTCATGG GAGATAGGGA GGAGGTCTTG TCCATGTTTA GCGGGGAGAT CCTGTATGAG 
GAGAAGATAA CTGCAGACTA TGCGTTGAGG TACTATCATG CACCGGGTGG GAACCTCAAT 
CATCTGCCCA TGAGGTATCC CTACCTCTTT GATGGTAGAC CCGTAAAGGG ATGGGGTTAT 
AGGACGCCAG TTAAGGGATT ATACCTCTCA GGGGCAGGAA CCTACCCCGG AGGACAAGTT 
ACAGGAATAC CAGGTTACAA TGTGGCCTTG GCTGTGGAAG AGGATCTTCA ACAGGGTTTT 
TAA

Protein sequence

MKALVIGAGH NGLIASYYLR KLGLDVTVLE ASHRIGGMTE SAVEAKAVIS RASYVLGIMP 
ESLRREFEIP IIESEIFQTI EYDGELIPFY REPRRRREVL GKYFPKFSEF EDKLFKMKEI 
MSWFTFTSSP PSREKILEVA EREGVPEMVK DTSAHFLKEY LPREVHRYFI YPSMEDAPAY 
MVAYFYNEWS LVPSGMGTIP SLIEKKARSL GVEIKTRSKV DQIVIRNGKV TGVKVGDREL 
KADLVVSAIS PVATFSMTEP LMDLKLDPGK GGWVKYNVVF RDGVKVRDDL KPYLQGIIDL 
EVGEIIMPSV LDETRGAPVL EFMGDREEVL SMFSGEILYE EKITADYALR YYHAPGGNLN 
HLPMRYPYLF DGRPVKGWGY RTPVKGLYLS GAGTYPGGQV TGIPGYNVAL AVEEDLQQGF