Gene Msed_0487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0487
Symbol
ID	5103649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	443852
End bp	445042
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	48%
IMG OID	640506393
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_001190588
Protein GI	146303272
COG category	[R] General function prediction only
COG ID	[COG0446] Uncharacterized NAD(FAD)-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCT CCACTCGTTA CCTCATAATA GGGAGCGGGG TATCAGGCTA TCACGCATTG 
GATGAACTGA TCAACGCTGA TCCAAAGGTT GACATGATTA TGGTAACTAA CGATAGTTCT 
CTTCCCTATG ATAGACCCCC TCTCTCCAAG GAGTATATGA GAGGGGAAGT TGATAGGGAG 
TCGATCTTCT TCAAGTTACC CGAGACCCAC AGGGACAGGA TCCGCACGGG TATAACTGTG 
GAAAGGATCA AGGCTAACGT GGCCCAGCTA AGTAACGGGG ATGAAATTGA GTTTGAAAAG 
GTGTTGATTG CAACAGGAGG AAGGCCTAGA AAACTCAATG TACCAGGGGG AGATAGGGTG 
AAATACCTTA GGACTCTTGA TGACGCTGAT AGAATCAGGG AGAAAGCTAA GACCTCGAGA 
TCAGCCCTCA TTGTTGGCGC TGGGTTCATA GGAATGGAGG TTGGAGCAAG CCTCACAAAA 
CTTGGAATCC AGGTACAAAT GGTGGAGGTT AAGCCCTACA TCTGGAGTAC CTTCGTAGAC 
GAGAGGGTCT CTAGATTCTT CCAGGAATAT TTCGAGAAGA GAGGAGTGAA GTTCCTCCTT 
AACGAGTCAG TTAACGCATT TGAGGAAAGG GGAAGGGTGA AGGCTACTCT CAGTAGCGGC 
GGTGAGATTG AGGCTGACCT AGTTCTAGTT GCAACGGGAA TTCAGCCCAA TGTGGAACTT 
GCTGAGAGGA GTGGTATTTC AGTGAACAAC GGGATTTTGG TGGATAAGCA CCTGAGAGCG 
AGTCTCGACA ACGTCTACGC CTCAGGAGAC GTTGCTAACA TTGAGGATCC CGTCTCTGGT 
AAGAGGAGGA GGATAGAACA TTGGAATAAC GCTGAGTACA CGGGAAGGCT CGCAGCTAGA 
AACATGATGG GGAAGGAGGA AGAGTACGAC TTTCTCTCCA CCGTGTGGTC AGATATCTTT 
GACTTACACA TTGAATCTGC CGGGGAGACC ACGGGTTATG ACGAATACGT GGTAAGGGGG 
AAGATGGAGG ACCTATCTTT CAATGTGATA TATATCAAGG AAGGCCTAGT GAACGGGTAC 
GTTGCCGTGA ATAGACCTGG TGAGGAGCTG GAGGCTCTTA ACTCCATTAT CAAGGAGAGG 
AGGGAAGTAA GCCCGGAAAG ACTGGGCAAC GAGGATATTG AACTGACTTA A

Protein sequence

MRTSTRYLII GSGVSGYHAL DELINADPKV DMIMVTNDSS LPYDRPPLSK EYMRGEVDRE 
SIFFKLPETH RDRIRTGITV ERIKANVAQL SNGDEIEFEK VLIATGGRPR KLNVPGGDRV 
KYLRTLDDAD RIREKAKTSR SALIVGAGFI GMEVGASLTK LGIQVQMVEV KPYIWSTFVD 
ERVSRFFQEY FEKRGVKFLL NESVNAFEER GRVKATLSSG GEIEADLVLV ATGIQPNVEL 
AERSGISVNN GILVDKHLRA SLDNVYASGD VANIEDPVSG KRRRIEHWNN AEYTGRLAAR 
NMMGKEEEYD FLSTVWSDIF DLHIESAGET TGYDEYVVRG KMEDLSFNVI YIKEGLVNGY 
VAVNRPGEEL EALNSIIKER REVSPERLGN EDIELT