Gene Msed_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1039
Symbol
ID	5104426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	963713
End bp	964888
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	52%
IMG OID	640506935
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_001191128
Protein GI	146303812
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.354978
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGA GAATTGTAAT AGTTGGTGGC GGAATAGGAG GAATGGGAGT AGCCACAACT 
CTCGCAGGTA AGTTAAATGC AGAGATAACC GTGATCAATA AGGATAACTT CTACGTGACA 
GGGCCCTCGA GACCATTGCT CCTTACAGGC GAGCAAGAGT ACGGAAGAAT GCTGAGGGGA 
TACGAAAAGG TGGGAGAGAA GGGTATTAAG GTGGTCGCGG GGAACGTGAT AAGGGTTGAT 
CCCGACAATA GGAAGATAAC CCTGTCTGAA TCAGGGTTTG GACTGACAAG CAGGGAAATC 
CAGTACGACT ATCTAGTGCT TGCCCCTGGC GTCGTATATG ACGGCTCCTC GATCACAGGG 
CTTGATAGGA ACTGGTGGAG GAACACCACG GTCTACGACC CTGGAAGGGT AAACGTGTTG 
AGGCAAAGGC TATGGAGCGA GAACGAGGGG ACAGTCCTGA TTTATGCCCC AAAGGCTCCC 
TACAGATGTG CCCCTGCTCC GACGGAGACG GCCCTCCTGG CTCACACAGT GCTAAAGCAC 
AGGGGAGTGA GGGAGAAGTT CAGGATAATA CATGTGGACG CAAACGATAA GACACAACCG 
CCTTTCATCG CCGACGTTGT GAAGCAGGTC TACGAAAAGG CCGGGATAGA GCTTGTGACT 
AACCAGGAGA TAGTTGAGGT GAATGAGAAA GAGGTGATCA CGAAGTCTGG CGAGAGATAT 
GGATATACCA TACTTGCCCT CCTGGAGCCC AACAGGGCTC CCAGGTTCGT GGAGGAGGCT 
GGACTAGGAA CGCCGTTCGT CGAGGTTAGG TCACCGCAGG ACTTGAGACA TCCGAAGTAT 
GATGACGTCC TGGCAGTGGG AGATGCAGCG AAGTTACCCT TCCCTAAGAA CCAGGAGATC 
GCCTTCGAGA GCGCCCTCTT CGCCTCCAAC AAGATTCTGG AGATGGAGGG TGTAACGGAG 
AAAGTTCCCG TTCAGTATGC GTTTGTGGGC TGGGCCTATA TGGGTAATCT CGAGGGAAGA 
CTTGAGACCC AGAGCCTCCA GTTCCAACTA GACTTAACAA CCCAACCGCC AAAGCCTGCG 
AAGGATCCTC AGCTCAAGAG AGAATATACA CTACAGAAGG ACAGATGGGA GCAGGCATAC 
CTTGAGAGGC TCTTCGGATA TTCCCCTAAA TCGTGA

Protein sequence

MAKRIVIVGG GIGGMGVATT LAGKLNAEIT VINKDNFYVT GPSRPLLLTG EQEYGRMLRG 
YEKVGEKGIK VVAGNVIRVD PDNRKITLSE SGFGLTSREI QYDYLVLAPG VVYDGSSITG 
LDRNWWRNTT VYDPGRVNVL RQRLWSENEG TVLIYAPKAP YRCAPAPTET ALLAHTVLKH 
RGVREKFRII HVDANDKTQP PFIADVVKQV YEKAGIELVT NQEIVEVNEK EVITKSGERY 
GYTILALLEP NRAPRFVEEA GLGTPFVEVR SPQDLRHPKY DDVLAVGDAA KLPFPKNQEI 
AFESALFASN KILEMEGVTE KVPVQYAFVG WAYMGNLEGR LETQSLQFQL DLTTQPPKPA 
KDPQLKREYT LQKDRWEQAY LERLFGYSPK S