Gene Msed_1890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1890
Symbol
ID	5103277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1835458
End bp	1836531
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	46%
IMG OID	640507777
Product	nucleotidyl transferase
Protein accession	YP_001191954
Protein GI	146304638
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.661089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTCTG CTATTATTCT AGCTGGAGGA TGGGCCACTA GGTTAAGGCC TTTGAGTTTG 
ACAAAGCCAA AGTCCCTCTT TCCAGTTCTC GGGAAGCCTA TAATTGATTA TACGCTCGAT 
GCACTAGAAA GGGCCGACAT CAAGGACGTA TATATCTCCT TAAGGGTAAT GGCTGATAAC 
ATCATTAAAC ATGTGGAGAG GGGAGGGAAG AAGGTCACCT TTGTTGTGGA GGAGGAACCA 
CTTGGCGACT TAGGACCCCT GAAATACATC TCTGAAAAAT ATACCTTAGA CGACGAGGTT 
CTAGTGATCT ACGGTGACGT GTACATGGAG GTGGACTTCA AGGAGATCCT CTCGCTTCAC 
AGGAGTAATG AGTGCGGTGC AACTATCATG TCAGCTGAGG TGGAGGACCC CCAGAGGTAC 
GGGGTCCTCT ACACGGAGGG GGATAGGCTA ATCCAGATCG TGGAGAAACC TTCGAACCCC 
CTTTCCAAAC AGATTAATGC AGGAGTTTAC GTCTTTGACA AGAAGCTTTT CTCGATAATA 
AACGGAAAGT CGATCGCAAG GCATTTCCTT CCCAAAGTCT TACAACAGAG TTGCGTCTCA 
GTTTATAGGT ATCAGGGAGT TTGGGCAGAC ATCGGGATAC CGGCGGATTA TCTCAAGTTA 
AACTTTGATC TCCTGAGGAG GAAATATCCC CGTGGCTTTA TCTCGGATAA GGCTAAGGTG 
AGCGAGAAAG CCGAGTTAAC TCCTCCCTAT TTTATAATGG AGGATGCAAA GGTGGGAGAG 
GTATACTTGG ACTCTAACGC AATACTAGGA AAAGGTTCAG TAGTGGGCAA TGGATCATAC 
GTAGGGGAGA GTCTACTCAT GGATAGGGTT GTGGTAGGAG AGAACTCATT TCTGAAGAAC 
GTTATCGTGG GAGACAATAG TAAGATAGGG AAATGGAACC ACATCAGGGA GAGGACTATC 
CTAGGAGAGG AAGTAGTTAC GGGAGATGGA GTACTTCTAA ATAGGGGAAC AATAATCTTA 
CCATATAAGG AAGTCTCAGA TCCAGTTTAC AAGGAGGGCA AGATAATTCT ATGA

Protein sequence

MVSAIILAGG WATRLRPLSL TKPKSLFPVL GKPIIDYTLD ALERADIKDV YISLRVMADN 
IIKHVERGGK KVTFVVEEEP LGDLGPLKYI SEKYTLDDEV LVIYGDVYME VDFKEILSLH 
RSNECGATIM SAEVEDPQRY GVLYTEGDRL IQIVEKPSNP LSKQINAGVY VFDKKLFSII 
NGKSIARHFL PKVLQQSCVS VYRYQGVWAD IGIPADYLKL NFDLLRRKYP RGFISDKAKV 
SEKAELTPPY FIMEDAKVGE VYLDSNAILG KGSVVGNGSY VGESLLMDRV VVGENSFLKN 
VIVGDNSKIG KWNHIRERTI LGEEVVTGDG VLLNRGTIIL PYKEVSDPVY KEGKIIL