Gene Msed_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1842
Symbol
ID	5104189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1787351
End bp	1788442
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	34%
IMG OID	640507730
Product	glycosyl transferase, group 1
Protein accession	YP_001191909
Protein GI	146304593
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0382406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.82753
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGG TAATATTTTT GGTTTCCCGC CTGAAGCGAT TCGATGGCCA GACTAAAGCG 
GTATTAAACT TTACCTCAGG ATTGTTAAGA TTAAACATGG ATGTAACTAT AGTTGGTTAC 
TATATACGTG AAGACATAAA GAGGGAAGTA ACTCAAAAAC TAGGAATAAA TATATACAAT 
ATCTCATCAA ATGACGAGAC TCTCTTTGGT TTAGCTAATG AATACTATTT CGATGGAATT 
AGCAAAAAAC TAATGAAAAT AGTACACTCG CTACCCAAGG ATATAATCTT AGTTTCAAAT 
GATATAATTG TAAATACTAT TAAATATAAT AAGAAAAAGT ATCCCATGAT ATATTGGAGC 
CAGGGTGCTA TAGCTTCTTT ATTTATGTGG CCACTTACCT ATTCCAAGTC ACCAACTTTG 
AGAAAGTTAG TAAATATGAC AGCTCCAGTT ATAAATTTAC GGTTTTCTAA TTCCGTTAAG 
CGATATCCCT GTGTCCTTGC AAATAGTAAA ACCACAGGAA ACATTATCTC CCTGTTTTAC 
GATACGCCTC CTACTGATGT GGTTTATCCT CCTATCCACG TCGAGTATTA TGCCCGTAAG 
GCCAAAACAG AGACTAATGA AGATGATAAA TACGTTTTAG TATTCCTAAA AAGAGGATAT 
CCCGCTAGTG TGAACGTTAT CAAAAAGTTA GCAGAAAATG TTCGCATAAA AGTAGTTGGA 
TATCAAATCG ACAACGCAAA ATCTTTCATA AATATATCTG ATGAAGAACT TATTGACTTG 
TATTGTAATG CTTATGTTAC AATTTATCCT ATAACTTTTG AGAACTTTGG TTATATTCCA 
GTAGAATCAA TGGCGTGTGG GACCCCGGTG GTAGCCTATC GTTTTTCTGG TGGTCCTTCA 
GAGACCATAA TACACGAAAG AACTGGTTGG TTAGTAAATA CTGAGAAAGA CCTATATAAA 
AAGGCTCTAG AGATATATAA AAATGGGTAT GATATGAAAA TGAGAAAAGA TGCGATAGAG 
AGAGCAAAGG ACTTCTCTTA TGTGAATTCT ACTGAAAAAT TACTTTATTA TATTAAAAAC 
TCTAGCCTCT AG

Protein sequence

MKMVIFLVSR LKRFDGQTKA VLNFTSGLLR LNMDVTIVGY YIREDIKREV TQKLGINIYN 
ISSNDETLFG LANEYYFDGI SKKLMKIVHS LPKDIILVSN DIIVNTIKYN KKKYPMIYWS 
QGAIASLFMW PLTYSKSPTL RKLVNMTAPV INLRFSNSVK RYPCVLANSK TTGNIISLFY 
DTPPTDVVYP PIHVEYYARK AKTETNEDDK YVLVFLKRGY PASVNVIKKL AENVRIKVVG 
YQIDNAKSFI NISDEELIDL YCNAYVTIYP ITFENFGYIP VESMACGTPV VAYRFSGGPS 
ETIIHERTGW LVNTEKDLYK KALEIYKNGY DMKMRKDAIE RAKDFSYVNS TEKLLYYIKN 
SSL