Gene Msed_1492 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1492
Symbol
ID	5104739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1457763
End bp	1458914
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	46%
IMG OID	640507380
Product	von Willebrand factor, type A
Protein accession	YP_001191573
Protein GI	146304257
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACTTT CCATGAAGGT AGAGGTAAGC CACAAGTACT CTTTCAACAG CGACCTAAAG 
ATGGCTTTTA AAATTCTCCT AGTCCCAGAG AAGATATCTA CAGCCACAGG ATTTCACTAT 
ATTGTTCTCC TGGACACCAG TGGATCCATG GACGGTCTTA AGATTGAAAG TGCTAAGAAG 
GGGGCAATAG AGCTACTTAA AAGGATACCA CAGGGCAATA AGGTGTCATT CGTCACCTTT 
TCCAGTAGGG TTAACATCGT GAGAGAGTTC GTGGATCCGG AGGATCTTAC GGCAGAGATT 
TCGAGCCTAT CCGCTGGCGG TCAAACAGCC TTCTTTACCG CTCTTCTCAC CGCGTTCAAT 
CTTCACAACA AGCACGGAAT TCCAAGTTAT GTGATCTTAT TAACGGACGG AAATCCCACT 
GATGATACAA ACGTTGAGAC ATACAAGAGG ATAGCCATAC CCAATGGCGT TCAGACCATA 
TCCTTTGGAC TCGGTGATGA TTATAACGAA ACCATACTCA AGTCTCTAGC TGACAGATCA 
GGTGGAGTCT TCTATCACGT AAATGATGCC ATGGAAATTC CAGAGAAACT TCCCAAAGCT 
GCAAAAACCA AGATAGCTGC TAAGAACGTT ACAGTGGATA TAGTCGCTGA GTCCAATGTG 
AAACTGCTAA ACTATTCTGG TCCTCCAGTA CAATTGAACG CGGTTGAGGG AGTAGTCAAG 
ATACTTGGCG AAGCTGTGGT TCCTCCCAAC TATAGTGGAA ACTTTATGAC AGTTAAGGCA 
AACTATGAGG AGCCAGTAGA CGGGAGAAAG CAAGCACTTC TGAGCGTAGT TAACATAAAA 
CCGGCAGATA GTCAGGCTAC CTTCGTGAGT GGAGTGAACA AGGATGTTCT CCTAGAGTAC 
GAGTACTTCA ACAACCTTCA GAAGATATCC AGCGAAGTAC AGGCTGGTAA CCTGGTGGAG 
GCAACCAGGA CACTTAAGAG GATGGAGGAA ATAGCTGGCC AAACAAGAAA GATTGAACTC 
ATGGAGACCA CGCGAAGGTT ATCAGATAGC TTAGAGACCA CAAAGAGGTC AGGAAATGCC 
ACGGAGCAAA CCAGAAAGCT GTCGAAGGAA GTCTCGAGCG AAGTCACAAG AAAGCTCAGG 
GGAGAGAGTT AG

Protein sequence

MTLSMKVEVS HKYSFNSDLK MAFKILLVPE KISTATGFHY IVLLDTSGSM DGLKIESAKK 
GAIELLKRIP QGNKVSFVTF SSRVNIVREF VDPEDLTAEI SSLSAGGQTA FFTALLTAFN 
LHNKHGIPSY VILLTDGNPT DDTNVETYKR IAIPNGVQTI SFGLGDDYNE TILKSLADRS 
GGVFYHVNDA MEIPEKLPKA AKTKIAAKNV TVDIVAESNV KLLNYSGPPV QLNAVEGVVK 
ILGEAVVPPN YSGNFMTVKA NYEEPVDGRK QALLSVVNIK PADSQATFVS GVNKDVLLEY 
EYFNNLQKIS SEVQAGNLVE ATRTLKRMEE IAGQTRKIEL METTRRLSDS LETTKRSGNA 
TEQTRKLSKE VSSEVTRKLR GES