Gene Mthe_0520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0520
Symbol
ID	4463433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	535529
End bp	536500
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	55%
IMG OID	639699525
Product	aliphatic sulfonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_842951
Protein GI	116753833
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGTCT TCCTGATCGT CGGAATGGTG GTGGTTGCCT CGCTGGGCTG CATAACAAAA 
ACACCATCCG AGAATATAAC ACTCAGAATC GGCTACCAGC CGAGCACCCA TCAGATAGCG 
GAGATGGTCG CGATGGAGAA GGGTTGGTGG CTCGAGGATC TGAAGCCGTT TGGCGTTACG 
GCAGTCGAGG AGTACGAGTT CCCCTCCGGC CCACCTGAGA TGCAGGCGAT GCTTGCCGGC 
AGCCTGGATG TCGCTTACGT TGGAACAGCG CCGCCAATAT CAGCGATATC AGGCGGTCTC 
GATGCAAAGA TAGTTGCAGG CGTCAACACC AACGGCTCTG CTCTTGTACT CGCACCTGAT 
AAGGAATACA GTGGCCCCGA GTCGCTGAAG GGCATGAGCA TAGCTACGTT CCCGCCAGGC 
TCGATACAGG ATACGGTGCT CAAAAAATGG CTGAGGGAGA ACGGCGTCGA TACATCCGAG 
GTGAAAGTGC TTCCTATGGG GCCGGGTGAT GCTGTGACAG CGATGTTCGC CGGCCAGGTA 
GACGGCACGT TCCTGCCTGA GCCATCGCCA TCGGTAATTG AGATGTCCAA TAAAGGAAAG 
GTCGTCGTAT ACTCTGGAGA GATGTGGCCG AACCATGCCT GCTGCAGCCT GGTCGTCAGC 
GGCAAGCTCA TCAGGGAGCA TCCGGAGCTT GTCGAGCAGA TCGTAAAGAC GCATATCAAG 
GCAACAGAGT ATGTGTATGC TCATCCTGAT GAGGCAGCGA GGATCTATGC CAACCGGACG 
AAGCAGGATC TGAGCGTTGT GGAGTACTCG ATGAAGAACT GGGATGGGAG GTGGATAAGC 
GATCCTCATG TGCAGATCCC ATCCACAATG GAGTACGCCA GGGTCAACTA CGAGCTGAAT 
TACATAAGCA GAATGCCATC TGAAGAGGAG CTCTTTGATG TGAGCTTCTA CGATAAGGCG 
AGGGGTGAGT GA

Protein sequence

MPVFLIVGMV VVASLGCITK TPSENITLRI GYQPSTHQIA EMVAMEKGWW LEDLKPFGVT 
AVEEYEFPSG PPEMQAMLAG SLDVAYVGTA PPISAISGGL DAKIVAGVNT NGSALVLAPD 
KEYSGPESLK GMSIATFPPG SIQDTVLKKW LRENGVDTSE VKVLPMGPGD AVTAMFAGQV 
DGTFLPEPSP SVIEMSNKGK VVVYSGEMWP NHACCSLVVS GKLIREHPEL VEQIVKTHIK 
ATEYVYAHPD EAARIYANRT KQDLSVVEYS MKNWDGRWIS DPHVQIPSTM EYARVNYELN 
YISRMPSEEE LFDVSFYDKA RGE