Gene Mthe_0444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0444
Symbol
ID	4462583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	458428
End bp	459498
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	53%
IMG OID	639699446
Product	periplasmic binding protein
Protein accession	YP_842875
Protein GI	116753757
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAAAT GGCTCACTTA TTCAGTATTG CTTTTACTAA TTGCTACCTC ATGCTGTGCA 
GCAGCCGAGT ACCCGATGAC GATCACAGAC TCCGCAGGGC GCGAGGTCAC CATACAGATG 
CCTGTGGAGA GGATCATAGT GCTGAACTCC GACGCGGCAG AGGCTGTGAC CATTCTGGGG 
GCAGCGGATA AGATCGTGGG GATATCGGAC AGCGTGAAGA ACAAGGCGTA CTACTTCCCC 
GCCCTGAAGA ACAGGCAGAG CGTGGGAAAG TGGAACGAGC CTGACTATGA GATGATCGGA 
GAGATAGCAA GGAGCGGTGA TGAGATTGTT CCCAACATAA TCGTGATAAG CTATACGTAT 
CCCGATAAGC CCTACGGCAT AGTGGAGGTG GCAAAGAGGC TGGAGCCTTT CACGGGCATC 
ACTGCAATCG GCCTGGACTT CTACAAGCCG GAGAACATGA CCCGGGAGAT AGAGCTTCTC 
GGCAGGATCC TCGGGAAGGA GGCGGAAGCA CAGCGCTTCA TAGAGTGGTA TGAGGAGAAG 
CAGGCGGATG TTGAGAACGC TGTGGCGAAC AGGAACGTTC CAAAGGTCTA CGTGGAGTGG 
ACATCGAAGG GTGGAGAGCT CACAACGATG GGCACAGGCT CAGGCGCAGC GCAGCTTGTC 
TCAATGGCGA GGGGCTACAG CGTAGCGAAT GATCTGAAAG ATGCGTATCC AAAGATCGGG 
TGGGAGTGGG TCATCTCGAA GAATCCAGAT GTCATAATAA AGAGATCGAC ATCCACGCAG 
CTTGGCTGGG AAAAACCGCC ATCTCTGGAT TCCACTAATC TGGAGAACAC GCTCAACGAA 
GTCCTCAGCA GAAGCGGTGC AGCAGCTGTG AATGCTGTGA AGAACGACAG AGTCTACATT 
GTCAACTGGG AGATCATGGC CGGATTGGAT GATGTTGTGG GCCTGACATA TCTTGCGAAG 
ATCCTGCATC CTGATGTGAA TCTGGATCCG GAGAGCGTTT ACAGGGAGTA CCTCCAGTTC 
CTGGGCGTGG ACTATCCTGA GGACAGGATA TTCGTGTACC CTGAAGTGTA A

Protein sequence

MIKWLTYSVL LLLIATSCCA AAEYPMTITD SAGREVTIQM PVERIIVLNS DAAEAVTILG 
AADKIVGISD SVKNKAYYFP ALKNRQSVGK WNEPDYEMIG EIARSGDEIV PNIIVISYTY 
PDKPYGIVEV AKRLEPFTGI TAIGLDFYKP ENMTREIELL GRILGKEAEA QRFIEWYEEK 
QADVENAVAN RNVPKVYVEW TSKGGELTTM GTGSGAAQLV SMARGYSVAN DLKDAYPKIG 
WEWVISKNPD VIIKRSTSTQ LGWEKPPSLD STNLENTLNE VLSRSGAAAV NAVKNDRVYI 
VNWEIMAGLD DVVGLTYLAK ILHPDVNLDP ESVYREYLQF LGVDYPEDRI FVYPEV