Gene Mthe_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1042
Symbol
ID	4463110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1127023
End bp	1128087
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	52%
IMG OID	639700060
Product	periplasmic binding protein
Protein accession	YP_843466
Protein GI	116754348
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCATCA GAGTGAACCA ATCGATCCAC ATTTTCCTGG CTGCCATGAT TTTGATGGCA 
GTTGGAACTA GTGTGCATGC ATCGGAACCG GACGATCTCA TAACCATAGT AGACTCTGCT 
GGAAGAGAGG TGGTGGTTCC GTATCCGGTG GAGTCTGTGG TTGTTCTCTG GAGCAATGCG 
GCCAAAGAGA TGAGAGCCCT GGGGGCGGTG GACAGAATTG TGGGCATGGA TCAGTCCACG 
AAGGATGAGG TAGATAAGGG GACACTCCCA GAGCTGACGA ACGTACCTGT GGTGGGAACT 
CAGGAGGAGC CAAACTACGA GAAGATCGCC GAGCTGAAAC CTGATGTTGT CATATGCCTC 
TCAGCTGGGT ATCCACCAGA GCCAGATGAG GTGCAGGAGA AGCTGGACCC ATTTGGGATA 
AAAGTCGTCG GACTGGACTT CTACAGGACC GAGGTCTGGT TCGATGAGAT AAGAACACTG 
GGGAAGATGC TCGGAAAAGA GGCCGAGGCT GAAGAGTATA TGTCGTTCTT CAGGAGCTAT 
TACGACCGTA TCAACCAGAC ACTCGCCACG ATACCAGACC CAGATCGGAA GACCGTCTAT 
TTTGAGGGCG CCAAGAAATA CCTCACATAC GGTGGAGCAG GTTATGGCAG TGGCATACCT 
AATATGATCC GCGCTGCCGG TGGTAAGGAT CTTTATCCTG AGAGGTCTGA GCTGGCTTTT 
GAGGTCGATC CTGAGGATGT CGCCAGAAGG AATCCCGATG TGATATTCAA AGGCACCACC 
TTGGGATGGG ATGCAGAGAG CGAGGAGGAG TTCAAGGCCA TCCGGGATGA GATAATGAGC 
CGTCCTGAGC TGGCAAACAC AAATGCGGTT AAGAACGGCC AGGTCTACGT AATAAGTTTC 
GACGTAGCAG GAGGGGCTGG CAAGAAGTTC GGGCCTGTCT TCCTGGCCAA GGTGCTCTAT 
CCGGAGAAGT TCCAGGATAT GGATCCGATG GAGTTCTACA GGGAGTATCT GAGGAGATTC 
CAGGGGTTGG AGTACAGAGG TGTATACCTC TATCCAAACC CATGA

Protein sequence

MFIRVNQSIH IFLAAMILMA VGTSVHASEP DDLITIVDSA GREVVVPYPV ESVVVLWSNA 
AKEMRALGAV DRIVGMDQST KDEVDKGTLP ELTNVPVVGT QEEPNYEKIA ELKPDVVICL 
SAGYPPEPDE VQEKLDPFGI KVVGLDFYRT EVWFDEIRTL GKMLGKEAEA EEYMSFFRSY 
YDRINQTLAT IPDPDRKTVY FEGAKKYLTY GGAGYGSGIP NMIRAAGGKD LYPERSELAF 
EVDPEDVARR NPDVIFKGTT LGWDAESEEE FKAIRDEIMS RPELANTNAV KNGQVYVISF 
DVAGGAGKKF GPVFLAKVLY PEKFQDMDPM EFYREYLRRF QGLEYRGVYL YPNP