Gene Mthe_1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1066
Symbol
ID	4463081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1151073
End bp	1152272
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	50%
IMG OID	639700084
Product	ABC transporter related
Protein accession	YP_843490
Protein GI	116754372
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1134] ABC-type polysaccharide/polyol phosphate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGAGA CAGCGGTTAA GGTCGAGCAC CTCTGGAAGA CGTTCCGGAT ACCTCACGAG 
CGGAGGAACA CGCTGTTCGA GAACATCATT GGTTTTTTCA GGCCGAACAG CTATGAGACA 
TTCACCGTGC TGAAGGACAT AAACCTAGAG GTTGAGCGCG GGGAGTGCAT CGGCATAATC 
GGCGACAACG GTTCCGGCAA GAGCACGCTT CTGAAGATCA TAGCGAAGAT ACTCAGGCCA 
ACAAGCGGAT TTGTAAAGGT ATTCGGGAAG CTCACGCCGT TCCTCGAGCT CGGCGTCGGG 
TTCCAGCCGG AGCTCAGCGT GAGGGAGAAC ATACGGATTT ATGCCACCAT AATGGGTCTG 
CCGAAGAAGG TAATAGATGA CAGGATAGAT GATGTGATAA GGTTTGCGGG GCTTGAGCGG 
TTCGAGGACG CAAAGCTGAA GAATCTCTCG TCTGGCATGC AGGTGCGGCT CGCGTTCTCG 
ACAGCGATCC AGACAGACCC GGATATACTC CTGGTCGATG AGGTGCTGGC AGTCGGTGAT 
ATGGAGTTCC AGCAGAAGTG CTTCAGGGTG TTCGAGGATT ACAGAGATAG CGGAGTTACA 
ATACTGTTTG TGTCTCACGA TCTGAACGCG GTCAGGATGC TATGCGACCG GACACTGCTT 
CTCAGCAATG GAGAACGTGT GGATTTTGGA GACACAAATA GCATTATAGA TAAATATATT 
TATAAGACAG ATGTATCTGA AGTTGCAGAA ACATCTTCTG AGAAGGAGCG CGCATCCACC 
AGGAAAGAGA TAGAGATTGT TGATGTCAAG TTCGTGGACA AATACGGATG TCCCAACGAG 
AACTTCGTAG CCGGAGATCC GCTGAGGGTC CGTATTTTCT TTGATGCACA TGGGACGGTT 
AGGTCTCCAG TATTTGGTAT AATATTTTAT CATGGAGATA CCTACTGCTA CGGGACAACC 
ACGGAGTTTA AGGGATCTGA TACGGGTATT ATCAATGGCA AGGGATATGT GGACTTCATA 
ATACCAAGTT TGCCTTTTCT TCAGGGGAGG TTCGAGGTAA CAGTGGCTGT GGCATCACAT 
GATTACAGCA CACAGTACGA CTGGCACGAC AGACGCTATG CATTCAACGT CCACAATCCA 
ACACGTGACC TGGGCATGAT GCTTATAGAA GGCACATGGT CGCTGCGCAG GGATGCTTAG

Protein sequence

MGETAVKVEH LWKTFRIPHE RRNTLFENII GFFRPNSYET FTVLKDINLE VERGECIGII 
GDNGSGKSTL LKIIAKILRP TSGFVKVFGK LTPFLELGVG FQPELSVREN IRIYATIMGL 
PKKVIDDRID DVIRFAGLER FEDAKLKNLS SGMQVRLAFS TAIQTDPDIL LVDEVLAVGD 
MEFQQKCFRV FEDYRDSGVT ILFVSHDLNA VRMLCDRTLL LSNGERVDFG DTNSIIDKYI 
YKTDVSEVAE TSSEKERAST RKEIEIVDVK FVDKYGCPNE NFVAGDPLRV RIFFDAHGTV 
RSPVFGIIFY HGDTYCYGTT TEFKGSDTGI INGKGYVDFI IPSLPFLQGR FEVTVAVASH 
DYSTQYDWHD RRYAFNVHNP TRDLGMMLIE GTWSLRRDA