Gene Mthe_1666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1666
Symbol
ID	4462661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1808598
End bp	1809665
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	639700684
Product	hypothetical protein
Protein accession	YP_844072
Protein GI	116754954
COG category	[R] General function prediction only
COG ID	[COG2232] Predicted ATP-dependent carboligase related to biotin carboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATCC TGGTGATCGG TCAGAGCGTT CGGAACATCG CGATCTCCGC GTTCAGGGCA 
GGCCACTCTG TGGCCGCTGC AGACTGCTAC TGCGATCTCG ATCTCGTTGA GGTGGTGGAG 
GTCCACAGGC TCCGCATTGA GGATCTCTTC AATGCTGACA AGATAAATGC GATCGTCGAG 
AGCGTCGACC CTGATGCAGT GGTCTTAGGG CCGGGTGTTG AGACAGTACG CATAAACGGC 
TACAGCGTGA TGAACAACAG CCCTGACCGA ATTCTCAGGG TCTCGGACAA GCTTTGGCTA 
TCCAGATGGC TGGAGGAGAG GGAGTATCCA CACGCCACCA CCTGGGAGAG TGATCCGCCG 
TGCGATCGGA AGATGATACT GAAGCCTAGG ATCGGCGCTG GCGGTTATGG ATGCCGGATC 
TTTGAAGGCG GAGCAGTCCC CCCTGGACAC ATCGTCCAGG AGTTCGTTGA GGGGGTTCCT 
GCAAGCGCGT CTGTGATATG CGACGGCTCG GATGCCAGAA CTATCGCGGT CAACGAACAG 
CTCTCTGGAA TGCGATGGCT GAACGCGGAT GGATTCAGGT ACTGCGGGAA CATAACGCCG 
CTCGATGCAG ATGCTGATGT GAGAGAGCGC ATCGCACACA TCGCAGAGGA GATCGTCGCA 
GGGCTCGGGC TCGTCGGCTC GAACGGCGTC GACTTCATTC TTGCACGAAA TAAACCCGTG 
GTCATCGAGG TGAACCCGCG CTTCCAGGGC AGCCTTGACA CTGTGGAGCT CTCGACGGGG 
ATATCTGTCT TCCAGGCACA CCTCGACGCC TTCGATGGGC GTTTACCTGC GGCGAGGAGG 
GCGAGGTACT TCGCAGGCAG GGCGATCCTT TACTCCAGCG AGCGCATCCG AATAGATTCA 
GACCTCAGGA GGCTTGTCTT GGGCATCATG GACGTCCCGG CCCCCGGATC GGTGATCGAG 
ATGGGAGATC CTGTGCTATC AATCATCTCA GCCGGCTCAG GGAGGAGGGG TGTTGTGGAG 
TCACTGAGGG CGAAAAGGAG CGCACTCGGC CAGATCCTTC GGCTTTAA

Protein sequence

MRILVIGQSV RNIAISAFRA GHSVAAADCY CDLDLVEVVE VHRLRIEDLF NADKINAIVE 
SVDPDAVVLG PGVETVRING YSVMNNSPDR ILRVSDKLWL SRWLEEREYP HATTWESDPP 
CDRKMILKPR IGAGGYGCRI FEGGAVPPGH IVQEFVEGVP ASASVICDGS DARTIAVNEQ 
LSGMRWLNAD GFRYCGNITP LDADADVRER IAHIAEEIVA GLGLVGSNGV DFILARNKPV 
VIEVNPRFQG SLDTVELSTG ISVFQAHLDA FDGRLPAARR ARYFAGRAIL YSSERIRIDS 
DLRRLVLGIM DVPAPGSVIE MGDPVLSIIS AGSGRRGVVE SLRAKRSALG QILRL