Gene Mthe_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1034
Symbol
ID	4462782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1117415
End bp	1118344
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	55%
IMG OID	639700052
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_843458
Protein GI	116754340
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.612389
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCTTC TTGAGCTGCG TGGATTGTCA GTGAGATTCG AGACCCCTGC CGGGTCTGTG 
AAGGCAGCAT CCGATGTCTT CCTGGCTCTT GATGAGCATG AGACCCTGGC GATCGTGGGC 
GAGACCGGTT GCGGAAAATC GGTGATCGCA AACGCCATCC TGAGACTTCT TCCAGAGAAT 
GCGAGTGTCA CGGGCAGCGT GATCTACCGC GGGATGGATC TGTTGAAGAT GAGCGAGCGG 
GAGATCTCCC GCATACGGGG CAGGGAGATC GCGATAATAT TCCAGAACCC GTCTGCCGCG 
CTCAATCCCG TCCACAGAAT CCTGGATCAG GTCTCGGAGC CGCTGCTGAT ACATCTCAAC 
CTCCCGAGAC ACAAGGCCCT GCATGAGGCT GATAGGCTCC TCATCGCCCT CGGATTGAAC 
GGAGCCGGGC GTCTGTATCC ATTCCAGCTC TCCGGCGGAA TGAACCAGCG TGCCATGATC 
GCATGCTCAT CGGTTCTCAG ACCAAAAATA CTGATGGCGG ATGAGCCGAC GAAAGGCCTG 
GACCAGAGCA TGGTGGAGAA TGCGCTGGAG CTGATAGGAT CTGTGAGAGA CGAGAGCAGC 
GCATCTCTTA TAATGATAAC CCACGATCTC GATGTCGCCC TTTCGATCTC CGAGAGGATC 
GCCGTGATGT ACTGCGGTGA GATCGTGGAG ATGGGTAGGA CAGAGAATGT GCTCTGCGAT 
CCAGAGCATC CATACACAAA AGCACTTCGT GAGAGCATGC CTGATCGCGG TTTCAAACCC 
ATACCCGGAA ACACCCCATC GATGATCGAT CCTCCAGAGG GATGCAGGTT TCATCCGAGA 
TGTCCTTTTA AGATGGACAT CTGCTCGCGC GAAAAGCCAT CTCTCAACAA CTCCTGCGGA 
AGATACGTGA GGTGCTGGAG GTGTACCTGA

Protein sequence

MSLLELRGLS VRFETPAGSV KAASDVFLAL DEHETLAIVG ETGCGKSVIA NAILRLLPEN 
ASVTGSVIYR GMDLLKMSER EISRIRGREI AIIFQNPSAA LNPVHRILDQ VSEPLLIHLN 
LPRHKALHEA DRLLIALGLN GAGRLYPFQL SGGMNQRAMI ACSSVLRPKI LMADEPTKGL 
DQSMVENALE LIGSVRDESS ASLIMITHDL DVALSISERI AVMYCGEIVE MGRTENVLCD 
PEHPYTKALR ESMPDRGFKP IPGNTPSMID PPEGCRFHPR CPFKMDICSR EKPSLNNSCG 
RYVRCWRCT