Gene Mthe_1335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1335
Symbol
ID	4462141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1439074
End bp	1440984
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	54%
IMG OID	639700352
Product	serine phosphatase
Protein accession	YP_843751
Protein GI	116754633
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGAC CGCCCATATC TTCGACTCTG ATCGTGATCA TGGTGATTGC AGCAGTGGTA 
CCTGCCGCAA TTATGGGGCT GCTCTTCAAT ACAGAGGTCA GCAGAATGGT GGGGCCGATA 
CAGGAGCAGC TTGGCGATAT AAACAGCACC GCAGTAAACT ACTCCTCGGG CGCAACAGAC 
CAGGAGCTTA TCGTCTCTTC CAAGGCCATG CAGTACGAGG AGTTTTTCAG GAGGATCGCG 
GAGAGCAATC AGTTCGTGGC AGACTATGCT GCTTCCGGTT TCTCTGATAT CGATCGAGTG 
GCAGATCCGA ACAGCCCCCT CTCACAGACC CTAGCTAGGG CGATAAAGAG GAACAGCGCG 
ATCGAGCGAA TATACCTGGC GACCGCTGAT GGAAGAATAG CTTCATGGCC GGAGACAGAT 
GGAATCAGGA ATTATGCCAT AAACGCATCC GAACTCAGAT CACTGGGATG GTACAATGCG 
GCACAGGCTG CCGGCGGAAC TGTATGGATT CCCGGAGACG AGATGCACAT GATGTGCGCA 
ACGCCTGCAT ACTGGAATAT CACACTCTAC TGCGTTGCTG CATCAGAGGT ATCTCTGTCA 
GATCTCTACT CAGATCTATC GATGCTCAGA GGCAGCGGCT ATCCATTCAT AGTGAACAGA 
AGTGGCGATG TGGTGATGAT TCCCAAGGTC CGGAGGGGTG ATGCCCCATG GGACAATCTG 
CTCCTCTCCG GAAACCTCTA CAAATCCAAC ATCTCTGCAT TAGCGGAGCT CGGCGATCGT 
ATATCAAAGG GTAAGAGCGG CTCGGATTAT CTCATGATAG ATGGCCGGGG CTGGTTTGTG 
GTTTATTCGC CCGTGAAGAG TGTTGGGTGG ACAGTCGTTG TTGCGTACCC ATCCGAGCGG 
ATGATGGTTC CCCTAAGCAT CGTGGAGAGA AGCGCGAACG CTCTCAGTCA GAGAGCCGTG 
GAACTCCTGC GCAGCAGCAC AGCGGCAATG TTCTCAAAAG GACTGTTACT GATAATCATC 
TCTGGTGTGG CATTCGGATT GATAGGAATA ATGATCCGCA GGCAGCTCAG GAGATCTGCA 
GGCTGCATAT CTGATGCACT GCAGCGCATC GGCGGGGGTG AGCTGGAGAG GCGCGTGCCT 
GTGGAGTGCG ATATCGAGGG GATTGTGCAA TCCATTGAGT CTATGCGCCA GTCTCTCAGA 
ACGCTCCTCG AGGGGGCCAA AGCGGAGAGT TATGCAAGGG GATCACAGGA GTGCAAGAGC 
TCTGTATTAA AATCATTTGA CACGTATCTG ACTGCCGGTA CTCTTCCTCT CATCGAGGGA 
TATGATCTCA GCATTCGCCA GATATCGAGA GGAAGCACGT TCCACGACGT TCTGGAGATC 
CAGCACGGAA AGGTCGCTCT GTGCATGGGT AGAGCAAATG GGGAGGAGAT GGAGTCTGCC 
GTCCTCGCTG CCATCGCCAG AGCGGTTATA AGAGCGCTTC CATCTCAGCA CCCGGATGAG 
GTGATAAAGC GCGCGAACAG CATACTGGCA AAGAGCTCAT CATCCCCCAT CTCCTGCTTC 
TACGCGGTCC TCGATCACGG GCAGGGGGAG CTGGTGTACT CAAATGCAGG CCACGCTCCG 
CCGTTTGTGG TGAGCCGGGA TGGATCCGTG GATACCCTCT GCGGCGATGG GATACCCATG 
ACGATCAGGG ACGATCTCAA ACTCGGGTAT GAGCGCCGAC CCATTTCGAA GGGAGATGTC 
CTTGTGATCT ACTCTGAGGG CATGATAGAG GCGCAGGGCT TCGACCTGGA GCGTCTGATA 
GGTGTGGCTC GCGGCTCCAG AACAAAGAGT GCATCAGAGA TAGCGGACGA TATAGAAAGG 
GCGGTCCCGA AGGGGGATGG CATGGCGGTC ATGGTGATGA AATCAGTTTG A

Protein sequence

MMRPPISSTL IVIMVIAAVV PAAIMGLLFN TEVSRMVGPI QEQLGDINST AVNYSSGATD 
QELIVSSKAM QYEEFFRRIA ESNQFVADYA ASGFSDIDRV ADPNSPLSQT LARAIKRNSA 
IERIYLATAD GRIASWPETD GIRNYAINAS ELRSLGWYNA AQAAGGTVWI PGDEMHMMCA 
TPAYWNITLY CVAASEVSLS DLYSDLSMLR GSGYPFIVNR SGDVVMIPKV RRGDAPWDNL 
LLSGNLYKSN ISALAELGDR ISKGKSGSDY LMIDGRGWFV VYSPVKSVGW TVVVAYPSER 
MMVPLSIVER SANALSQRAV ELLRSSTAAM FSKGLLLIII SGVAFGLIGI MIRRQLRRSA 
GCISDALQRI GGGELERRVP VECDIEGIVQ SIESMRQSLR TLLEGAKAES YARGSQECKS 
SVLKSFDTYL TAGTLPLIEG YDLSIRQISR GSTFHDVLEI QHGKVALCMG RANGEEMESA 
VLAAIARAVI RALPSQHPDE VIKRANSILA KSSSSPISCF YAVLDHGQGE LVYSNAGHAP 
PFVVSRDGSV DTLCGDGIPM TIRDDLKLGY ERRPISKGDV LVIYSEGMIE AQGFDLERLI 
GVARGSRTKS ASEIADDIER AVPKGDGMAV MVMKSV