Gene Mpal_0220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0220
Symbol
ID	7270605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	252843
End bp	254141
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	57%
IMG OID	643568872
Product	putative PAS/PAC sensor protein
Protein accession	YP_002465329
Protein GI	219850897
COG category	[T] Signal transduction mechanisms
COG ID	[COG2202] FOG: PAS/PAC domain
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCAC CTTCAGAGGA ACTGCGGAGG ATCAGGGAGA TCCTGAAGCA GATACCGCAG 
GGGATGAGTG TGACCGAGAT TGCACGCGCC CTCGGAAAGA ATAAACACTC TGTCGGGAGG 
TACTTGGACA TTCTGCGAGT CTCCGGTCAT GTCGAGATGA GGAACTACGG GATGGCCAAA 
GTCTTCACCC TCTCCCAGCG GATTCCACTC AGCGCCCTCC TCTCCTTTCC CTCTGAGATG 
ATCATGGTCC TCGACCAGGA GCACCGGATC GGACAGATCA ACGACCAGTT CCTACAGTTC 
CTGCAGATTG AGCGCGGAGA GGTAGTCGGA CGGCAACTGG AATACCTGCC AGTCCCAAAC 
CCAGCGGTCC ATGACCTCGT CCTACAACTG CTCGCTGCAC TGAACGGGGA GGAAGTCGCG 
GACGAACTTG AGATTCCCAC CGACCCGGCC AGAATATTTA AATTAAAAGC TGTTGCGACG 
GTATTCGATG ATGGGACACA GGGGATGACT GTGATCCTTG AGGATATCAC CGCCCAGAAG 
CAGGCAGAGC AGGCACTGAA ACAGAGCGAA GCGCTCTTTC GGGGGATGGC TGAGAACATT 
CAGGATGGGC TGGTCATCAG CAGGGACCGG GAGATGGTCT ACGTCAACGA GCGGGCTGCC 
GCAATCCTCG GTTATCCGCG TGACGAGATC TTTGCGATGA CTGCCCTTGA TGTGATTGCT 
TCTGAAGAGC AAGAGCGGGT CAGGCCCCTG GTCGATGAAT ACAATCAGTC AGGCGGGGTG 
CCCAAAGAGC TTCGATTCTG GATCGTCCAG AAGAGCGGAA AACGGCGGTA CCTCTCCGCC 
CGCCTCTCCT CAATCGATCA TGAGGGGGAT CATATCGCAT ATATCGTGCT GACCGATATG 
ACCGAATGGA AGGAGGCCGA AGATACACTG AAACGGCAGT ACCTGTTTGT CCACCACTTC 
ATCGATGCCT TCCCTCGCCC GATCTACTGT CTGAATCCGG ACCGGCGGTT CCTCGAATGC 
AACCAGGCCT TTGAAGAGAT GGTCGGGCGA TCCCGGGCCG TGATCATCGG AGCCAAGACG 
GCTGACGTCT TCCCTGCAGA GGACCTAGCA GTGTACGAGC AGGGGGACGA CGACCTATTT 
CTGGAACCGT CCACCAGCAC ATACGAGGCA ACCCTGCAGT TCCCCGATGG ATCCAGACGG 
CAGATGACGA TCGAGAAGGC CACGCTCAGA TCCCCCGAGG AAGGGGCCTC CTTAACCCTG 
ATCGGAAACC TGATCGAGCG CGGACGGCAG CAGCACTGA

Protein sequence

MKPPSEELRR IREILKQIPQ GMSVTEIARA LGKNKHSVGR YLDILRVSGH VEMRNYGMAK 
VFTLSQRIPL SALLSFPSEM IMVLDQEHRI GQINDQFLQF LQIERGEVVG RQLEYLPVPN 
PAVHDLVLQL LAALNGEEVA DELEIPTDPA RIFKLKAVAT VFDDGTQGMT VILEDITAQK 
QAEQALKQSE ALFRGMAENI QDGLVISRDR EMVYVNERAA AILGYPRDEI FAMTALDVIA 
SEEQERVRPL VDEYNQSGGV PKELRFWIVQ KSGKRRYLSA RLSSIDHEGD HIAYIVLTDM 
TEWKEAEDTL KRQYLFVHHF IDAFPRPIYC LNPDRRFLEC NQAFEEMVGR SRAVIIGAKT 
ADVFPAEDLA VYEQGDDDLF LEPSTSTYEA TLQFPDGSRR QMTIEKATLR SPEEGASLTL 
IGNLIERGRQ QH