Gene Mpal_1134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1134
Symbol
ID	7270398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1163621
End bp	1164718
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	46%
IMG OID	643569767
Product	NMT1/THI5 like domain protein
Protein accession	YP_002466200
Protein GI	219851768
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.334038
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA AACTAAAAAT TATAATCACC GCAATTGTTG CGATTGCTGT TATAGGTATC 
GTCATCGGAC TAATCCTGAC CGGGACAGTG GGTTCCCCCC ATACCAAAAC GACCCAGATA 
CAAGGAAACA GTGGTACGCA GACGACAAAC TCGTCCAATG TCAAGACCGT CGGAAATACT 
TCAACAAATC AGAGTGGGGA CTTTTTTACC CTACGAACAC CGCTCTCGTC TTCACTTGCC 
GTGATCGATC TGGCTGACCA GTTGGGATAT TACCGGGATA ACGGTATCAT CATCGAACGG 
ACAGGCACTT CGACAGGAGG ACCCCAGAAT ATCATGACTG TTGCATCAGG AAGCAATGAT 
GTCGGGGGGT CAGCGTTCTC AGCGATTGTA AATGCTATTG CAAAGGGAAC CAAAATCAAG 
GTCGTTGTAC CCTCTATAGG AACCAGTTTA ACTGAACCGG ATTACAAATG GCTCGTTCTG 
AATACGAGTT CCATTAAAAC AGCAAGTGAT CTCAAGGGAA AGACCATCGG TGTTAACACC 
CTGGGAGCTC AGGCAGATTT CGTTACCCGG GCATATCTCT ATCAGCATAA TCTGACCCCA 
TCTGATGTCC AGTTGGTAGT TCTCCCTATC GAAAATGAAG AACAGGTTTT ACGACAGGGT 
CAAGTTGATG TTATTGCACC AAATGGAAAT TACCTGAAGA AAGCGGAATC AGATGGGGGG 
GTTCGTGCCC TCTTTACAGA TGCAGAAGTA ACCGGCGATC AGGTAAAATC TGCAACATTC 
ATGTCCACAG ATTTCATCGA AGAGCACCCG GATATTGTAC GAAAGTTTGT CAATGCTACA 
ACACGGGCAA TTGAATGGGA CAAACAAAAC CGGGATCAGT CAAAGGTTCT TCTCGCAGAA 
TACCTTGAAA AGAACAACGG CAATACGAAA CTGGCGGCAC TCCATAATGG CTGGGCAATT 
CGAAGTCCCC CCACTATTAA TGACCAGGAT GTCCAGTTCT GGGTAGATGT CATGGTTAAA 
GAAGGGCTTC TCAAGGAGGG ACAGATCAAA CCATCTGATG TCTATACAAA TGAATTCAAT 
CCATATTACC AGAAGTAG

Protein sequence

MKKKLKIIIT AIVAIAVIGI VIGLILTGTV GSPHTKTTQI QGNSGTQTTN SSNVKTVGNT 
STNQSGDFFT LRTPLSSSLA VIDLADQLGY YRDNGIIIER TGTSTGGPQN IMTVASGSND 
VGGSAFSAIV NAIAKGTKIK VVVPSIGTSL TEPDYKWLVL NTSSIKTASD LKGKTIGVNT 
LGAQADFVTR AYLYQHNLTP SDVQLVVLPI ENEEQVLRQG QVDVIAPNGN YLKKAESDGG 
VRALFTDAEV TGDQVKSATF MSTDFIEEHP DIVRKFVNAT TRAIEWDKQN RDQSKVLLAE 
YLEKNNGNTK LAALHNGWAI RSPPTINDQD VQFWVDVMVK EGLLKEGQIK PSDVYTNEFN 
PYYQK