Gene Mpal_1395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1395
Symbol
ID	7270000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	1441664
End bp	1442839
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	61%
IMG OID	643570026
Product	NHL repeat containing protein
Protein accession	YP_002466448
Protein GI	219852016
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.597363
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTGA TCACTATCAT CGGTATTTTA CTGGTCCTGA TGGCGGGCAT TCAAGCCGTC 
GCAGCGGCCG AAACGTACGT CTATGCGGCG CAGTGGGGTA AGGCCGGCGG CGGTTCCGGC 
ACCGGGAACG GGGAGTTCAA TCAGCCGGCC CGGATTTCGT TCGACACCCA CGGCAGCGTC 
TTTGTGGATG ACATGAACAA CCACCGGATC CAGAAGTTCA CTACCGTGGG CGGCTTCATC 
ACCGCGTGGG GGAGCAAAGG CGTGGCTGAC CCGCCGTCCG CAGCCGGGAC GTTCCTGTCC 
CCGCTGGGTG TTGCGGTGGA TAGCCAGGAT TACCTGTATG TCGCCGATCG CGACATCCAC 
CGGATCCAGG TCATGGACCC CTCCCGGATC TGGACCGTCT TCGGGCCCAA CGGGACCGGA 
GAACTTCTTC AGCCGAGCGA CATCGCGGTG GACAGTTTCG ATAACGTCTA TGTGGTCGAC 
TGGGGGCACA ACCGCATCCG CAAGTTCGAC CTCCAGGGGA CCCCGCTCGG CGAGTGGGGC 
ACCCTCGGAT CGGGAAACCT GCAGTTTAAT GGGCCCCGCG GCATCGCCAT CGACAACGCC 
GACAACGTCT ATGTGGCCGA CACCGGCAAT AACCGGATCG AGAAGTTCGA CAGCAACGGC 
GCTTACCTCG CAACGATCGG CACGTCAGGC ACGGGCAACG GGCAGCTCTC CGGGCCATGG 
GGCGTGGACG TGGACACCGC CGGCAATGTC TACGTGGCCG ACACCGGCAA TAACCGGGTC 
GAGAAGTTCA ACCGGAGCGG TGCCTTCCTC GCGACGATCG GCACGTCAGG CACGGGCAAC 
GGGCAGTTTT CGATGCCTTA CGACGTCTCG GTGAACAGTG TCGGGATGGT CTACGTGGCC 
GACACCGGCA ACAATCGTAT TCAGTTCTTT TTACCGAAGA CCGTGAATAC AACGCCCCTG 
CTCGTGCCGG GCGGTGTCGG GGTGCCGACG GACACCAACG GTGACGGCCG CTATGATGAT 
GTCGACGGCA ACCGGGTGCT CGACTTCAAC GACGTGGCCC TCTACTTCAA CCAGATGGAC 
TGGATCGCCG CGAACGAGCC CCTGGCCGCG TTCGACTACA ACGGGAACGG ACAGATCGAT 
TTCAATGATG TGGTCTGGCT CTTCAACCAG ATCTAA

Protein sequence

MKLITIIGIL LVLMAGIQAV AAAETYVYAA QWGKAGGGSG TGNGEFNQPA RISFDTHGSV 
FVDDMNNHRI QKFTTVGGFI TAWGSKGVAD PPSAAGTFLS PLGVAVDSQD YLYVADRDIH 
RIQVMDPSRI WTVFGPNGTG ELLQPSDIAV DSFDNVYVVD WGHNRIRKFD LQGTPLGEWG 
TLGSGNLQFN GPRGIAIDNA DNVYVADTGN NRIEKFDSNG AYLATIGTSG TGNGQLSGPW 
GVDVDTAGNV YVADTGNNRV EKFNRSGAFL ATIGTSGTGN GQFSMPYDVS VNSVGMVYVA 
DTGNNRIQFF LPKTVNTTPL LVPGGVGVPT DTNGDGRYDD VDGNRVLDFN DVALYFNQMD 
WIAANEPLAA FDYNGNGQID FNDVVWLFNQ I