Gene Mpal_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2074
Symbol
ID	7271551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	2200346
End bp	2201914
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	50%
IMG OID	643570685
Product	NHL repeat containing protein
Protein accession	YP_002467095
Protein GI	219852663
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.614793
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGGTTT TCTCATTACT CTGCATCCTG CTCCTCCTCT GCGGTAGTGT CCAGGCCGTG 
ACGGCAACAG AGACATATCT ATCTTCCAGA CTGTGGGGAA CCCCTGGATT TGGGATCAAT 
CAGTTCAACT CCCCTGAAGG GATTGCGGTG GATGGTACTG GCAATGTTTA TGTGGCCGAC 
ATGAACAACG ATCGTATATC GTTCTTCACG AAGGCTAGCT TACCACAGAT GCCTTCATCA 
ATTGGGAGGA TCGGTTCTGG GCATGGACAG TTCTTCTATC CCCACGGGGT TGCAGTGGAT 
AGCACTGGCA ATGTTTATGT GGCTGATACG GGTAACCACC AGATTCAGAA GTTCACGGTA 
AATGGTAACT TCAACACGCA ATGGGGAATT AAGGGCTCGG GGACCAATCA GTTCAACTCC 
CCTGAGGGGA TTGCGGTGGA CGGTGCTGGC AATGTTTATG TGGCCGATAC GGGTAATAAC 
CGCATTGAAA AATTCACATC CTCGGGGGAT ATTGTCACCT CCTGGGGTTC CTATGGTTCG 
GAAGTTGGGC AGTTCAACAG ACCAACCAGT GTTGCTGTGG ACAACACAGG AATAGGATAT 
ATCTACGTCG CAGATACCGG TAACAACCGC ATTCAGAAAT TCACATTGAC CGGTGACCTC 
GTTGCGACAA GGAGCATATC CAACTCTGGG GCCAGCCAGT TCAACAGACC GACCAGTGTC 
GCTGTTGACA CCGGTGGGAG TGTTTATGTT GCGGACACTG GCAATAATCG GATCCAGAAG 
TTCACGTCTT CAGGTGACCT CATCACCTCC TGGGGCTCTT ATGGTTCGGA ATCAGGCCAA 
TTTGTTTCTC CATGCGGAAT AACGGTTGAT GGTGAAGGTA CCGTCTATGT GGCCGATACT 
GGTAACAATC GCATTCAGCG GTTCACGCCT GTGCAGACCT ATGCCACCCT TGACTTTGTC 
CCAGGTACAA AAACGCTGGT CCTTGGTGAA CACCAATCGT TTGATCTCAC CCTCTCTGGA 
ATAGATACCG GCCTTTCGGG GTCTGAGGTC ATTGTATCCG TTGCTAATCC CTCAGTCCTT 
GATATTGTTG GAGCCAGCCC ACCCGTTTGG TCTTCGACAC CACAATACTA TGATCTTCCT 
TCATCTGCGG TCACAATCGG GGGTGCGGAC CTTGGGAATA GGGTCCAGGG ACGGATGTCT 
AATATCCCCC TCGGCAATCT CACGGTTCAG GGGAAATTGC CTGGGACAAC CAGTCTGGAT 
GTGACCCGGT ATCAACTGGA CGATGATTCA GGTAATCTGG TACCGGTCAT CACCATGTCT 
GTTGTCATCA CCGTCAGCGG CACACTGATA CGGTCACTTC CTTCGTCTGA TACTCCGCCC 
CACGATCTGG ACCAGGATGG TCTATATGAG GATGTGAATG GCGATGGGGT TTTTAACTTC 
AACGATGTGA TTCAATACTT CAACCAGATC GACTGGATCT CTGATAATGA ACCGACAGTG 
GCCTTCGACT TCAATCGAAA CGGGCGTGTC GACTTCGGGG ATATTGTGAC ATTGTTTAAT 
ATATTGTGA

Protein sequence

MKVFSLLCIL LLLCGSVQAV TATETYLSSR LWGTPGFGIN QFNSPEGIAV DGTGNVYVAD 
MNNDRISFFT KASLPQMPSS IGRIGSGHGQ FFYPHGVAVD STGNVYVADT GNHQIQKFTV 
NGNFNTQWGI KGSGTNQFNS PEGIAVDGAG NVYVADTGNN RIEKFTSSGD IVTSWGSYGS 
EVGQFNRPTS VAVDNTGIGY IYVADTGNNR IQKFTLTGDL VATRSISNSG ASQFNRPTSV 
AVDTGGSVYV ADTGNNRIQK FTSSGDLITS WGSYGSESGQ FVSPCGITVD GEGTVYVADT 
GNNRIQRFTP VQTYATLDFV PGTKTLVLGE HQSFDLTLSG IDTGLSGSEV IVSVANPSVL 
DIVGASPPVW SSTPQYYDLP SSAVTIGGAD LGNRVQGRMS NIPLGNLTVQ GKLPGTTSLD 
VTRYQLDDDS GNLVPVITMS VVITVSGTLI RSLPSSDTPP HDLDQDGLYE DVNGDGVFNF 
NDVIQYFNQI DWISDNEPTV AFDFNRNGRV DFGDIVTLFN IL