Gene Mpal_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1941
Symbol
ID	7270745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	2056992
End bp	2058176
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	55%
IMG OID	643570555
Product	aminotransferase class V
Protein accession	YP_002466968
Protein GI	219852536
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0312599
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.253942
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTTTG ATAATATCCG CAACGATTTC CCCCTTCTTT CTGAGGTATG CTACCTGGAC 
AGTGCAGCCA CGAGCCTCTC GCCGGAGCCG GTACTTGAGG CGATGCTTGA GTACGAGCAC 
AAATACCGGG CAAATGCCGG CCGGGGGGTC CATCGGATCG CCCAGCAGGC CTCTCAGAAG 
TACAGGGATG CCCACCAGAA GGTTCGGAAA TTCATTCATG CTCAGGAAGG TGAACTGGTC 
TTTACCCGTA ACTCCACCGA GGCAATCAAT ACGGTTGCGT CAGGACTCGC GTGGCAGAAG 
GGAGATCAGG TAATTACCAC ACTCCTTGAA CATCATAGTA ATCTCCTTCC CTGGATGCGT 
CTTCGCAACC GTTATGGGAT TGATCTCCAG CTCCTGACTC CTGCACGGGA CGGCACCCTG 
GATCCGGCCG CCCTTGAGGC AATCATCACA AAGCAGACCC GGCTCGTTGC TATCAGTCAG 
GCTTCGAATG TACTGGGAAA TGTCGTGCCC ATCAGCGAGT TTGCAAAAAT CTGCCAGAAT 
TACGGGGCGC TTCTTCTCGT TGACGGGTCA CAATCGGTCC CTCACATTCC GGTGGATGTG 
GAACGCTTAG GCTGTGATTT CCTCTGTTTC TCAGGGCACA AGATGCTCGG CCCCACCGGT 
ACTGGAGTAC TTTACATGAA GACTCCCTGC CTTGAACCCC TGCTTGTGGG TGGCGGGAGC 
GTGGAGCGGG TCACTGCCGA GGATTACACC CTCACCGACG GATATGAACG TTACGAGGCG 
GGAACCCCGA ATATAGCGGG GGCTATCGGT CTCGCCCGTG CAGTCGATTA CCTGAACGCG 
CTTGGTATGG AGAATATCCA GAACCACGAG CAGCAGATCA CCCGGTATAT CATCAAAAAT 
CTTACCGGGA TAGAGAACGT GGAGGTTTTT GGACCCGGGC CGGCAGGGAA CCGGATCGGG 
GTCATCTCGT TTGCCGTCAA GGGGCTCAAT CCCCATGACG TTGCTGTTAT GCTTGACGGG 
GAGGCAAATG TGATGGTACG ATCTGGTCAT CACTGTTGCA TGCCCCTTAT GCAACTCCTG 
AACCTGACCG ACGGCACGGT TCGGGCAAGT CTGCACTGCT ATAACACGAT CGAAGACGCG 
GAGCTGCTCG TGGACACCGT CAGGAAAATT GCTGGGGATT TTTAA

Protein sequence

MTFDNIRNDF PLLSEVCYLD SAATSLSPEP VLEAMLEYEH KYRANAGRGV HRIAQQASQK 
YRDAHQKVRK FIHAQEGELV FTRNSTEAIN TVASGLAWQK GDQVITTLLE HHSNLLPWMR 
LRNRYGIDLQ LLTPARDGTL DPAALEAIIT KQTRLVAISQ ASNVLGNVVP ISEFAKICQN 
YGALLLVDGS QSVPHIPVDV ERLGCDFLCF SGHKMLGPTG TGVLYMKTPC LEPLLVGGGS 
VERVTAEDYT LTDGYERYEA GTPNIAGAIG LARAVDYLNA LGMENIQNHE QQITRYIIKN 
LTGIENVEVF GPGPAGNRIG VISFAVKGLN PHDVAVMLDG EANVMVRSGH HCCMPLMQLL 
NLTDGTVRAS LHCYNTIEDA ELLVDTVRKI AGDF