Gene Mbur_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_1040
Symbol
ID	3998780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	1122657
End bp	1123712
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	46%
IMG OID	637958816
Product	tRNA splicing endonuclease
Protein accession	YP_565725
Protein GI	91773033
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1676] tRNA splicing endonuclease
TIGRFAM ID	[TIGR00324] tRNA intron endonuclease

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000280827
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGCAG AGATAGTAAA GGACCGTGTA CTTGTAGAAA AAAAAGCTAT TAATGAGTTT 
TACAATAATG GGTACTACGG CAGGCCTAAA TCGAGCGGGC TTGAGCTCAC ACTTATCGAA 
GCTGTATATC TGGCATTCCG CGGGAAGATA GAGGTGGAAC ATGAAGGAAA GGTCCTGGAG 
TTTTCCGATC TTTTCAAGGA AGCTTCCATC TTGCAGCCCT CCTTCGAGCT TAAATATATC 
GTTTACAAGG ACCTGAGAGA ACGAGGGTTC TACGTACAAC CCGGTGTGAC CGATTTCCGC 
GTATACCCAC GTGGCAGCCA TCCCGGAAAG GGAGCGGCAA AGCAGTTCAT CTATGTAAGG 
TCAGAAAGAG CACCAATGCC ACTGAGGGAC CTCTTGCGTT CCCTTGCAGC AGCCGAAAAC 
GTTAGAAAGC AGATGGTACT CGCCATTGTA GATGAAGAGA GTGACATTAC TTTCTACGAT 
GTGAAAAGGC CACGCTTAAA AGGCGAGATG AAGGAACCCC TTTACCCAGA CATCAATGCA 
GATGCCACTT TCCTTGAGGA CAGGGTTGTC GTATGGGATG AGGAAGCTTC GAAAACCCTT 
TTTGAGAATG GCTTTTACGG GAAACCATTG GATAGCCAGA GATTGCAGCT TTCACTTGTT 
GAGTCCCGAT ATCTCCTTGA GAAGGGTGTC CTCAATATCA ACAACAGACA GGATGAATCC 
ATGGATGTGG ATGCTTTTTC AAAGATGGCT TCGGAGATTG AACCCGAGTT CAATCTGAAG 
AGCAGTGTTT ACACAGATCT TCGAGATAAA GGGGTCGTAC CAAAGACAGG TTTCAAGTTC 
GGTAGTCATT TCCGTGTTTA TTCACAGGTG GAATCACCAA CAAAGATACC GCATTCCGAA 
TATCTCATAC ATTCGATACC AATGGACCAT GAATTTACAC TCCCTGTCAT GTCAAGGGCC 
ATAAGGCTTG CCAACAGTGT AAGAAAGAGG ATGCTTTATG CGATCCTCAC AGATGATGGT 
GTCGATTACA TCGATATTGG CAGATTAAAG ATGTGA

Protein sequence

MRAEIVKDRV LVEKKAINEF YNNGYYGRPK SSGLELTLIE AVYLAFRGKI EVEHEGKVLE 
FSDLFKEASI LQPSFELKYI VYKDLRERGF YVQPGVTDFR VYPRGSHPGK GAAKQFIYVR 
SERAPMPLRD LLRSLAAAEN VRKQMVLAIV DEESDITFYD VKRPRLKGEM KEPLYPDINA 
DATFLEDRVV VWDEEASKTL FENGFYGKPL DSQRLQLSLV ESRYLLEKGV LNINNRQDES 
MDVDAFSKMA SEIEPEFNLK SSVYTDLRDK GVVPKTGFKF GSHFRVYSQV ESPTKIPHSE 
YLIHSIPMDH EFTLPVMSRA IRLANSVRKR MLYAILTDDG VDYIDIGRLK M