Gene Mesil_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mesil_3041
Symbol
ID	9252564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Meiothermus silvanus DSM 9946
Kingdom	Bacteria
Replicon accession	NC_014212
Strand	+
Start bp	3086173
End bp	3087321
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	67%
IMG OID
Product	hypothetical protein
Protein accession	YP_003686387
Protein GI	297567415
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCGGG CTTGGGCCAA GCCAAGGGCC TGGAAAAAGC GCCTTCAGGG AGCGCTGCTG 
GGCTTGCTCT GTCTCTTGCC CCTGGCCCTC TTCGTGCATC CGGCCTGGGG GTTAGTGTCG 
CTGCTGGCGC TGCTCTACCC CACCCGCCGC GAAGAAGAAG CCGCCTTGGC CGAGCTAGAC 
CGGCGGTACG GCCTGGCCTA CCGCAGCGCC CTGGAGGCTC CCGCGGGCCA CCCCTGGCGG 
GGTCAGCTCG AGGCCGAAGC CAGTGCCAGC CTGAGCCGGG CCCGTCCTCC GGCCTTCCCC 
TGGCCGCTCG CGGTAGCTTA CCTAGCCTTG ATCGGGCTGA TCTGGGTACT CCCCCCCCTC 
CAGAACCCGC TCAACCCTCC CGCGTCGGTG AGCCAGACCT CGAGCCCCTC GCCGCAGGCT 
TCGCCAGGCT CGCCCGAGCA AGCCCCCAAC CGCCCCCCGG AGCGAAATCC GCTGCCTAAC 
CCACCCCAGG GCCAACGCAC CGAGCAGACC GAGCCGGAAT CTCAAGCGCC TGTCTCGAGC 
CCCCCAAACC CGCAGGCCCA ATCTCCAACA GAGCAAAAGC CAAGTGCACC GAATCCGCAG 
AACCAGCCCA GCGCGGGCGA GCCGAAAACT GTGAGCGAGC CAGGCCAGCC CGACCAACCT 
GGACAAGCGC AGCCCACCCC GAATCAGCCT GGGCAGCAAA AGGGGGATTC TCAAAACGCC 
GAACGCCCCA CCCAGCCACA GAAAGGCTCC CAGGGTCAGC AAGGTCCTGG GCCCGGGCAA 
AAGCAAATCC CACAGAACGG CCAACAGAGC CAGTCCGCTG ACCAGAGTCC GCGAACTCAG 
GGTCAGTCTG GCCCACAACC GGGGCCTAGC TCGAGCCCCA AAGATGAGCG GGGCTCGGGG 
CCAGCTTCGC AGCAACCTCT ACCGCAAGCC CCAAACCCCC AGCCCGGCAT CCGCCCCAAT 
GGCGAAGCCC CGATCCAGCG GGGATCAAGC CAGGGCCGCC CGCAACCACT CCCCTCCCCC 
TGGCCGTCTG GGCAACCTCC GCAAAACGTG CAGCGGCAAG CCGAGAACTA CCTCCAAAGC 
GAACCTCTCC CGCCCGAGGT GCGGGAGGTA CTAAGGCAGT ATTTCGAGCT AAGCGCCGAT 
AGCCCATAA

Protein sequence

MHRAWAKPRA WKKRLQGALL GLLCLLPLAL FVHPAWGLVS LLALLYPTRR EEEAALAELD 
RRYGLAYRSA LEAPAGHPWR GQLEAEASAS LSRARPPAFP WPLAVAYLAL IGLIWVLPPL 
QNPLNPPASV SQTSSPSPQA SPGSPEQAPN RPPERNPLPN PPQGQRTEQT EPESQAPVSS 
PPNPQAQSPT EQKPSAPNPQ NQPSAGEPKT VSEPGQPDQP GQAQPTPNQP GQQKGDSQNA 
ERPTQPQKGS QGQQGPGPGQ KQIPQNGQQS QSADQSPRTQ GQSGPQPGPS SSPKDERGSG 
PASQQPLPQA PNPQPGIRPN GEAPIQRGSS QGRPQPLPSP WPSGQPPQNV QRQAENYLQS 
EPLPPEVREV LRQYFELSAD SP