Gene Mesil_3074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mesil_3074
Symbol
ID	9252597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Meiothermus silvanus DSM 9946
Kingdom	Bacteria
Replicon accession	NC_014212
Strand	-
Start bp	3119476
End bp	3121341
Gene Length	1866 bp
Protein Length	621 aa
Translation table	11
GC content	62%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003686416
Protein GI	297567444
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000149398
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.300897
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCGAA GGGTTATACA AGCTTTCGTG GGGGTAGGGT TGTTGGCCGG TTTGGCCCTG 
GCCGGGCCGC AGGACAACAG CTTGGTGGTG GGCACCTCGC AGGAGCCCCG GGTGCTGGTG 
GGGGACTTTG TGAACGCCAT CAGCAACCAG AGCATCAAGT TCGAGATCGA GAACTTTCTT 
CTTCCTCCCC TGATCCAGAC CAGCCGCGAC GTGGAGAATA TGCCGGTCCT GGTCACCGAG 
GCCCCCACCG TGGCCAACAA GCGGGTGCGT TTCAGCAACC TGCCGGGGGG CAAACGGAGG 
CTCGAGATTG ACCTCACCCT GCGCGAAGGC GCGGTCTGGT CCGACGGAAC CCCCATCACC 
ACTGACGACG TAGCGCTGTA CTACGACTTC GGTAAGACCA AAGGGGTGCC TACCACCTCG 
CCCGACTACT GGGACCGGGT GGGCTTGCAG GTCAAGGACA AGCGGAACTT CACCGTTACC 
TTCGAGCCCG CTTATTTCTA TGACCTCGAC GGAAACCCCA TCGGGTATGC CCCGGCCCAC 
ATCATGCGGG CCGAGTGGGA GAAGGCCAAG GCAGCGGCCC AAGGCCGCGA TGCTGCCGGG 
CAGGCCGAGG TGTTTCGCAA CTTCTTCACC CAGTACGCCT CGCCACAAGC GCTCAACGCG 
GGCAAGATGG TCTACTCCGG TCCCTTCATA CTCAAGCGCT GGGTCCCCGG CAATACCATC 
GAGCTGGTGC GCAACCCGCG CTTTTTCATC ACCCCTCCGG GTGGGGCCGA CAAGTACGTA 
CAGAAGGTGA CCTACCGCAT CATCCAGAAC ACCAACTCCC TGTTGGTGGC GATCCTGGGT 
GGGGGGATTG ATGCTTCCTC GGGGGTCTCG CTGACCTTCG ACCAAGGGCG TGCCCCCCAG 
CTCACCCGCC GGGCCGAGGG CCGTTTCGAG GTGTGGTTCG TGCCCACCCC CTTCTTCGAG 
CACATCGAGG TTAACCAGTT CACCAACCTC GAGCAAGTCA AAAACTTGGG TCTGGCGGAT 
AAGCGCACCC GCCAGGCGTT GATGTATGCG ATCAACCGTG AGGCCATCAA CAAGGCCTTC 
TTTGAGGGTC TGCAACCAAT AGCCCATTCC TGGGTGTTCC CACAGAACCC CATGTATAAC 
CCCAACGTGC GCCGCTATGA GTACAACCCC GACAAAGCCC GCGCGCTGTT GGCCGAGTTG 
GGCTGGAAGC CGGGGCCGGA CGGCATCCTG CAGCGCACCG TGGAGGGCAA AACCGTGCGC 
TTCGAACTCG AGTACCAGAC CACCGCTGGA AACGCCGTGC GCGAGCGCAT TCAGCAGTTC 
ATTCAGGACA ACTTGCGTCA GGTGGGGATC GCGGTCAAGA TCAATAACGC CCCCTCGGCG 
GTGGTGCTGG GCCCCAATCG CGCTCGGGCT CAGGACGGAG CCTGGACTGG CTTTTTGCAG 
TTTGCCTTCA GCATGGGGTT GCAAGACGAT GGGGTGCGCT CGGCTTGCCG TGACGAGGAA 
GGCAAGCAGA TTTTTGTGCC CACCAAGGAA AACGGCTACC GCGGCACCAA TTTTGGCGGC 
TGGTGCAACG CCGACTTCGA TAAGTTGCGG GCTCAGGCAG TGGTGGAGTT CGATGTGGCC 
AAGCGTAAAG CCCTCTTCGC CCAGATGCAA GCTATCTGGG CCGAGGAGGT GGCGATGATC 
CCCCTGTACT TCCAGGCGGA TCCGCGGGTC TTCCGCAAGG GGCTTGTGAA CTGGGTCTCC 
TCGACTTTCG CCAGCTCGGG CTCGCCTACC GTAGAGCCCT GGCTGATCGG CTGGGAGCAG 
CGGGGGGCGC AGAAGGTCTA CGATCAGGCT AAATATGCCC TAACCATTCC CCCGGCCAGC 
CGCTGA

Protein sequence

MRRRVIQAFV GVGLLAGLAL AGPQDNSLVV GTSQEPRVLV GDFVNAISNQ SIKFEIENFL 
LPPLIQTSRD VENMPVLVTE APTVANKRVR FSNLPGGKRR LEIDLTLREG AVWSDGTPIT 
TDDVALYYDF GKTKGVPTTS PDYWDRVGLQ VKDKRNFTVT FEPAYFYDLD GNPIGYAPAH 
IMRAEWEKAK AAAQGRDAAG QAEVFRNFFT QYASPQALNA GKMVYSGPFI LKRWVPGNTI 
ELVRNPRFFI TPPGGADKYV QKVTYRIIQN TNSLLVAILG GGIDASSGVS LTFDQGRAPQ 
LTRRAEGRFE VWFVPTPFFE HIEVNQFTNL EQVKNLGLAD KRTRQALMYA INREAINKAF 
FEGLQPIAHS WVFPQNPMYN PNVRRYEYNP DKARALLAEL GWKPGPDGIL QRTVEGKTVR 
FELEYQTTAG NAVRERIQQF IQDNLRQVGI AVKINNAPSA VVLGPNRARA QDGAWTGFLQ 
FAFSMGLQDD GVRSACRDEE GKQIFVPTKE NGYRGTNFGG WCNADFDKLR AQAVVEFDVA 
KRKALFAQMQ AIWAEEVAMI PLYFQADPRV FRKGLVNWVS STFASSGSPT VEPWLIGWEQ 
RGAQKVYDQA KYALTIPPAS R