Gene Mbur_2131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_2131
Symbol
ID	3998214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	2237566
End bp	2238525
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	47%
IMG OID	637959867
Product	ABC transporter, substrate-binding protein, aliphatic sulphonates
Protein accession	YP_566754
Protein GI	91774062
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.603164
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGTTG CAGCAGTTTT CCTGTCAGGA TGTACTTTTG CACCCGATGA TGGAACTTTG 
ACCGAAATAA ACATCGGCTA TCAGCCAAGC ACACACCAGA TTTCATATAT GACAGCCTTT 
GAGAACGGCT GGTGGGCTGA GGACCTTGCA CCATTTGGTA TCATGAGCAT AAACGAATTT 
GAGTTCCCAA CAGGTACTCC TGAGATGCAT TCAATGATCG CAGGAAACAT TGATGTTGCA 
TACGTTGGCG CAGCACCTGT TATTTCCGCA CTCAGTACCG GACTTGATGC AAAGATCGTC 
GCAGCAGTGA ACACACAGGG TTCTAATCTT GTGCTCAGAA ATGAGTTCAA ATATGATGGT 
CCTGCAGACC TTGAAGGTCT AAAGATAGCA ACCTTCCCAC CGGGAACCAT ACAGGATACC 
ATCTTCAAGG AATGGTTGGT AGATAATGGT CTTGAACCTG GTACAGATGT CGAAGTTGTC 
GCAATGGGTC CTGGAGACGC AACTGCTGCT CTTGCAGCAG GTAAAGTAGA CGGTGTATTC 
CTGCCACACC CAGCACCAAC GTTCATTGAA GTTGAAGGTT CCGGTCGTTC AGTTGTTGCA 
TCCGGGGAAA TACTTGCAGA CCATGCATGT TGTGTGCTTG TGGTCAGTGG GGATCTTATC 
AGGAACAACC CTGAACTGGT CGAACAGATC GTAAAGACCC ACATCAAGGC TATAGAGTAT 
GATAATCTCA ACATCGATGA TGCAGCGAAC ACATTTGCTA ACAAGCAGGG TGTTGACAAT 
GCAACTGTCC TTCAGTCCCT TGAAAACTGG GATGGTGTCT GGTCAGCTGA CCCACGTCCG 
CTTGTGGAGT CCACAGTAGA ATACGCAAAC TTCCAGTATG AGCTTGGTTA TATCAGCAGC 
CAGCTTACAG AAGAGGATAT CTTTGACGTG AGCTTCTACG AGAAGGTCTC TGAAGAGTGA

Protein sequence

MLVAAVFLSG CTFAPDDGTL TEINIGYQPS THQISYMTAF ENGWWAEDLA PFGIMSINEF 
EFPTGTPEMH SMIAGNIDVA YVGAAPVISA LSTGLDAKIV AAVNTQGSNL VLRNEFKYDG 
PADLEGLKIA TFPPGTIQDT IFKEWLVDNG LEPGTDVEVV AMGPGDATAA LAAGKVDGVF 
LPHPAPTFIE VEGSGRSVVA SGEILADHAC CVLVVSGDLI RNNPELVEQI VKTHIKAIEY 
DNLNIDDAAN TFANKQGVDN ATVLQSLENW DGVWSADPRP LVESTVEYAN FQYELGYISS 
QLTEEDIFDV SFYEKVSEE