Gene Mbur_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_0501
Symbol
ID	3997489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	496078
End bp	497076
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	46%
IMG OID	637958314
Product	ABC glycine betaine/L-proline transporter, ATPase subunit
Protein accession	YP_565234
Protein GI	91772542
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTCTTT CCGGCTCAGG AAAATCCACT CTTTTGCGGT GCCTGAACCG CCTTATAGAA 
CCAACTGCCG GACACATAAT TCTCGATGGT GAAGATGTGG CCACAGCAAA TTCTGAGGAA 
CTGCGAGAGA TACGCAGGAA AAAAATGGGC ATGGTGTTTC AGAACTTTGC ACTCATTCAT 
CACAGAACTG TCCTTGATAA CGTTGCATAC GGTCTTGAGA TACAGGGCAT ATCAAAAGAA 
GAGAGAGATG TTAAAGGAAA GGAAGCTATC GAAACAGTTG GCCTTAAAGG CTATGAAAAT 
AGCAAAACAT CCCAGCTAAG TGGAGGGATG CAGCAGAGGG TCGGACTTGC AAGGGCCCTT 
GCAACTGATC CTGACATCCT GCTAATGGAT GAAGCCTTCA GTGCTCTTGA TCCCCTTATA 
CGAAGCGAGA TGCAGGACGA ATTGCTCGCA CTGGAAGAGA AGATGCAGAA AACGATCGTT 
TTCGTATCCC ATGACCTAGA TGAGGCCCTA AAGCTGGGCG ACAGGATCAT GATCATGCAT 
GATGGAGAGA TCGCACAGAT CGGCACTGCG GAAAATATCC TTACAAAACC TGCTGATGAT 
TATGTATCTA AGTTCGTAGC AGGTGTGGAC AGGACAAAGA TCCTCACTGC AGAAACGGTC 
ATGAAACGTG CTGATCCTGT GGTATCAATG AACTCCAGTC CAAAAGTAGC CCTGCAGTTG 
ATGAGAGAAC ATGGCATATC ATCCATATTC GTCGTGAACA GGGAAAAACA TCTGAAAGGT 
ATCATTTCAG TTGATGATGC AGTAAGAAAG GTTGGGAAGA CCATAAAAGA CGTCATGACA 
AGCGATGTCA CAACTACTCA CCCAGATACA CCTTTGAACG AACTTATACC GATAATCGAA 
AACAGTTCAC CTATTGCAGT TACAAAGGAT GATGGAAAAC TCCTTGGCGT AATTGTAAGA 
GGAAGTGTAC TTGGTGCACT TGCGATCGAG GAGGTGTGA

Protein sequence

MGLSGSGKST LLRCLNRLIE PTAGHIILDG EDVATANSEE LREIRRKKMG MVFQNFALIH 
HRTVLDNVAY GLEIQGISKE ERDVKGKEAI ETVGLKGYEN SKTSQLSGGM QQRVGLARAL 
ATDPDILLMD EAFSALDPLI RSEMQDELLA LEEKMQKTIV FVSHDLDEAL KLGDRIMIMH 
DGEIAQIGTA ENILTKPADD YVSKFVAGVD RTKILTAETV MKRADPVVSM NSSPKVALQL 
MREHGISSIF VVNREKHLKG IISVDDAVRK VGKTIKDVMT SDVTTTHPDT PLNELIPIIE 
NSSPIAVTKD DGKLLGVIVR GSVLGALAIE EV