Gene Mbur_0488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_0488
Symbol
ID	3998326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	-
Start bp	482367
End bp	483497
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	44%
IMG OID	637958301
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_565221
Protein GI	91772529
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00399049
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATCCA AAAGGTTATT CGACAGAATC GATTCGATAA AACTTCGCGG TGTGACGAAG 
AAATATGATG ACAGGTTTGC TATCAATGAT GTTTCTATTG ATATTGAAGG TGGGGAGCTG 
GTCATTTTCA TAGGCCCCAG TGGGTCCGGG AAGACCACAA CACTGCGTAT GATCAATCGT 
TTGATAGAAC CCGATTCAGG GACTATTCTC ATCAATGACC AGAATGTCAT GGAACTTGAG 
CCGGTTGCCC TTCGCAGGAA CATAGGTTAT GTTATACAGA GTATCGGTCT TTTCCCTCAC 
ATGACCATTG CCGAGAATAT TGGTCTCGTG GCCAAACTGG AAGGCTGGAA TGAGAAAAAG 
ATCAAAGACA GGGTAGAATA CCTCCTTGAT TTTGTTTCCC TTCCGTCTGA GATGTTCATG 
GATAGGTATC CTCATCAACT AAGCGGTGGA CAACAGCAAA GAGTTGGACT CGCAAGGGCA 
CTTTTGATGG ACCCTCCCCT TTTGCTCATG GACGAACCCT TCGGTGCACT TGACCCGATC 
TTAAGGAAAC AACTTCAGGA AGAGTTCTAC CAGATAAGGG AAAAACTGGG TAAGACCATA 
ATATTCGTGA CACACGATAT CGAAGAAGCT TTCAAGCTCG GTGACAGGAT CGCAATAATG 
GATAATGCGA AACTTGTTCA GATAGGCACA GCTGAAGAAT TGATATTTCA TCCCGCAAAC 
GAAATGGTGG CAAGCATTGT AGATTCCGGT AAGAAGTTCA AGCACCTTGA TACGTTGAAA 
ATAAAGGACC TCATATCCCC CCTTGAATGC ATGTATGTCC ACAATGGATC ACTTGACATC 
GAGAGTGCTA TCAGTTCCAT GATAGAGAAG AACATCGAGA TCGCTGTGGT TTCTAATGGT 
TCGGGTCCGC TGGGTATTGT AAAGCTTATT GATCTATTGC GTATGGATGA TAAGGACAGC 
AAGATTGCAG ATCATGTTGT TGAGATCCCT TCATTTTCCA GAAATGAACT GCTCTCATCC 
TCACTGAAAA TAATGCAGAA GAATGGTCAT TCGATGGCCT TTGTCATGAC CGATGAAGAA 
CTAAGCGGAT TCCTGTTTCC AAATGATGCT TTCAGTCAGG TAATTGGATA A

Protein sequence

MPSKRLFDRI DSIKLRGVTK KYDDRFAIND VSIDIEGGEL VIFIGPSGSG KTTTLRMINR 
LIEPDSGTIL INDQNVMELE PVALRRNIGY VIQSIGLFPH MTIAENIGLV AKLEGWNEKK 
IKDRVEYLLD FVSLPSEMFM DRYPHQLSGG QQQRVGLARA LLMDPPLLLM DEPFGALDPI 
LRKQLQEEFY QIREKLGKTI IFVTHDIEEA FKLGDRIAIM DNAKLVQIGT AEELIFHPAN 
EMVASIVDSG KKFKHLDTLK IKDLISPLEC MYVHNGSLDI ESAISSMIEK NIEIAVVSNG 
SGPLGIVKLI DLLRMDDKDS KIADHVVEIP SFSRNELLSS SLKIMQKNGH SMAFVMTDEE 
LSGFLFPNDA FSQVIG