Gene Dret_0343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0343
Symbol
ID	8418148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	427906
End bp	428847
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	57%
IMG OID	645036909
Product	Substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_003197223
Protein GI	258404481
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGC GGCTTTCTAT CGGACGGATT CTTTTCACTG TGCTGGTCTT CTCTCTTCTT 
GCCCTGCCTG CCATGGCCTC CGGGCCGGTC AAATTCGGTG TCCCTTCCTG GCCGGGGGTA 
ACGGTCAAAT CCGAGGTCGC CTCACAACTC ATCCGGGCCA TGGGCTATGA GGTCGAGCAG 
ACGGTGGCCT CGCCCTCGAT CATTTTTAAG GCGATGACCC TGGGCGAGTT AAACGCCTAT 
CTCGGTGGGT GGTCGCCGGT AGAAGATCCC ATGATTGATC CTCTGGTGGA AAAAGGGGAG 
ATCATTCGTG TCGGGGCCAA CATTGAAGAA GCTGTGACCG CCCTGGTCGT TCCCTCGTTT 
GTTGCCGAGG CCGGAGTGAC TTCCATTGAA GATCTGGCGG CGCACAAAGA CAAGTTTGAG 
AGTACGATTT ACGGCATTGA ATCCGGGTCC GGGGCCAACA ACGATATCCA GGAAGCCATC 
GATGCCAATG CCGCCGGGCT CGGCGATTGG GAACTGGCCG CCTCGTCCAC AGCTTCCATG 
CTGGCCCAGG TGCAGAGCCT GAGTGAGAAC AAACGGTGGG CCGTTTTCTG GGGTTGGGAG 
CCGCATTGGA TGAACGCGGT CATGGATCTG CATTACCTCC AATCCGAAAC CCCGGCGACG 
GAAAAAATCG GGGCTTCGGT CAGCGTAGTC TACACCATCA CCTCGAACGA CCTCCCTGAA 
GCCAATCCCC AAGCCTACGC GTTTCTGGAA CAGCTCAAGG TGCCTTCCGA TGTCCAGAGC 
CAGTGGATCT ACGAGTATCG CCAACAAGAC AAAGAACCTG AAGATCTGGC TCCACAATGG 
ATCAAGGCCA ATCTTGATGG GCTGGTGGGG CAGTGGCTGG AAGGTGTCCG TGCTGCCAAC 
GGTGAGCCCG CCCTGAAAGT TGTCCGCGCG GCGTTCAAGT AA

Protein sequence

MSKRLSIGRI LFTVLVFSLL ALPAMASGPV KFGVPSWPGV TVKSEVASQL IRAMGYEVEQ 
TVASPSIIFK AMTLGELNAY LGGWSPVEDP MIDPLVEKGE IIRVGANIEE AVTALVVPSF 
VAEAGVTSIE DLAAHKDKFE STIYGIESGS GANNDIQEAI DANAAGLGDW ELAASSTASM 
LAQVQSLSEN KRWAVFWGWE PHWMNAVMDL HYLQSETPAT EKIGASVSVV YTITSNDLPE 
ANPQAYAFLE QLKVPSDVQS QWIYEYRQQD KEPEDLAPQW IKANLDGLVG QWLEGVRAAN 
GEPALKVVRA AFK