Gene Dret_1852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1852
Symbol
ID	8419693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2123525
End bp	2124451
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	54%
IMG OID	645038436
Product	Substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_003198714
Protein GI	258405972
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000000194668
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA CGTTTCTTCT CATTTCCCTG TTGTGCCTTA CCCTTCTCTT TCCCGCCGCC 
GCTTTCGCGC AAAAAGACAC CATCCGTCTC GGCGTACCCC CCTGGCCTGG GGTCACTGTC 
AAAACCGAAG TCGCCACCCA AATCCTTGAA GCCATGGGGT ATGAAACCCA ACAGTTGGAA 
ATCGGCCCGC CCATTATCTA CAAAGGGCTG ACCACCGGCG AAATCGACGC CTACCTGGCC 
GCTTGGCTGC CGCAGCAAAC GGACATGTTC GAGCCGCTCA AGGAAAAAGG CGCTATCGAT 
GTCATCAATA TCAATCTTGA CGACGCCATG ACCGGTTTTG CCGTTCCGAC CTATGTCTGG 
GAAGCCGGTA TCCACTCCGT TGCCGATCTG GCCCCCAACG CCGACAAATT CGACTCCACG 
TTGCACACCA TCGAAGTCGG CAGCGGCATG CACACCACGA CAGAGGAAAT GGTGAAAAAC 
GATGTGGCCA GCCTTGGCGA CTGGGAACTC GCCAGCAGCA CCACCCCGGC CATGCTCACC 
GAAGTGAATG AAAAGACCAA GAGCAAGGAA TGGGTTGTTT TCCACGCCTG GAAACCGCAT 
TGGATGACTA TCAAGATCGA TATGAAATTT CTTGAGGGCG TCCCTGGTTC CGAGGATCTC 
ATCAGTGAGA GTGTCGTCTA CAACGTGGCC AGCCCAGACT TTCAAGAGCG TTTCCCCCAA 
GCTCGCAAGT TCTTGGAAAA GTTCTACGTT TCTGGAGACA CCCAGAGTGC CTGGATCCAC 
TCTTTCAGCT ATGAGAAAAA AGATCCTGAA GATGTCGCCC GCGAGTGGAT CGCCAATAAT 
ATGGAAACAG TGAGCCAATG GCTGGACGGG GTAGAAACCA CCGACGGCCG GCCGGCCATC 
GACGCAGTCA AGAACGCCGT CAAATAA

Protein sequence

MKKTFLLISL LCLTLLFPAA AFAQKDTIRL GVPPWPGVTV KTEVATQILE AMGYETQQLE 
IGPPIIYKGL TTGEIDAYLA AWLPQQTDMF EPLKEKGAID VININLDDAM TGFAVPTYVW 
EAGIHSVADL APNADKFDST LHTIEVGSGM HTTTEEMVKN DVASLGDWEL ASSTTPAMLT 
EVNEKTKSKE WVVFHAWKPH WMTIKIDMKF LEGVPGSEDL ISESVVYNVA SPDFQERFPQ 
ARKFLEKFYV SGDTQSAWIH SFSYEKKDPE DVAREWIANN METVSQWLDG VETTDGRPAI 
DAVKNAVK