Gene Dret_0128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0128
Symbol
ID	8417932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	167972
End bp	168925
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	55%
IMG OID	645036693
Product	Substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_003197008
Protein GI	258404266
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0344817
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.869462
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGTT TTTCCAAGAA AGTTCTTGTT GCATTGATCG CTTTTGCCGT TCTCACCATG 
AGCGCTTCAC AGGTCCTGGC GGCCAAAGAA GTGCGCTTCG CCAGCGTCAG CTGGACCGGC 
GTGACCACCA AGACCGAACT GGCTGTGCGC ATCCTGCGCA GCCTGGGCTA CGAGGCCTCG 
AACACCATGG TTTCCGTGCC CATTGCCTTC AAGGCCCTGG ACACCGGGGA GGCCGATATT 
TTTCTCGGCA ACTGGATGCC CACCCAGGCC ACAATGGCCA ACAAATACTT CGACAAGGGC 
ACCATCGAAC CGCTCGTGGC CAGTATGCCC GGAGCGAAAT ACACCCTGGC CGTGCCCACA 
TACGCCTATG AAGGCGGCTT GCAGCACTTC AAAGACATCG CCAAATACGC CGATAAGCTG 
GGGAATAAAA TCTACGGCAT CGAGGAAGGC AACGACGGCA ACCAGATCAT CCAATCCATG 
ATCGACAAGG ACATGTTTGG ACTGGGCGAT TTCCAGCTCA TCCCTTCCAG TGAGGCCGGG 
ATGCTCTCCC AGGTGCAGTC CTTCACCAAG GACGAACGCT GGATCGTCTT TCTGGGCTGG 
GCCCCGCACC ACATGAACGA AATGATCGAC ATGAAGTATT TGGACGGAAG TACATCAGAG 
ACCTTCGGCA AGAACGACGG TACGGCCACG GTCTACACCA TCGTGCGCGA CGGGTTTGTC 
GAAGAAAACA AAAATGTCGC CAAGTTTTTG AAAAACCTCA TCTTCCCCAT CTCCATGATG 
AACCAGATCA TGACCACCCT CCACGAAAAG GACGGGTTGA AACCCGTGGA TGCCGGCCTG 
GATTGGGTCA AGGCCCATCC AGAGGTCTAC AAGGGATGGC TGGAAGGCGT GACCACCATT 
TCCGGGGAAC CGGCTCTGCC GGCCTTTGAA CAATACCTGG AAACCGTCAA CTAA

Protein sequence

MSGFSKKVLV ALIAFAVLTM SASQVLAAKE VRFASVSWTG VTTKTELAVR ILRSLGYEAS 
NTMVSVPIAF KALDTGEADI FLGNWMPTQA TMANKYFDKG TIEPLVASMP GAKYTLAVPT 
YAYEGGLQHF KDIAKYADKL GNKIYGIEEG NDGNQIIQSM IDKDMFGLGD FQLIPSSEAG 
MLSQVQSFTK DERWIVFLGW APHHMNEMID MKYLDGSTSE TFGKNDGTAT VYTIVRDGFV 
EENKNVAKFL KNLIFPISMM NQIMTTLHEK DGLKPVDAGL DWVKAHPEVY KGWLEGVTTI 
SGEPALPAFE QYLETVN