Gene Dret_1055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1055
Symbol
ID	8418880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1246362
End bp	1247924
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	55%
IMG OID	645037627
Product	choline/carnitine/betaine transporter
Protein accession	YP_003197921
Protein GI	258405179
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.144567
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0392371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG ATCTGCGAAC AACGTCACGG CGCACGACGG CGACGTGGCA GAATCTGGAA 
AACAAGATAC TGAAATACGA TATACATCCA TGGGTGTTTT TCGGCGGCGG GGCGGTTATC 
ATCCTCGGCG TGGCTTTGAC CTTGATTGCA GGCGAGACGG CCTCGACCTT ATTCAGTTCC 
GTGCAGACCT GGATTGCCAC ATATACCGGT TTCTTTTTCG TGCTGGTCAT GAACGTGGTC 
CTGGTCTTCT GCTTTTTCCT CTTATTCACC AAAATGGCGT CGATGCGCAT CGGCGGAGAG 
GACGCTGAGC CGGAATTCTC CACCATGGGG TGGTTCGCCA TGCTTTTTAG TGCTGGAATG 
GGTATCGGGA TCCTTTTCTA CGGGGTGGCC GAACCCATGT TCCACTATGT GGCCAATCCC 
CTCTCAGAAC CCGGTTCTCC TGAAGCGGCG CGCATGGCCA TGGAATTGAC CTTCCTGCAT 
TGGGGCCTGC ACCCTTGGGG TATTTATGCC CTTGTCGGCC TCGGCCTCGC CTTCTTCGGC 
TTTTCCGAAG GACTACCGCT TTCCATCCGT AATATTTTCT ATCCCCTGCT TGGCGACAAA 
ATTTACGGCC CCATCGGTAA TTTGATCGAT GTCTTGGCCA CGGTGGCAAC GCTGTATGGG 
GTGGCGACTT CCCTGGGGCT CGGGGTCCAA CAGGTCAATG CCGGACTGGC CCATTTGTTT 
GGCATTCCGC AAAATCCCTG GGTTCAATGC GGCTTGATTG CCTTGATCAC CGCCATTGCG 
ACCTGGTCCG TCGTTCGCGG CCTGGACGCG GGCATCAAAT TTTTGAGTGA ATTGAACATG 
GCCGCCGCCG GGTTGCTGAT GCTCTTTGTC CTCTTGTTGG GGCCGACCCA ATTTATCCTT 
AACGGTATTT TGGAGAATAT TGGGAATTAT ATTCAGGATT TTGCGCATCT TGCCACCTGG 
AACGAGACCT ACACCAACGG CGAATGGCAA AACGGCTGGA CGGTTTTTTA CTGGGGCTGG 
TGGATCGCCT GGTCTCCGTT TGTGGGCATG TTCATCGCCC GGGTTTCCTA TGGCCGGACC 
ATCCGGGAAT ACCTGCTCGG CGTTCTGCTT GTTCCCGTCG CTGTGACCTT TGTCTGGATG 
ACCGTGTTCG GCAACAGTGC TTTGTTCATC GAGCATTTCG GGGCTGGGGG ACTGGCCAAG 
GCGGTACAGG AGAACATTCC TGTCTCCTTG TTTGTCTTTT TGGAACATTT TCCCTTGTCT 
ATGCTGACCT CCCTTTTGGC AGTCGTTGTC GTCATCACGT TTTTTGTGAC CTCCTCTGAC 
TCCGGGTCCA TGGTCATTGA CATCATCACC GCCGGAGGTA ACCCGGATCC GCCGACTCCG 
CAGCGCCTGT TCTGGGCCGT TTTGGAAGGC GTTGTCGCTG CGGTCCTGTT GCTCGGCGGC 
GGCCTGGTCG CCCTGCAGAC AGCCGCCATC ACAACCGGGT TGCCGTTTGC GGTGGTCATA 
TTGATGATGT GCTGGGCCGT GTATCGCGGT CTGCATGACC ATTGGATGCG CTACTACGAC 
TAA

Protein sequence

MSEDLRTTSR RTTATWQNLE NKILKYDIHP WVFFGGGAVI ILGVALTLIA GETASTLFSS 
VQTWIATYTG FFFVLVMNVV LVFCFFLLFT KMASMRIGGE DAEPEFSTMG WFAMLFSAGM 
GIGILFYGVA EPMFHYVANP LSEPGSPEAA RMAMELTFLH WGLHPWGIYA LVGLGLAFFG 
FSEGLPLSIR NIFYPLLGDK IYGPIGNLID VLATVATLYG VATSLGLGVQ QVNAGLAHLF 
GIPQNPWVQC GLIALITAIA TWSVVRGLDA GIKFLSELNM AAAGLLMLFV LLLGPTQFIL 
NGILENIGNY IQDFAHLATW NETYTNGEWQ NGWTVFYWGW WIAWSPFVGM FIARVSYGRT 
IREYLLGVLL VPVAVTFVWM TVFGNSALFI EHFGAGGLAK AVQENIPVSL FVFLEHFPLS 
MLTSLLAVVV VITFFVTSSD SGSMVIDIIT AGGNPDPPTP QRLFWAVLEG VVAAVLLLGG 
GLVALQTAAI TTGLPFAVVI LMMCWAVYRG LHDHWMRYYD