Gene Dret_1199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1199
Symbol
ID	8419027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1410067
End bp	1411614
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	57%
IMG OID	645037774
Product	Bile acid:sodium symporter
Protein accession	YP_003198065
Protein GI	258405323
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAAAC TTCTATCGAG CATCAGTAAA CATCTGATTA TCGCTATCCC GGTCATGATG 
CTCCTGGGAT TCGTCTTCGG CATTGCTGTT GATGACGCCT CTGGGCTGAA GGGACTGATC 
ATCCCGTTCA CCTTCCTCAT GGTGTATCCC ATGATGGTCA ATCTGAAGAT CAAGAAGGTC 
TTCGAGGGAG GAGATGTCAA AGCCCAGCTC CTGACTCAGG CCATCAACTT CGGCATCATT 
CCCTTTGTCG CCTTCGGGTT GGGGATGCTC TTTTTCCGGG ATAGCCCGTA CATGGCCCTG 
GGGATGCTCC TGGCCGGGCT GGTTCCCACC AGCGGCATGA CGATTTCCTG GACCGGTTTT 
GCCAAGGGCA ATGTCGCCTC TGCAGTGAAG ATGACCGTTA TCGGCCTCAC CCTGGGTTCG 
CTGGCCACAC CGTTTTACGT CCAGTTCCTG ATGGGGGCCA GTCTTGAGGT CAATGTCATG 
GCGGTCATGA AACAGATCGT CATCATTGTC TTTATTCCCA TGCTGGCTGG ATTTTTGACC 
CAGCAGGGGC TGATCAAACG CTACGGACAG AAGGATTTCC AACAGAGTTG GGCCCCGAAA 
TTTCCGGCCC TGTCCACCCT TGGCGTCGTG GGCATCGTCT TTATTGCAAT GGCCCTGAAG 
GCCAAGGCTA TTGCCGGCGC TCCCCAGATG CTGCTGTATA TTCTCATCCC GCTGACAATT 
ATCTACGCTT TTAACTATGT GCTGAGCACC GTCATCGGCA TCAAATTCCT GTCCCGTGGC 
GACGGCATCG CCTTGGTCTA CGGCTCGGTG ATGCGTAATC TCTCCATCGC CCTGGCCATC 
GCCATCAACG CCTTCGGCCC CGAGGGGTCC AGCGCCGCCC TGGTCATTGC CGTGGCCTAT 
ATCATTCAGG TGCAATCCGC AGCCTGGTAC GTAAAATTTT CCGACGCCAT TTTTGGCGCG 
CCCGCTGAAG CCGAAGCGCA GGCCGAAAAA ACCGCCGCTC CGACCCCGGG CAAGGAAACA 
GAACACGAGC TGCTGGTGCC GGATTTCAAG AATATCCTCT ACGTCACCGA CCTCTCGCAA 
AGCGCAAAGC ACGCCGCACA ATACGCCTGC AGCCTCGGGG TGAAATATTC CGCCCAGGTG 
ACGGTTATGC ACGTCGTGCC CGATCAGCTT GAGGAGTATT CGGAAAATGT CGGGGTGGAC 
ATCACCCACC GCGTGGATCA GCAGACCCGG ACCGCTTTCA ACGAATCCAG CGTGAGCGAA 
GCCCAGCAAG CGATCCGTTC CCGGATCGAA TCTACATCCA AAGAAGTGAC CAAGCAGATC 
CCCTACTGTC CGATGACTCC GGAGAATATC CGCATCGAAG TTGGGGATCC CCAGAACAAA 
ATTGTCGAAA TCGCCCGCAA GGAGGGCTTC GATCTGATCA TCATCGGCAC CCACGGCCAC 
GGCGCGTTCG AAGACGCCTT TCTGGGCAGT GTGGCCCGGG ATGTCATCCG CAAGAGTCCC 
GTGCCAGTGC TCTCGGTGCG CCTTGCGGAC GCGGCCCACT CACGGTGA

Protein sequence

MWKLLSSISK HLIIAIPVMM LLGFVFGIAV DDASGLKGLI IPFTFLMVYP MMVNLKIKKV 
FEGGDVKAQL LTQAINFGII PFVAFGLGML FFRDSPYMAL GMLLAGLVPT SGMTISWTGF 
AKGNVASAVK MTVIGLTLGS LATPFYVQFL MGASLEVNVM AVMKQIVIIV FIPMLAGFLT 
QQGLIKRYGQ KDFQQSWAPK FPALSTLGVV GIVFIAMALK AKAIAGAPQM LLYILIPLTI 
IYAFNYVLST VIGIKFLSRG DGIALVYGSV MRNLSIALAI AINAFGPEGS SAALVIAVAY 
IIQVQSAAWY VKFSDAIFGA PAEAEAQAEK TAAPTPGKET EHELLVPDFK NILYVTDLSQ 
SAKHAAQYAC SLGVKYSAQV TVMHVVPDQL EEYSENVGVD ITHRVDQQTR TAFNESSVSE 
AQQAIRSRIE STSKEVTKQI PYCPMTPENI RIEVGDPQNK IVEIARKEGF DLIIIGTHGH 
GAFEDAFLGS VARDVIRKSP VPVLSVRLAD AAHSR