Gene Dret_0073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0073
Symbol
ID	8417877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	94117
End bp	95109
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	56%
IMG OID	645036638
Product	Extracellular solute-binding protein
Protein accession	YP_003196953
Protein GI	258404211
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.303636
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGG CGCTTTGGAC GGTATTTATC GTCGGACTTG CCCTGAGCCT CTGTACTGCG 
GCTCAGGCCC GGACCTGGAA AGTGTCCCAC GTTCGCCCCC AGGACACTGC CATTGACAAA 
GATCTCAACG CTTTCGTGCA GGACGTTGAC GAGGCCACCA ACGGAAAAAT CAACATCAAA 
GTTTACGCTG CCAGTTCCTT GGGTGACTAC ACCGTCGTGC AGGAACGGGT CGGCCTCGGC 
GCTGTGGAAA TGGCCTGCCA GCCCCCGGCG ACCGGTGCGG ACAAGCGGTT TCAGATCCAA 
TACTTCCCAT ACTTGGTGAA AAACTACGAC CAAGCCAAGA AGAATTTTGG CCCTGACGGC 
CCCTTGCGCA AAGAAATCGG CAAGCTCTAC GGTGAGCAGG GCATCGAACT TCTGGCTGCC 
TGGCCGGTGT ACTTCGGCGG CATCGCCCTG AAAGAAGAAC CCAAGAACCC CGGTGACCCC 
ACGGCCAAAA AAGGTCTCAA GGTCCGCGTT CCGCCCATGA AGACCTTCCA GATGCTGGCC 
AATAACATTG GCTACATGGC GACACCGCTG CCGTTCTCGG AAGCCTTCAC CGCCGTGCAA 
ACCGGTGTTG TCGACGGCGT GATCGGTTCC GGTGCTGAAG GGTACTATGC TTCCTTCCGC 
GACGTGACCA ACTACTATGT CCCGATGAAC ACCCACTTTG AAGTCTGGTA CCTCATCGCC 
AATGAACGCA TGGTGGAAGG GCTGGACAAG GACGAAATGG CTGGCTTGAA AGCCGCTGCC 
CAGCGCTTTG AAGAAAACCG CTGGGACCAA GTGGTCGAAG ACCAGAAGAA AAATGAACAG 
CGCCTGGCTG ATTACGGTGC TGAAATCATC GAAATTACTC CTGAAGACCT GACGAAGACC 
GCCGAAATCG TGCGCGAAAA CGTCTGGCCT GAAATCCTGA GCGACGTTGG CACCGAATGG 
GGCCAATCCG TTCTGGATAA CATCAAGGAG TAG

Protein sequence

MKKALWTVFI VGLALSLCTA AQARTWKVSH VRPQDTAIDK DLNAFVQDVD EATNGKINIK 
VYAASSLGDY TVVQERVGLG AVEMACQPPA TGADKRFQIQ YFPYLVKNYD QAKKNFGPDG 
PLRKEIGKLY GEQGIELLAA WPVYFGGIAL KEEPKNPGDP TAKKGLKVRV PPMKTFQMLA 
NNIGYMATPL PFSEAFTAVQ TGVVDGVIGS GAEGYYASFR DVTNYYVPMN THFEVWYLIA 
NERMVEGLDK DEMAGLKAAA QRFEENRWDQ VVEDQKKNEQ RLADYGAEII EITPEDLTKT 
AEIVRENVWP EILSDVGTEW GQSVLDNIKE