Gene Dret_0557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0557
Symbol
ID	8418369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	669390
End bp	670364
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	55%
IMG OID	645037125
Product	Extracellular solute-binding protein
Protein accession	YP_003197432
Protein GI	258404690
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCGGA AATTGATCTG TTTTCTCGGA ATCAGCCTCG CGTTAGCCGC CCCAGCGTAT 
GGCGCCGCCA TGAAAATGAA TTGCAATGCT ATTTATCCAG CGTCGAATTT CCACACCCAA 
GGTGCTGAGC ATTTCGCCGA ATTGGTCCAC AAATATACTG ACGGCGATAT CCAGATCACG 
GTCCACTCCG GCGGGAGTCT GGGGTTTGAA GGCAGCGAAC TGCTCAAAGC TGTCAAGGAC 
GCCTCCGTGC CCATGTCGGA TATCCTGATG GGCGTGGTTG CCGGCAGTGA AGAAATTTTC 
GGTTTGAGCA CATACCCGCG GATCGTCAGT TCGTATGCCG AGGCACGGGA ATTGTATGAG 
GCTGCATTGC CTGCGTACAA AAAAGCCTGC CAAAAATGGA ACCAAAAATT CCTGTACGCC 
GCTCCGTGGC CGCCCAGCGG TCTTTTCAGC CAGTCCAAGG TTCAATCCGC TGCGGATATC 
GATGGACTCA AGACCAGGAC CTACGACAAG AATGGAGCGC AATTCTTGAA GAAGCTTGGC 
GGCAACCCGG TGTCCATGCC CTGGGGCGAG GTGCCGTCGG CTCTGAATAC CGGTCTGATC 
GATTCCGTTT TGACCTCGGC TACCTCCGGC AAGGACGGCA AGTTCTGGGA AGTCCTGGAC 
CATTTCACCG CGCTGCATTT CGCGTATCCG CTCAATATGC TGACCATCAA TATGGACTAT 
TGGAACGCCT TGTCCGCTGA ACAGCAGTCG GCGTTGGAAA AAGCGGCCGC AGAGACCGAG 
TCCTTCCAGT GGGAAGCTTC GAAAAAGAGC AATCGTGACT CGTTGAAGGT CTTGGAGGAC 
AACGGCCTGC GAATCACTGA GGTGGATGCG GCTCTGGCCG AAAAATTGGA CGCGGCTGCC 
GCGGACATTT TTGAGGAATT CAAAGCCGAG GCGGACGAAG ATACCAAAAA GGCCCTTCAG 
GCCATCGGGA TGTAA

Protein sequence

MLRKLICFLG ISLALAAPAY GAAMKMNCNA IYPASNFHTQ GAEHFAELVH KYTDGDIQIT 
VHSGGSLGFE GSELLKAVKD ASVPMSDILM GVVAGSEEIF GLSTYPRIVS SYAEARELYE 
AALPAYKKAC QKWNQKFLYA APWPPSGLFS QSKVQSAADI DGLKTRTYDK NGAQFLKKLG 
GNPVSMPWGE VPSALNTGLI DSVLTSATSG KDGKFWEVLD HFTALHFAYP LNMLTINMDY 
WNALSAEQQS ALEKAAAETE SFQWEASKKS NRDSLKVLED NGLRITEVDA ALAEKLDAAA 
ADIFEEFKAE ADEDTKKALQ AIGM