Gene Dret_1361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1361
Symbol
ID	8419190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1588922
End bp	1590472
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	56%
IMG OID	645037937
Product	extracellular solute-binding protein family 5
Protein accession	YP_003198227
Protein GI	258405485
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000166548
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.279813
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGGG TCCTATGTAT TTTGAGTGTG CTGATTTTCA GCATACTCCT GGTCGGGAGT 
GTTCAGGCGA AGACGTTGCG CTTAGCCATG GACGCAGATC CCTATTCCTT GGATCCCCAT 
GTGCAGCTGT CTGGCGGCAT GCTCCAGTAT TCCCATCTGG TCTTTGACCC GTTGGTGCGC 
TGGACCAAGG ATATGGAATT CGAACCCCGC CTGGCCACGA GCTGGGAACG TATCGATGCG 
ACCACCATGC GCTTCCACCT GCGCGAAGGG GTCACCTTCC ATTCCGGCAA CCCGTTTACG 
GCCAAGGATG TTGTCTGGAC ATTGAAACGC TTAAAGAAAA GCCCGGATTT CAAAGGCTTG 
TTTGAACCAT TCGAGGGAGC CAAAGCGGTG GACCAATACA CCGTGGATGT GGTGACCAAA 
AAACCTTATC CTTTGCTGTT GAACATGGCG ACCTATATTT TCCCCATGGA CAGCGAGTTC 
TACACCGGTG AGGACAAGAA CGGCAATCCG AAGGACGCGA TCAAGAAGAT CGGCTACACC 
TTTGCCAACA CCCACGAGTC CGGTACCGGG AAGTACAAGG TTGTTGAGCG GCAGCAGGGC 
GTCAAGGTCG TCTACGAGGC CTACGACAAC TATTGGGACG AGGACAGCGG CAATGTCGAC 
AAGATTATCC TCACGCCGAT CAAAAAGGAC TCCACCCGCG TGGCGGCCCT TCTTTCCGGC 
GACGTGGATT TCATCATGCC TGTGCCGCCG CAGGATTACG ACCGGCTGGA AAAACGGGAT 
GGCATCGATC TGGTGACCAT GTCCGGTAGC CGGGTGATCA CGTTCCAGCT GAACCAGGAA 
CGCCGCCCTG AATTTGCGAA CAAGAAAGTG CGCCAGGCCA TTGTCCATGC CGTGAACAAC 
GTCGGCATTG CCCAGAAGAT CATGGAAGGC CGGGCCACTC CGGCCGCGCA GCAGGCCCCG 
GAAGGGTTTG CCAGCTACCA GCCTGAGCTG ACGCCGCGCC ACGATGTGGC CAAGGCCAAG 
GAACTCATGA AGGAAGCCGG CTATCCCGAC GGCTTTGAGT GCTCCATGAT TGCCCCGAAC 
AATCGGTACG TCAAAGACGA AAAGATCGCT CAGGCTGTGG CGGCCATGCT CTCCAAGATC 
GGGATCAAGG CCAATCTGAC CACCATGCCC AAGGCCCAGT ACTGGAACAA GTTCGACGCC 
CAGGTGGCCG ACATTCAAAT GATCGGCTGG CACCCGGACA CCGAGGATTC GGCCAATTAC 
ACCGAATTCC TGCTCATGTG CCCGAACAAG GAAACCGGAT ACGGCCAATA CAACAGCGGC 
AACTACTGCA ACAAGGAAGT CGATCAGTTC ATTCTGGACG CCCAGACCGA GACCGATCAG 
GAGAAGCGGA CCGCCATGCT GAAGAAGGTG GAGCGGATCC TCTATGAAGA TGCTGCGTTC 
GTGCCCTTGC ACTGGCAGCA CCTCTCCTGG GCCGGCAAGG ACAATCTGAA GATCGAGCCC 
ATCGTGAATA AGCAGAATTT CCCATATTTC GGGGACCTGG TTATCCAGTA A

Protein sequence

MKRVLCILSV LIFSILLVGS VQAKTLRLAM DADPYSLDPH VQLSGGMLQY SHLVFDPLVR 
WTKDMEFEPR LATSWERIDA TTMRFHLREG VTFHSGNPFT AKDVVWTLKR LKKSPDFKGL 
FEPFEGAKAV DQYTVDVVTK KPYPLLLNMA TYIFPMDSEF YTGEDKNGNP KDAIKKIGYT 
FANTHESGTG KYKVVERQQG VKVVYEAYDN YWDEDSGNVD KIILTPIKKD STRVAALLSG 
DVDFIMPVPP QDYDRLEKRD GIDLVTMSGS RVITFQLNQE RRPEFANKKV RQAIVHAVNN 
VGIAQKIMEG RATPAAQQAP EGFASYQPEL TPRHDVAKAK ELMKEAGYPD GFECSMIAPN 
NRYVKDEKIA QAVAAMLSKI GIKANLTTMP KAQYWNKFDA QVADIQMIGW HPDTEDSANY 
TEFLLMCPNK ETGYGQYNSG NYCNKEVDQF ILDAQTETDQ EKRTAMLKKV ERILYEDAAF 
VPLHWQHLSW AGKDNLKIEP IVNKQNFPYF GDLVIQ