Gene Dret_2095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2095
Symbol
ID	8419945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2384042
End bp	2385751
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	57%
IMG OID	645038688
Product	ABC-type sugar transport system, periplasmic component
Protein accession	YP_003198957
Protein GI	258406215
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.105917
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATGCA AACGTCGGGT GGGTTTGGCC GTTCAACTGG TCATTGCCCT AGCTTTGTTG 
GTCCCCGCCT CCGCAGGGGC CCAGGATACC ATTGGAAAGT GGGTCGACGT CTTTCAACCC 
TCGGTGCTGA ACCAAAAGCA GCAACGCCAG GAATTGGAAT GGTTCAAACA GGCGGCCGAG 
CCGATGCAGG GCCTGGAAAT CAAATCCGTG GCCGAAGGCA TCACCACCCA TAAATGGGAG 
GCCAAGGTCT TGGCCCAGGC CTTTTATGAA ATCACCGGCA TCAAGGTCAC CCATGACATC 
ATTGGCGAAG GTGAGGTTGT CGACCGGGTC CAGCGCCAGA TCCAGACCCA ACGGAAGATT 
TACGATATCT ACGTCAACGA TGCTGATTTG ATCGGTACCC ATCTCCGCCT CGACAGTGCC 
CTGAACCTCA GCGACTACAT GAAAGGTGAA GGCGCTGAGG TCACTAACCC CATGCTGGAT 
CTGGACGATT TCCTGAACCC GGAATTCGGC CAGGATTATG ACGGCAACCA ACTCCAATTG 
CCGGACCAGC AATTCGCCAA CCTGTATTGG TTTCGCTACG ACTGGTTCAC CGACCCGAAG 
TACAAAAAAG AGTTCCAGGA TGAATACGGC TATGAACTCG GCGTGCCCGT GAACTGGGCT 
GCCTATGAGG ACATTGCCGA GTTCTTCACC GGCAAGACCA TCGATGGACA GACCGTGTAT 
GGCCATATGG ATTATGGCAA GAAATCCCCG TCTTTGGGCT GGCGGTTTAC CGACGCTTGG 
CTGTCTATTG CCGGTGTCGG AGATAAAGGG CTGCCCAACG GGTACCCCGT GGATGAATGG 
GGCATCCGGG TCGACGGCAA AACCCCTGTG GGGGCCAGTG TTGAGCGTGG TGGTGCGGCC 
AATAGTCCGG CCGCGGTCTA CGCGACGACC AAGTATGTCG AATGGCTCAA GAAGTACGCT 
CCCCCCTACG CCGCTTCCAT GACCTGGTCT GAAGCAGGGC CAACCCCTGC CCGCGGCAAT 
GTGGCGCAGC GGGTTTTCCA GTACATCACC TGGCTCTCCG ACCCGGCCTT CAATTCACCG 
GACAGCCCGG TCACAGACGC TACCGGCAAG CCGGTCTGGC GTGTGGCCCC GACACCGCAC 
GGCAAATACT GGGATGAAGG AATGAAGGTT GGCTATCAGG ATGCCGGCAG TTGGACGATC 
CTGAAGGACA GTGTGACAGG AAAGTACCGC AAGGCCGCTT GGCTGTGGGC CCAATTCTGC 
GTGTCCAAGT CGGTGTGTCT GAAGAAATTC CTCGTGGGTC GCACCCCCAT CCGGAAATCC 
ACGGTTTTTT CCGATTACCT GGCCAAGGAA GAGGAAAAAG GGACGTACGG CGGAATCGTG 
ACCTTCTACA AGTCCCCGGT GGAGCATATG TGGACCGACT CCGGGCCGAA TGTGCCCCAT 
TATCCGCTTC TGGCCGAGCA GTGGTGGAAA AATGTCGCCC TGGCCGTTAC CGGTGAAGCC 
ACACCCCAGG AAGCGATGGA CAGTTTGGCC TATAAAATGG ACGACCTGAT GGGGAAAATG 
CGGCTCAACC AGTATTCTCC GAAACTCAAT CCCAAAAAGT CCCGGGAATA TTGGCTTTCC 
CAGCCCGGCT CACCCAAGCC GGTCCGCTCC GAAGAAGAGC CGGAAACCAT GCCCTATGAC 
GAAATGCTGA AGAAATGGAA GAACCAATAG

Protein sequence

MVCKRRVGLA VQLVIALALL VPASAGAQDT IGKWVDVFQP SVLNQKQQRQ ELEWFKQAAE 
PMQGLEIKSV AEGITTHKWE AKVLAQAFYE ITGIKVTHDI IGEGEVVDRV QRQIQTQRKI 
YDIYVNDADL IGTHLRLDSA LNLSDYMKGE GAEVTNPMLD LDDFLNPEFG QDYDGNQLQL 
PDQQFANLYW FRYDWFTDPK YKKEFQDEYG YELGVPVNWA AYEDIAEFFT GKTIDGQTVY 
GHMDYGKKSP SLGWRFTDAW LSIAGVGDKG LPNGYPVDEW GIRVDGKTPV GASVERGGAA 
NSPAAVYATT KYVEWLKKYA PPYAASMTWS EAGPTPARGN VAQRVFQYIT WLSDPAFNSP 
DSPVTDATGK PVWRVAPTPH GKYWDEGMKV GYQDAGSWTI LKDSVTGKYR KAAWLWAQFC 
VSKSVCLKKF LVGRTPIRKS TVFSDYLAKE EEKGTYGGIV TFYKSPVEHM WTDSGPNVPH 
YPLLAEQWWK NVALAVTGEA TPQEAMDSLA YKMDDLMGKM RLNQYSPKLN PKKSREYWLS 
QPGSPKPVRS EEEPETMPYD EMLKKWKNQ