Gene Dret_2099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2099
Symbol
ID	8419949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2388072
End bp	2389169
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	58%
IMG OID	645038692
Product	ABC transporter related
Protein accession	YP_003198961
Protein GI	258406219
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0897069
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAGAA TCGTCCTCGA AAACGTTTCC CACACCTACG ATACGAGCGA CCGGCCGGAT 
TCGGACAAGA CCTTTGCCGT TCAGGGGTTG GACATCTGTT GGGACAATGG GACCGCAAAT 
GCGTTGCTCG GCCCTTCGGG GTGCGGCAAG ACGACGCTTT TGAATATCAT TTCCGGCCTG 
TTGACCCCGT CGCAGGGCCG GGTCCTGATC GACGGCCGGG ATGTGACCAC CCAACAGCCC 
CGGGAGCGCA AGATCGCCCA GGTATTTCAG TTTCCGGTCG TGTATGACGC CATGAGCGTC 
TACGACAACC TCGCCTTTCC CCTGCGCAAC GCCAAATATC CCCGGCAGGA GATTGATGCC 
AAAGTCCGGG AGGTGGCCGA GATCCTGGAC CTGACAGATC TGCTCAAGGC CGCAGCTGCC 
AAGCTCAATC CCGCGGATAA ACAAAAAATT TCCCTGGGGC GCGGAATCGT GCGCGAGGAC 
ACGGCCGCGA TATTGCTCGA CGAGCCGCTG ACGGTCATCG ACCCGAAACT CAAATGGTAT 
TTGCGGCGCA AGCTCAAAGA GGTTCAGGAA GAACTCGGCA GGACGATGAT TTATGTCACC 
CATGACCAGC ATGAGGCGCT GACGTTTGCC GATCAGGTGA CCGTCATCCG GGACGGGGTT 
CTGGTTCAAA ACGGCACGCC CCAGGAACTT CACGATGAAC CGCAGGATCC CTTCATCGGC 
TATTTTATCG GCAGTCCGGG GATGAATTTC TTTGAATGCC ACCTGGAAGG GGAGCGCTTT 
GTCTGCCGCG ACCAGCTGAC ATTTCCGGTG CCCCAAGCAT GGCGGGATGT TGTGCGCGAT 
CATCAGGGCG AGCAATTTGG TCTTGGTATC CGCCCCGAGT TCGTTCACGT CCATCAGGAT 
GCGCAGCAAG GCGCCCCGTG CCAGGTTCAA GTCATCGAGG ATACGGGGGC GTACCGGATT 
TTCACGCTCT GGCAGGGAGA TATCCGGATC AAGGCTCGTG TCTCAGAGGC GGTGCGCCGT 
CAGGAGGGCG ATGAGGTTGG TGTCACGTTC AGAGAGGATA AAATGAAACT TTTCCAAGGC 
GCGAAACGCA TAATATGA

Protein sequence

MARIVLENVS HTYDTSDRPD SDKTFAVQGL DICWDNGTAN ALLGPSGCGK TTLLNIISGL 
LTPSQGRVLI DGRDVTTQQP RERKIAQVFQ FPVVYDAMSV YDNLAFPLRN AKYPRQEIDA 
KVREVAEILD LTDLLKAAAA KLNPADKQKI SLGRGIVRED TAAILLDEPL TVIDPKLKWY 
LRRKLKEVQE ELGRTMIYVT HDQHEALTFA DQVTVIRDGV LVQNGTPQEL HDEPQDPFIG 
YFIGSPGMNF FECHLEGERF VCRDQLTFPV PQAWRDVVRD HQGEQFGLGI RPEFVHVHQD 
AQQGAPCQVQ VIEDTGAYRI FTLWQGDIRI KARVSEAVRR QEGDEVGVTF REDKMKLFQG 
AKRII