Gene Dret_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2100
Symbol
ID	8419950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2389175
End bp	2390305
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	55%
IMG OID	645038693
Product	ABC transporter related
Protein accession	YP_003198962
Protein GI	258406220
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.134118
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAATAG TGGTTGAGTC GGTATCGAAG TCCTTTAGCG GGACGTTCGC CTTGAAGGAT 
GTCAGTGTCA GCATTGAAGA CGGGCAATTC GTCACCTTTC TGGGGCCGCT GGGCGCTGGC 
AAGACGACAT TGCTGCGGAT CATGTGTGGT ATTGACCGCC CGGATTCAGG ACGGATCTAT 
TATGACGGTC AGGACGTAAC CGATGTTGCG GTTCAGAAAC GGCCGGTAGC CATGGTCTAC 
CAGCAGTTTG TCAATTACCC TTCCATGACC CTGTATGAAA ATATTGCTTC GCCGTTGCGT 
GTCAGTCGGC GCAAATACTC GAAAGGGGAG ATCGAAAAAC GTGTCCATGA AAGTGCCGAT 
CTGTTGGGGA TCCGTCAGAT CCTGGGCCAC TATCCTGAAG AAGTCAGTGG CGGTCAGAAA 
CAACGCGCTG CCATCGCCCG CGCTCTGACC AAGGACGCCA AGTTTATTTT TTTGGACGAA 
CCGCTGGCCA ATCTGGACTA CAAGCTCAGA GAGGAGCTAC GCGGGGAATT GAAGGAAATC 
CTGCGGCGCA AAGGGGGCGT GGTGGTTTAT GCCACGCCTG AAGCTGTCGA CGCCCTGTCC 
ATGGCCTCCC ATGTGGGGTA TATCGAAAAC GGGCAACTCT GGCAGTACGG GGCCCTCAAA 
CACGTCTACC GGTATCCGCA ATTCAAAGAG GTCGGGCGGT ATTTCAGTTA TCCGACGATG 
AATATTTTGC CGGGGACGGT CGAAAAATAC GCCAAGGGGG CGGCACTTGT CCTCTCAGAT 
GATTTGCGGG TGGATGTCTC CCGCATTGCC GATCAGTTGG ACCAGGAGGT CTACCAGGTC 
GGTATCCGGG CCTATAATAT CAGCACGAGC AAGGAACATG CGGAGATGGT TCCATTTCAG 
GCCGAAGTGG AGCTTTCGGA GGAGTTGGGG TCTGATACAG AACTCCACGT GCGCCACAAC 
GGCCAAACCC TGGTCGTCTT GCTTCAGGAA TTCGCCCGCC ACGAGATCGG GCAAAAAGTG 
ACGCTCTACC TGGACAGTAC CCGCCTCTTT CTTTTTCATC CGCATACAAA CGAACTGGTG 
CTCAAGACAT TTCAGGAAAC CACGGCGACG TCAGCGGCCC AGGAGGCATG A

Protein sequence

MGIVVESVSK SFSGTFALKD VSVSIEDGQF VTFLGPLGAG KTTLLRIMCG IDRPDSGRIY 
YDGQDVTDVA VQKRPVAMVY QQFVNYPSMT LYENIASPLR VSRRKYSKGE IEKRVHESAD 
LLGIRQILGH YPEEVSGGQK QRAAIARALT KDAKFIFLDE PLANLDYKLR EELRGELKEI 
LRRKGGVVVY ATPEAVDALS MASHVGYIEN GQLWQYGALK HVYRYPQFKE VGRYFSYPTM 
NILPGTVEKY AKGAALVLSD DLRVDVSRIA DQLDQEVYQV GIRAYNISTS KEHAEMVPFQ 
AEVELSEELG SDTELHVRHN GQTLVVLLQE FARHEIGQKV TLYLDSTRLF LFHPHTNELV 
LKTFQETTAT SAAQEA