Gene Dret_2122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2122
Symbol
ID	8419972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2412990
End bp	2414219
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	57%
IMG OID	645038715
Product	putative ABC transporter solute-binding protein
Protein accession	YP_003198984
Protein GI	258406242
COG category	[R] General function prediction only
COG ID	[COG4134] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.708087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTGG TTTTTCGTTT TGGCCTGGTT GCAGGAGTAC TGGGATGCCT GTTGTGCATT 
GCCGGATGCC AGCAAACAGC ATCCGAACCG GATTGGCGCA CAAAGGATTT TGAGCGCATT 
ATCGAGGCGG CCCGCGGCAC CACAGTGCGC TGGTACATGT ACGGTGGCTG GCCCCATGTC 
AATGAATGGG TCGATACCTA TGTCGCCCCG GCCATGCAGG AGCGTTACGG AATCAGTGTC 
AAACGCGTTC CCATGAACGC GCCTGTTTTT GTCAATAAAT TGATCAACGA AAAAAGTGCC 
GGCAAAGACC CCGGCACCAT TGATCTGGTC TGGATCAACG GCGAAAATTT TAAGGCCACC 
AAGAATGCAG GGGCCTTGTG GGGCCCCTTT GCTGAGCAGC TCCCGAATTG GCAGCGGTAT 
GTCGACCCTT CTACCGTGGC CCAGGACTTC GGCTTTCCCA CAAAGGGGTA TGAAGCCCCT 
TGGGGCCGGG CCCAATTCGT CTTGATCTAC GATGCCAAAC GCACGCCCAA TCCGCCGCGC 
TCAGCAGAAA GTCTGCGCCG ATGGATCCAG GACCACCCTG GCCGTTTCAC CTATCCACAA 
CCGCCGGATT TCACCGGATC GGCCTTTGTC CGTCAGCTCT TCTACGCCAC CACAGGTGGG 
CACGAACAGT ATATGGACGG CTTCAACGCT ACCTTGTACG CTCGAAACGC CCCCCGCCTC 
TGGGAGTATC TCAACGGGAT CGAGCCGTCA TTATGGCAAC AAGGCCGGAC ATACCCCCAA 
AGCTCTGCAA CTCTGGACAC CTTGTTCGCC AGAGGCGAAG TCGATTTCAG TATGTCCTAC 
CATCCGCCGC ACGCCCAAAA CAAAATCCTG GACGGCACTT TCCCCGCCAG CGTGCGGACG 
GTGGCATTGG CCAACAATTC GATTGCCAAC ACCCACTACA CGGCCATTCC CTTCAATGCC 
CCCAACAAAC CGGGGGCTAT GGTCCTGGCC AATTTTCTGC TCTCGCCCAC GGCCCAGCTC 
TCGAAATACA AGCCTGAAAA CTGGGGGGAT TTTCCGGCCA TTGATCTCGA CCGCCTGGAC 
CAGTCCCAAC GCCGACGCTT CGAGGATGTC GACCTCGGTC CGGCCACATT GAGCGCCGAG 
ACCCTGGCTG AGCACGCGGT CCCTGAAATT CCCATCGGCT ATCTGGAAGC CATTGAAGCC 
GATTGGAAGT CCCGAGTCCT GACCAATTGA

Protein sequence

MPLVFRFGLV AGVLGCLLCI AGCQQTASEP DWRTKDFERI IEAARGTTVR WYMYGGWPHV 
NEWVDTYVAP AMQERYGISV KRVPMNAPVF VNKLINEKSA GKDPGTIDLV WINGENFKAT 
KNAGALWGPF AEQLPNWQRY VDPSTVAQDF GFPTKGYEAP WGRAQFVLIY DAKRTPNPPR 
SAESLRRWIQ DHPGRFTYPQ PPDFTGSAFV RQLFYATTGG HEQYMDGFNA TLYARNAPRL 
WEYLNGIEPS LWQQGRTYPQ SSATLDTLFA RGEVDFSMSY HPPHAQNKIL DGTFPASVRT 
VALANNSIAN THYTAIPFNA PNKPGAMVLA NFLLSPTAQL SKYKPENWGD FPAIDLDRLD 
QSQRRRFEDV DLGPATLSAE TLAEHAVPEI PIGYLEAIEA DWKSRVLTN