Gene Dret_0259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0259
Symbol
ID	8418063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	320851
End bp	321921
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	54%
IMG OID	645036824
Product	protein of unknown function UPF0118
Protein accession	YP_003197139
Protein GI	258404397
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCTCA TCCGCGAATG GTTTCGCCGC CACTTTTCCG ACCCCCAGGT CGTCATTTTG 
GCCTTGATTC TGATCAGCTG CATCCTGCTG ATCATGACGG TGGGCGATCT CATCGCACCG 
GTGCTGGCCA GCGTGGTCCT GGCCTACCTT CTGGAGGGAC TGGTCCGTTT TCTGGAAAAC 
CGCCGCGTCC CGCGCATGCT CGCCGTGTGC CTCGTTTTTC TCATATTCGT CTTTTTTCTC 
TTTTTTCTTG TACTTGGATT GTTACCGCTG CTGTCGCAAC AGATTGTGCA ATTTTTTCAG 
GAACTGCCGT CCATGCTCGC TGCTGGCCAA CGTGAACTCA TGCGTCTGCC GGAGCGCTAT 
CCGAAATTTA TCACCGAAGA CCAGATCCTG GATGTGGTCG CTGCCCTGAA ATCCCAGCTC 
ACCGGTCTGG GGCAACGGGT GCTCTCCATT TCCCTGGCCT CCGTCCGGTC GCTGTTTAAT 
CTGCTGATTT ATATGATCCT GGTCCCGATC ATGGTTTTTT TCTTCCTGAA GGATAAATCC 
AAGATCATCA ATTACATCAA GATGTTCATG CCCAAAGACT ATACCCTGAC CCGCCGGATC 
TGGCACGACG TCGACCGCCA GATCGGCAAT TTCGTCCGGG GCAAAGTCTG GGAGATCCTC 
ATTGTCTGGG GCGCGGCCTA CGGCCTGTTT CTGATCATCG ACCTCAACTA TGCTATTTTA 
CTTAGCTTTC TTGTTGGGAT ATCCGTCATC GTGCCCTATG TCGGCGCCAC GGTCATGACC 
CTGCCCGTGG CCCTGGTCGC CTACTTCCAA TGGGGTTGGG GGCAGGAATT TATCTACGCT 
ATCATCGGGT ACACCATTTT GCAGATTCTG GACGGCAACC TGCTCGTGCC CCTTTTGCTC 
AGTGAAGTGG TCAATCTCCA TCCTGTGGCC ATCATTGTGG CCATCCTCTT TTTCGGAGGC 
ATCTGGGGCT TTTGGGGGGT CTTTTTTGCC ATTCCCCTGG CCACTTTGGT CCAATCTATC 
ATCAACGCCT GGCCTCGCGC TGGCCAGCCC CAGCCGCCGG CCCCAAAATA A

Protein sequence

MNLIREWFRR HFSDPQVVIL ALILISCILL IMTVGDLIAP VLASVVLAYL LEGLVRFLEN 
RRVPRMLAVC LVFLIFVFFL FFLVLGLLPL LSQQIVQFFQ ELPSMLAAGQ RELMRLPERY 
PKFITEDQIL DVVAALKSQL TGLGQRVLSI SLASVRSLFN LLIYMILVPI MVFFFLKDKS 
KIINYIKMFM PKDYTLTRRI WHDVDRQIGN FVRGKVWEIL IVWGAAYGLF LIIDLNYAIL 
LSFLVGISVI VPYVGATVMT LPVALVAYFQ WGWGQEFIYA IIGYTILQIL DGNLLVPLLL 
SEVVNLHPVA IIVAILFFGG IWGFWGVFFA IPLATLVQSI INAWPRAGQP QPPAPK