Gene Dret_1434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1434
Symbol
ID	8419263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1667300
End bp	1668508
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	61%
IMG OID	645038009
Product	domain of unknown function DUF1745
Protein accession	YP_003198299
Protein GI	258405557
COG category	[S] Function unknown
COG ID	[COG3287] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.318192
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.236861
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATTG CCACGGGATG GTCGACGCAG AAAATTGCCG GGCGAGCGGC ACGTGAAGCC 
ATGGCCGGAA TAGCGGCTGC AGGGGATCGC CATCCTGATT TCGTTCTCTG TGAGTTGACG 
GAAGACTATG ATGTCGAAGA GGTCCTGGCT CTATTGACCC AAACGTGGCC GGAGACGCCC 
GTGCACCTGG CCACAACCTG CCGCGGTGTC TTGTTGCGCC GGGGGTGGAC GAGCAGTGCG 
GGACGGGTGC TTGGATTGTG GAGTGTTTTC GATGCCCAGG GGGCTTTCGG CACCGGCGGC 
GTGCCTCTTG AGGATCGTCC GAGTGCGGCC GCAGCTCTGG CGACCCGGCA GGCCCTGGAT 
CAGGCCGGAC GAGCCGGGGA GTTGCCCTCG TTGATCTGGA TCAGCACCGC GCCGGGGTGC 
GAGGAACAGG TCCTGGCCGG TATCGAATCC GAAGTGGGCA CCAATGTTCC CATTCTGGGC 
GGGAGCACTG CTGACAACGA TGTCCTGGGG CGCTGGTCCC AGGGGACCAA AGCCGGAACG 
ATGTCCAACG GCGTGGTCGT CTCGGTGTTT TTTCCCTCGG TGGAGATCGG CTATTCCTAC 
CACAATGGGT ATCTGCCCCA GGCCCAGTCC GGTACCGCCA CTGAAGCCGA GGGGCGCCTG 
ATTCGCTCCA TTGACGGCCG CCCAGCTGCA GAAGTGTATA ACGAGTGGAC CCAGGGTTTG 
ATCGGGCCGA CTTTGTCCGA AGGCGGCAAT ATCTTTGACA AGACGACGTT TTGGCCTCTG 
GGACGGGTGC GGGGATGGCT GAACAACATC CCGCTCTATG TTTTGGCTCA TCCTGAGCGG 
GCCGAGCCAG ACGGGGCTTT GCGACTGTTT GCCGATGTTG AACAAGGCGA AACAGTGGTT 
TTGATGTCCG GGACGCGCAA TGGTCTCATC CGGCGGGCGG GGCGGGTGGC CGAAAGCGCG 
CTGGACAGCC TGGACGTGCT GCCTTCTCAG ATTTCTGGTG CGTTGGTGAT CTTTTGCGCC 
GGTTCGATGG TTGCCATCGA GGAGCATATC GATGAAGTGG CGCAATCCAT TCACCAGGTC 
CTGGGCGATG TCCCCTATCT TGGCTGTTTT ACATTCGGTG AGCAGGGGCG GCTCGTGGGC 
GGGGGCAACC ACCACGGCAA TTTGATGATT TCCGTGGTCG TCTTCAGTGA TCAGGAGGCG 
GTTTTTTGA

Protein sequence

MQIATGWSTQ KIAGRAAREA MAGIAAAGDR HPDFVLCELT EDYDVEEVLA LLTQTWPETP 
VHLATTCRGV LLRRGWTSSA GRVLGLWSVF DAQGAFGTGG VPLEDRPSAA AALATRQALD 
QAGRAGELPS LIWISTAPGC EEQVLAGIES EVGTNVPILG GSTADNDVLG RWSQGTKAGT 
MSNGVVVSVF FPSVEIGYSY HNGYLPQAQS GTATEAEGRL IRSIDGRPAA EVYNEWTQGL 
IGPTLSEGGN IFDKTTFWPL GRVRGWLNNI PLYVLAHPER AEPDGALRLF ADVEQGETVV 
LMSGTRNGLI RRAGRVAESA LDSLDVLPSQ ISGALVIFCA GSMVAIEEHI DEVAQSIHQV 
LGDVPYLGCF TFGEQGRLVG GGNHHGNLMI SVVVFSDQEA VF