Gene Dret_2539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2539
Symbol
ID	8420415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013224
Strand	-
Start bp	30965
End bp	32182
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	38%
IMG OID	645039136
Product	protein of unknown function DUF262
Protein accession	YP_003199393
Protein GI	258406652
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00000000000000210562
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	124
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA CAAATGTGCC AATAATTTCA AACCAGACAA CTGCTCAAAA TGAGGCTGTT 
GAAACAATCT TGCGTCGATT TGAGGAAGAA GAGCTTTTTG TACCTCGATA CCAAAGAGAC 
TCTGACGAAT GGGATGAAAG CAGAAAGAGC TTATTTATTG AGTCTGTGCT TAACAGGTTG 
ACAGTTCCGG CTTTTTACTT GGCTCCCAGT GAAGATGACC CCGAGAGGCT GGAAATAGTG 
GATGGTCAGC AAAGAATAAT GGCTTTATAT AACTTTTTTA AGCATGCGTT TGAATTATGC 
AATGACGATC TATGCCCCTA TTTTGGGCCA AGCGTTGAGT ATGCAGGACG AAAATATGAA 
AATATGGATG ACGCTTGGAA AAGAGTTTTT AGAAGATACA ATTTAACAGT AGTTACTCTT 
CCACAGGGGA TGCCACTAGA ACTAAGGTTA GAAATATTCA GGCGAATAAA TGAAGGTGGC 
ACTCCACTTA GCCCTCAAGA TATACGACTT GGCTACTACA GTGATTCTGA AGAAGTAAAT 
TTCTGTCAAT TAGCTGGCAT ATTTGATATA GAAAAAAATG GTAGCCAGAG AAAGCTTAAT 
AGCTGTGAAA AATTATCGTG GCCTTGGGCT GATTACGATA AAGAAGCAGA AGAATGGAAA 
AAGTGGTGGG AAAACACGAA AACATCCACC GGCCAGACGG CTTCCGAAAT GTTTTTGTGG 
TTTATTGTGA GTTCATGCAA AAACAGTATA AAAAGCATAA TAAACAACAA GAACCATTTA 
ACTAAATCTC TAAATCTGAA TTTTAGAAAT AGCACAGCAG AAGTTTTAGA TATTATATGT 
GCGCAATGGA GGTTTCAATC TAAAAATAAA AACGTAACAA ATATTCTTCC TAAAAGTGAT 
ACATTAAAGG AGTCGTACTT TCCAGTTTTC GTTAAATGGT GGTATCGTTT TAGATGCATG 
TGTCCTGGAC AAGCAAACAT TAACAGGTAT AGGACCATCG CAATGTTTAT ACCTGCACTT 
GAAAATGCTT TTGGAGAAAG TGAAATAACT GAAGTCCAAT GGAGTTGGAT TTGCAACTTT 
ATTGGCAGCT CACGATCGAC TGCTAAGAAT TTAGGTGTTG ATTTTCCTGA ATCAAAAGGA 
AGGTGGTTAG GAAATCGAGG GCAAGAAGTG CAGTTAGATA GCTATTACAA AATAGCAAAA 
GCAATAAAGG CTAAATAA

Protein sequence

MSETNVPIIS NQTTAQNEAV ETILRRFEEE ELFVPRYQRD SDEWDESRKS LFIESVLNRL 
TVPAFYLAPS EDDPERLEIV DGQQRIMALY NFFKHAFELC NDDLCPYFGP SVEYAGRKYE 
NMDDAWKRVF RRYNLTVVTL PQGMPLELRL EIFRRINEGG TPLSPQDIRL GYYSDSEEVN 
FCQLAGIFDI EKNGSQRKLN SCEKLSWPWA DYDKEAEEWK KWWENTKTST GQTASEMFLW 
FIVSSCKNSI KSIINNKNHL TKSLNLNFRN STAEVLDIIC AQWRFQSKNK NVTNILPKSD 
TLKESYFPVF VKWWYRFRCM CPGQANINRY RTIAMFIPAL ENAFGESEIT EVQWSWICNF 
IGSSRSTAKN LGVDFPESKG RWLGNRGQEV QLDSYYKIAK AIKAK