Gene Dret_2507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2507
Symbol
ID	8420369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013224
Strand	+
Start bp	3657
End bp	5123
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	44%
IMG OID	645039109
Product	hypothetical protein
Protein accession	YP_003199366
Protein GI	258406625
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	124
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGA AAAAAAGACG CTCCCTCTAC GACACATTAT CCGCACGGGA TAGCGGACAG 
GACGATGAGC TTCGAGAGAC ATTTAAACGT GTACGTGAAA TCAATACAAA ACAGTCCACT 
GAAACCACCC CTCCATCTGA GAACTCCAAT AAAAAAGTCC AAGCCCAAGA CAAGAGCCCA 
TCTGGACCGC TCATTCATAC CGCCCAAACA AACCGCTCAA ACATACCGAT TACTCATTCA 
GATCAACAAA GTAATAATAA AGAAAATAAC AAATCAAAAC AAGAATTTAA CAAAGATAGC 
CTTGGTGACA CAAACCGCTC ACCTAAAGCG CCCACAAATA CCGCTCAAAA CAACCGCTCA 
AGCAAAGCGC TCGCTAATAC CGCTCAGGTA GACCGCCCAA ACAAACCGCT CGAAAACAAC 
CATACCGCTC ATTTAAACAG CTCAAATGAA CCGTTTACTC GAGCGCTTCG AGCGCAATCA 
TTGAGCGGTA CTAATGAGCG GTATGCCCAA GCGGTACAAA TGAGCGGTTC AGAGGAGTCA 
CATGAGCCCA CTGAAGACCC TCAAAATATC CTCCTAAAAC CCAAATCTTC CATCAGATCT 
AGAAACCAAA AAAAGATTTT TGACTACCTT CAGCGGATTG GCTCCCAAAC GACCACCCTT 
ACATATATAT CTAATATTAC TGGTGTTCCG TACAGCACAA CGAGACGAAT AATAAGCAAA 
TTTAAAGCTG AAGGGCTTAT TTATTACAGA ACGCTGTTCG TTAAGGACGT AGGCTGGTGC 
GCAAAAATCT GGATAATAAA TTCAGAAGGC GAGACACCCA ACCGAGCGGT ACAAATGAGC 
GGCATAAATG GGCGGTATGA ATGGGCTGTA TCAAACGCCT CTAAGATAGA TAGAGAATCT 
ATCTATCTAA AAGAGGGGGG TGTGGGGGGA GATGGGCAAG ATCAACCTGA CAACTCATCC 
TCTTCTAGTG AGGCTCGTCT CAACCAGCTC ACCGACGAAG ATATTGCTTT CTTTTGGCCA 
AAGCTTCACC AATCTGGTTT TGGAGCTCAC CAGGTCCAGC AAATCGTTCA AAGACTTTCC 
AAGGTGGATA AAAAAGCCGA CAAAGTTATC CAGGGGCTTG ATCACGCTGA ATGGGAACTA 
GATCAGGGAA AGATGACTGA CAAAGAAGGT AATCCCGTAG GGAATCCATG TTCTTACGTG 
TTCAGTTCTC TAGCCAGAGA AGGCTATTAT CGTCGTCCAT CTGGATATAT TTCCCCGGAA 
GAACAAGCTG AGCTGGATGC CAAGGAAGAA GCTGATAGGC TGCAACAACT GGGGAAAGAG 
AAAAAGGAAT CTCAGTTTAA AGCATGGAAG GCAAATTTGT CGGAAGAGGA GTTAAATCAA 
ATTTTGGCTT GTAAAACTCA CAAAGGACCA ACGGATCCGT GGCTTAGGCA ATATTGGGAA 
AAGACTATTT ATTATACAAC AAAGTAA

Protein sequence

MAKKKRRSLY DTLSARDSGQ DDELRETFKR VREINTKQST ETTPPSENSN KKVQAQDKSP 
SGPLIHTAQT NRSNIPITHS DQQSNNKENN KSKQEFNKDS LGDTNRSPKA PTNTAQNNRS 
SKALANTAQV DRPNKPLENN HTAHLNSSNE PFTRALRAQS LSGTNERYAQ AVQMSGSEES 
HEPTEDPQNI LLKPKSSIRS RNQKKIFDYL QRIGSQTTTL TYISNITGVP YSTTRRIISK 
FKAEGLIYYR TLFVKDVGWC AKIWIINSEG ETPNRAVQMS GINGRYEWAV SNASKIDRES 
IYLKEGGVGG DGQDQPDNSS SSSEARLNQL TDEDIAFFWP KLHQSGFGAH QVQQIVQRLS 
KVDKKADKVI QGLDHAEWEL DQGKMTDKEG NPVGNPCSYV FSSLAREGYY RRPSGYISPE 
EQAELDAKEE ADRLQQLGKE KKESQFKAWK ANLSEEELNQ ILACKTHKGP TDPWLRQYWE 
KTIYYTTK