Gene Dret_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1033
Symbol
ID	8418856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1216265
End bp	1217332
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID	645037603
Product	DRTGG domain protein
Protein accession	YP_003197899
Protein GI	258405157
COG category	[R] General function prediction only
COG ID	[COG0857] BioD-like N-terminal domain of phosphotransacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00622763
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGGAT TGTACATTGG GTCCACAAGC GGATTTGCGG GCAAAAACAT GGTGACCATG 
GCCCTGGGGC TGCATTTGCA GAAGGAGGGT CATCTTGTCG GCTATATGAA GCCGATCGGA 
GCGGTTCCGA GCAAAGGCAA CTCCCGGGAA GGCGATGCCG ACGCCTTTTT TGTCCAGGAT 
GTCCTCGGGC TCCAGGAAGA CCCTAACCTG GTCACTCCGG TCCTGGTGAC TGAAGAATTC 
AAGCGCGAGG CCTTTACCAG CTCCTGCCCC CAATTGTTGT CACGGGTGCA AACGGCCTAT 
GAAACCCTGG AAAAGGGCAA GGATCTCGTC CTTGTCGGCG GGTCCGGCAG TTTCCTGTAC 
TCCGGAAAAT ACTGCGGCGT CGACGGCCTT AGCGTCAGCA CCGGGCTCAA GACCAAAGTT 
CTGCTGATCG ACCGCTTCCG CAGTGAATGC AACTACGATT ATCTGTTAAC GGCCAAGGAA 
CTGTTGGGAG ACCGGTTGAT CGGTGTGATC CTCAATGACA TCCCTGCAGC GCAGATGGGC 
GAATTACAAG GTGGTGTCGT CCCCCTGCTG GAGCGTCAGG GTGTCCCCGT GCTCGGTCTC 
ATCCCCCACG ACCCACTCAT GGGGGCCATT AAAATCGCCG ATCTCGCTGA ACGCCTGGGC 
GGACGGATTA TTTCCGCTCC TGGTAAAGCG GACCGGGTCA TTGAGAACTT CCTCATCGGC 
ACCATGCAGG TCGAAAATTT TATGACCCAC TTCCGCCGGC ACCAGAATTC AGCGATTCTC 
GTTGGCGGCG ACCGATCCGA TTTGCAGTTG GTGGCCCTGG AAGGCAAATG CCCTTGCCTC 
ATATTGACTG GCAACCTGTA CCCCAATGAT ATCATCCTCA CTCGCTCTGA AGTCCTGGAA 
ACCCCGCTCA TCGTCGTTCG TGAAGACACC TATAGCGTGG CCCAGAAAAT GGAGCGCATT 
CTCGGCTCCG TCAAATTGCG GGACATGATC AAAATCAACC ACGGCGCCCA ACTCGTCAAC 
AGCGCTGTCG ATTTCGCGGC CATCAAACGG GCCCTGCAAC TCCAGTAA

Protein sequence

MPGLYIGSTS GFAGKNMVTM ALGLHLQKEG HLVGYMKPIG AVPSKGNSRE GDADAFFVQD 
VLGLQEDPNL VTPVLVTEEF KREAFTSSCP QLLSRVQTAY ETLEKGKDLV LVGGSGSFLY 
SGKYCGVDGL SVSTGLKTKV LLIDRFRSEC NYDYLLTAKE LLGDRLIGVI LNDIPAAQMG 
ELQGGVVPLL ERQGVPVLGL IPHDPLMGAI KIADLAERLG GRIISAPGKA DRVIENFLIG 
TMQVENFMTH FRRHQNSAIL VGGDRSDLQL VALEGKCPCL ILTGNLYPND IILTRSEVLE 
TPLIVVREDT YSVAQKMERI LGSVKLRDMI KINHGAQLVN SAVDFAAIKR ALQLQ