Gene Dret_0291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0291
Symbol
ID	8418095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	360297
End bp	361427
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	60%
IMG OID	645036856
Product	glycosyl transferase group 1
Protein accession	YP_003197171
Protein GI	258404429
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTTCCG GTACATCGCC TCAACGTATC GCTCTCATGC TCCCCAGACT GAGCCGCTAC 
GGCGGGGCGG AACGTTTTGC CTCGCGCTTA GCCAACCATT TGGGTCAAAC CGGGTTTGAC 
GTGGACTTTA TCTGCGCCCG GCAGGAATCA GAAGCGCCCC AAGGCGTGAC CCCCAGGGTG 
GTTGGTCGCA AGGGGCTCTG CCGCAGCGGC AAGATCCTCT GGTATGCCAT GGCGGCAGAA 
CGGCAGCGCC GGGCAGGGAA CTACGACCTC ACCTTGAGCA TGGGCAAGAC CTGGAACCAG 
GATGTCTTAC GTTTGAGCGG CGGGCCGCTG CCCGTATTCT GGCGTCTGTC CAAACAAGCC 
TACGACCCGG GTATGGCTCG GACGTGGAAA ATGCTGCGCC GGAAAACTGC TCCGGCCAAC 
CGGCTGATCA ATTGCATCGA GCGCCGCCAG ATGCGGACGA CGTCCCATTT TGTGGCTGTC 
TCCGACAAAC TCGTCGATTG GGTCCAGGAG GCCTACCCTT CGTTTGACAC AAGCCGCATC 
CAGGTTATCT ATAATCAGCC AGATCTGACC GCTTTCGAAC CGTATCCCCG CGCCAAGCAG 
AGGGCTGAAC GGCAACAACG CGGGCTTGCG CCAGACATGA TCTATATCGG CACTGCTGGG 
ACAAATTTCG CACTCAAAGG GGTCGGCTGC CTCATTGCCG CCCTGGCGCA ATTGCCGGAT 
TCCCACCATC TTCTCGTGGC TGGCGATCGC AATCCGGACC GGTATCGCAA ACAGGCCCAG 
CGTCTCGGGG TCGCGCACCG GGTAACCTTC CTCGGCCGAG TAGAAGACAT GACCGGATTT 
TACAACTGCC TGGACGCCTT TGCCCTGCCG ACCTTTTACG ACGCCTGCTC CAATGCAGTC 
CTGGAAGCCT TACGCTGCGG CATACCGACC CTGTCGAGCT CTGCAAATGG CAGCAGTGTT 
TTCCTGGATC CGGAAAACAC CATCAAAGAT CCCCACGATA CACAGAACTT AGCTCGAACC 
TTGCGACGCC TCTGCGCTGA GCCCCGCCGG AACGCGTTTG CCTGGCCCAA TCATATCCGT 
GCCGGCCTGG AAGCCTACAC CGAACTGATC GAGACCGCAC TATGCCGATA A

Protein sequence

MLSGTSPQRI ALMLPRLSRY GGAERFASRL ANHLGQTGFD VDFICARQES EAPQGVTPRV 
VGRKGLCRSG KILWYAMAAE RQRRAGNYDL TLSMGKTWNQ DVLRLSGGPL PVFWRLSKQA 
YDPGMARTWK MLRRKTAPAN RLINCIERRQ MRTTSHFVAV SDKLVDWVQE AYPSFDTSRI 
QVIYNQPDLT AFEPYPRAKQ RAERQQRGLA PDMIYIGTAG TNFALKGVGC LIAALAQLPD 
SHHLLVAGDR NPDRYRKQAQ RLGVAHRVTF LGRVEDMTGF YNCLDAFALP TFYDACSNAV 
LEALRCGIPT LSSSANGSSV FLDPENTIKD PHDTQNLART LRRLCAEPRR NAFAWPNHIR 
AGLEAYTELI ETALCR