Gene Dret_1742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1742
Symbol
ID	8419582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2005333
End bp	2006448
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	61%
IMG OID	645038325
Product	glycosyl transferase group 1
Protein accession	YP_003198604
Protein GI	258405862
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.711443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.704345
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTTT ACGAAGTTAT CAATGTCCGC TGGTTCAATG CCACCGCCTG GTATGCTATC 
ACCCAAGCCC GGCTGCTTAC GGCCCACGGC CATGAGGTCA TGGTCGTCTG TCTGCCGGAC 
TCGCCAGCCC ATCTGAAGGC CCTGGAATAC GGGCTTCCTG TCGCCACCCT GGACCTGAAC 
ACCACCTCGC CGCTGGGCAT AGTCCGGCTG TACGTCCGCA TGCGCAGGCT GCTCCGGGAA 
TTTCCCCCGG AAATAGTCAA TTGCCACCGC GGGGAGGCCT TTGTCCTTTG GGGACTCCTG 
AAATTGCAAA GCAGGGGGCT TTTTCGGCTC GTGCGCACCC GGGGCGACCA GCGTCCCCCC 
AAAAACAACC GCGTCAACCG CTGGCTGCAC CGGAGTCTGG CAGACGCCGT AGTTTGCACC 
AACTCGGCCA TGGCCCGCCA TTTCCGGGAT ATCCTTGGAC TGCCTGCCTC CCACCTCTGG 
CTCATTTTCG GTGGTGTGGA CCGGGACCGG TTCAAATACG ATCCTGAAGG ACGACACACT 
GTGCGACAAC GCTACGGCTT TGGCCCCCAG CACAAGGTGG TTGGTCTCTT GGGACGATTC 
GACCGCGTCA AGGGACAGTG GGAATTGCTC CAGGCCGTAT CCCGTCTCTA CCATGACGGG 
ATGAGCGACC TCCGGGTCTT GCTCATCGGT TTTACCACCG CCACTTCCCA GGCGGAAGTG 
GAAGGATGGA TTCAGGACCT GGGGCTGACC GAAGTGGTCC ATATCACGGG ATTGACTGAA 
GACGTCCCCG CCTGTCTCTC GGCCCTGGAT CTCGGTATTG TCAATTCCTT GTGGTCGGAG 
ACCATTGCCC GCGCCGCCCT GGAGACCATG TCCTGTTCCG TCCCGCTTAT TGGAACCACC 
GTCGGAGTCC TGCCCGACCT GCTCTCCCAG GAAGCCCTGG TTCCGCCAGG CGACAGCGGA 
GCCCTGGCCG ACCGCATCCG GGACGTTTTC AGCGATCAAT CCCTTGTGCA GCGGCTGCAC 
AAGCAGCAGG AAGAGACCAT CCGCGATCTC TCCACCGACC ATTTTGTTCA ACACACCCAG 
AGTCTGTACA CCCGGCTCCT GAGTCCCGAC CGATGA

Protein sequence

MRVYEVINVR WFNATAWYAI TQARLLTAHG HEVMVVCLPD SPAHLKALEY GLPVATLDLN 
TTSPLGIVRL YVRMRRLLRE FPPEIVNCHR GEAFVLWGLL KLQSRGLFRL VRTRGDQRPP 
KNNRVNRWLH RSLADAVVCT NSAMARHFRD ILGLPASHLW LIFGGVDRDR FKYDPEGRHT 
VRQRYGFGPQ HKVVGLLGRF DRVKGQWELL QAVSRLYHDG MSDLRVLLIG FTTATSQAEV 
EGWIQDLGLT EVVHITGLTE DVPACLSALD LGIVNSLWSE TIARAALETM SCSVPLIGTT 
VGVLPDLLSQ EALVPPGDSG ALADRIRDVF SDQSLVQRLH KQQEETIRDL STDHFVQHTQ 
SLYTRLLSPD R