Gene Dret_1978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1978
Symbol
ID	8419823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2270304
End bp	2271524
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	63%
IMG OID	645038566
Product	glycogen synthase
Protein accession	YP_003198840
Protein GI	258406098
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR02149] glycogen synthase, Corynebacterium family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.215698
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCG GTGTGTTGAC CAATGAATAC CCCCCGCATG TGTATGGCGG GGCGGGAGTC 
CATGTTGACT ATTTAACCCG GGAATTGGCC CGCGTGGAAA ACGGCCGGCA CTCCGTCGAG 
GTCCTTGCCT TCGGGGACCA GCATGTCGCT CGCAGCACGC TTCAGGTCAA TGGGGTCAAC 
GGCGATCTCG GAGCCCGGCC GCAGTATCCG CAATGGGGCA AGGTGGTCGA TCCCCTGTTC 
AAGAACCTGC TCATGGCCGC TCAGGCCGAG GCCTGGGACA TCGTGCACTG CCACACTTGG 
TACACCCATT TTGCGGGCTG TTTGCTGCAA CAATTGCTGG GAATCCCGTT GGTGCTGACC 
ACCCATTCCC TGGAGCCGCA TCGTCCCTGG AAAGCTGAAC AACTGGGCCC AGGTGGCTAC 
CGGGCCTCCA CCTGGCTGGA AAAGACCGCC TACCAAAATG CCGACGGCGT GGTGGCGGTT 
TCCGGTTCGA TGGCCAGCGA CGTGCAGACC CTGTACGGCG TGGCGCCTGA GCGCGTGCGG 
GTCATCCACA ACGGCATCGA TCCCGAGGAA TACCATCCGG GGCAGCAGAC CGCCCCGCTG 
GAAGATCTCG GCGTCGACCC CACGGTCCCC TATGTCCTGT TCGTGGGCCG GATTACCCGA 
CAAAAAGGGA TCACCCATTT GCTGCGTGCC CTGGAGCAGG TCCGCTCCGG CACCCAGGTG 
GTGCTCTGCG CCGCCTCACC CGATACACCG GAGATTGCGC GGGAGACCGA GGCCTTGGTC 
CAGCAGCTTC GCGACCAGGG GCATTGCCGG GTGCACTGGT TCGACACCCC GATGCCCAAG 
GAGCAGCTCA TACCGTTATA CGCCCATGCG GCAGTCTTTG TCTGTCCCTC CATCTACGAG 
CCGTTCGGGA TCATCAATCT CGAGGCCATG TCCTGCGCCA CACCGGTGGT CGCCTCCAGT 
GTCGGCGGTA TCCCGGAGAT CGTGGTCCAC GACGAGACCG GGTATCTGGT GGGATTTGAA 
CCGGCGGGGA GCGAGGACAG CGATCCCAAA GATCCCGACC GGTTTGCCGC GGATTTGGCC 
AAGGCCGTTA ATGCGGTCCT CGACGATCCG GAAAAGGGGG AGGGATTCGG ACGGCAGGCC 
CGGCAGCGGG TGCTGAGTCA TTTCAGTTGG CGCTCTGTGG CCGCCCAGAC AATTCAATGG 
TATCAGGCCC TGACCGGATA A

Protein sequence

MRIGVLTNEY PPHVYGGAGV HVDYLTRELA RVENGRHSVE VLAFGDQHVA RSTLQVNGVN 
GDLGARPQYP QWGKVVDPLF KNLLMAAQAE AWDIVHCHTW YTHFAGCLLQ QLLGIPLVLT 
THSLEPHRPW KAEQLGPGGY RASTWLEKTA YQNADGVVAV SGSMASDVQT LYGVAPERVR 
VIHNGIDPEE YHPGQQTAPL EDLGVDPTVP YVLFVGRITR QKGITHLLRA LEQVRSGTQV 
VLCAASPDTP EIARETEALV QQLRDQGHCR VHWFDTPMPK EQLIPLYAHA AVFVCPSIYE 
PFGIINLEAM SCATPVVASS VGGIPEIVVH DETGYLVGFE PAGSEDSDPK DPDRFAADLA 
KAVNAVLDDP EKGEGFGRQA RQRVLSHFSW RSVAAQTIQW YQALTG