Gene Dret_0034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0034
Symbol
ID	8417836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	37283
End bp	39274
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	61%
IMG OID	645036597
Product	alpha amylase catalytic region
Protein accession	YP_003196914
Protein GI	258404172
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAAA AAACGCGGCA GCGCGTGTGC ATCGAGCGGG TTCGTCCCAG TGTCGACGGG 
GGCCGTTTTC CGGCCAAACG GGTCCAGGGC GAAACCGTGA CCATTCAGGC CGATATCTTT 
ACCGACGGCC ACGATACCCT CGCGGCCGAG GTACTCCTGG CCCTGCCGGG TGAACGGCAC 
TGGCAGCGGC ATGCCTTGCA AGCACGGCCG AACGACGTTT ACACGACCTC CATTTTTCTG 
GAACACCGCG GTGAGTATGT CTTTCGCATC CAGGCTTGGC GTAATGTTTA TCAGACCTGG 
CTCAGTGACG TCCTGAAGAA GTACGACGCT GGACAGGATG TTGCCGTTGA ACTCCAGGCC 
GGCGGCGAGC TGGTGCGCGC AATGAGCGAC CGACTCAACG GCGCGGATCA GGCCTTTGCC 
CTGGAACAAG CCGGAGTCAT GGAGCGCTTC GCCGATTCTT CCCCGGAGGA CGCTTTTGCA 
GCGGCCCAGG GGGACCGACT GCGCCGACTG CTGCGCTACG CTGGGCGTAG CGAGGAACAC 
GGCGGTCTGT CACCCCGCTT TGTCATTGAT GTCGACCGTC CGCGCGCCGG GTTCAGCGCC 
TGGTATGAAT TTTTCCCCCG GTCGTTCGGG GAATTTCCCG GCGCACACGG CACCTTGACC 
GACGCCGCTG CCATGCTGCC CCACATCGCC CATATGGGGT TCGATGTCGT GTATTTGCCG 
CCGGTGCACC CCATCGGACA CACTTTTCGC AAAGGGCGCA ACAACGCTCC CGAGGCCGAG 
CCCGGCGACC CGGGCAGCCC CTGGGCCATT GGCAGCGGAT CCGGTGGGCA TAAGGCCGTG 
CATCCCGATC TCGGCACCCT TGAGGATTTT GAGGGCTTCG TGCGCGAGGC CGAGCGGCAA 
GGACTGGAAG TCGCTCTTGA TCTGGCTTTT CAATGTTCCT ACGACCACCC CTATGTCCGG 
GAACACCCGG AATGGTTTTC CTGGCTGCCG GACGGCAGTA TCCGCTACGC CGAGAATCCC 
CCTAAAAAAT ACCAGGATGT GGTGCCGCTG AATTTCGACT GCGCGGATTG GGAGAACCTC 
TGGGAGGAAC TCAAGTCCGT GGTCCTGTTC TGGTGTGAAC GCGGCGTCCG GATCTTTCGG 
GTCGACAACC CGCATACCAA ACCGTTGCGG TTTTGGGACT GGTGCATCGC CGAGGTGAGA 
AAAGTCTATC CCGACACCCT TTTTCTGGCC GAGGCCTTTA CTCGGCCCAA GGTCATGTAC 
CGCCTGGCCA AGGGCGGCTT CAACCAATCC TACACCTATT TCACCTGGCG CAACAGCAAG 
ACCGAGTTGC GGGACTACCT CGAGGACCTC GTCGAAGGGG CCCCGCGGGA TTTTTTCCGG 
CCCAATTTCT GGCCCAACAC GCCGGATATC CTGCCGGAAT TTCTCCAGCA CGGCGGCAGA 
CCAGCCTTTG TGCTGCGCCT GGTGCTCGCG GCGACTCTGT CCTCGAACTA CGGCATGTAC 
GGTCCGGCCT TTGAATTGTG CGAGGCTGAG GCCGTGCCTG GTCGGGAAGA ATACGCCCAC 
TCGGAAAAAT TCGAACTCAA GGCCTGGGAC TGGAACCGGC CGGGGCATTT GCGGGAAGTC 
ATCACTGCGG TCAACCGGAT CCGGCGAGCC AACCCCGCTT TGCACTCGAC CTGGAATGTC 
CGGTTCGTAG ATACGGACAG CGATCAGGTC CTGGCCTATG TCAAAACCGA TGCCGAGGCC 
GAGAATATTA TCCTCGTCGT GGCCTCCCTG GATCCGTTTC AGCCCCAGAC CAGCACTGTC 
TCCTTGCCGC TTGATGACCT CGGGGTCAGC CGGGATGCCC CGTATCTGGT CCACGACCTG 
CTCGGCGAGG AGTATTTCTT CTGGCAGGGA GACCACTCGC GGCTGACCCT CTATCCCCAG 
TCACAGCCGG CGAGGATCTT TCGGCTCCAC AAACGGATGC GCCGCGAACA GGATTTCGAC 
TATTTCATGT AG

Protein sequence

MGKKTRQRVC IERVRPSVDG GRFPAKRVQG ETVTIQADIF TDGHDTLAAE VLLALPGERH 
WQRHALQARP NDVYTTSIFL EHRGEYVFRI QAWRNVYQTW LSDVLKKYDA GQDVAVELQA 
GGELVRAMSD RLNGADQAFA LEQAGVMERF ADSSPEDAFA AAQGDRLRRL LRYAGRSEEH 
GGLSPRFVID VDRPRAGFSA WYEFFPRSFG EFPGAHGTLT DAAAMLPHIA HMGFDVVYLP 
PVHPIGHTFR KGRNNAPEAE PGDPGSPWAI GSGSGGHKAV HPDLGTLEDF EGFVREAERQ 
GLEVALDLAF QCSYDHPYVR EHPEWFSWLP DGSIRYAENP PKKYQDVVPL NFDCADWENL 
WEELKSVVLF WCERGVRIFR VDNPHTKPLR FWDWCIAEVR KVYPDTLFLA EAFTRPKVMY 
RLAKGGFNQS YTYFTWRNSK TELRDYLEDL VEGAPRDFFR PNFWPNTPDI LPEFLQHGGR 
PAFVLRLVLA ATLSSNYGMY GPAFELCEAE AVPGREEYAH SEKFELKAWD WNRPGHLREV 
ITAVNRIRRA NPALHSTWNV RFVDTDSDQV LAYVKTDAEA ENIILVVASL DPFQPQTSTV 
SLPLDDLGVS RDAPYLVHDL LGEEYFFWQG DHSRLTLYPQ SQPARIFRLH KRMRREQDFD 
YFM