Gene Htur_4749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_4749
Symbol
ID	8745340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013745
Strand	+
Start bp	356691
End bp	357941
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	63%
IMG OID	646515248
Product	Glycine hydroxymethyltransferase
Protein accession	YP_003406195
Protein GI	284172813
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.081804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTTCA AACAATCGCT CGAGCAGATA GATCCGAATA CGGCCGAGGC TATCGACCTC 
GAGCGTGAAC GGCAGGAATC GACGCTGGGG ATGATCGCCT CCGAGAATCA CGTCTCGAAA 
GCCGTGCTCG AAGCACAGGG GAGCGTCCTC ACGAATAAGT ACGCCGAGGG ATACCCCGGC 
GGGAGATACT ACGGCGGCTG CCAACACGTC GACACCGTCG AGGAACTCGC TATCGAACGC 
GCGAAGGAAC TGTTCGGGGT CGACCACGCC AACGTGCAAC CCCACAGCGG CACGCAGGCC 
AACATGGGCG TGTACTTCTC CGTGCTCGAA CCGGGCGACA AGATCCTATC GCTGTCGCTG 
TCGCACGGCG GACACCTCTC TCACGGCCAC AACGTCAACT TCTCGGGACA GCTCTACGAC 
GTCGAACAGT ACGAGGTCGA TCCCGAGACG GGGTACATCG ATTACGACGA ACTCGAGAGC 
CTCGCGCGCG AGTTCGACCC GGACATCATC GTTAGCGGCT CCTCGGCGTA TCCTCGCGAA 
TTCGAGTACG AACGTATCGG CGATATCGCG GACGCGGTCG ACGCCTACCA CCTCGCGGAC 
ATCGCTCACG TGACGGGGCT CGTCGCCGCC GGCGTTCACG CCTCGCCCGT CGAACACGCG 
GAGTTCGTCA CCGGAAGCAC CCACAAGACG ATCCGCGCCG GCCGCGGCGG GATCATCATG 
TGCGACGAAG AGTTCGCGGA CGACATCAAC TCCGCCGTGT TTCCCGGCGC GCAGGGCGGG 
CCGCTGATGC ACAGCGTGGC CGGCAAGGCC GCAGGGTTCG CAGAAGCGAG CACCGATGAG 
TTCCAGTCCT ATGCCGTGCA GACCATAGCT AACGCGAATA CGCTCGCCGA CGAGTTCGAC 
GACCGAGGAC TCTCGCTGGT GAGCGGTGGA ACGGACAAGC ACCTCATGCT CGTAGACCTC 
CGCGACTCCC ACCCAGACAT CACGGGAGAG GAGGCCGAAG AGCTACTGTC CGACGTCGGC 
ATCATCGTCA ACAAGAACAC CGTACCCGGT GAAACGCGGT CGCCGATGGT GACCAGCGGG 
ATCCGCGTCG GCACGCCGGC GCTCACGACC CGGGGATTCG GAGAAAAGGA GATGGAGACC 
GTTGCCGACC TCATCGTGGA CGTACTCGAC AATCCCGAAG ACGAGGACGT TCATGACCGA 
GCCGCCTCGA CGGTCGAACA CCTTTGCCAG GAGTTTCCCA TCTACGGGTA G

Protein sequence

MAFKQSLEQI DPNTAEAIDL ERERQESTLG MIASENHVSK AVLEAQGSVL TNKYAEGYPG 
GRYYGGCQHV DTVEELAIER AKELFGVDHA NVQPHSGTQA NMGVYFSVLE PGDKILSLSL 
SHGGHLSHGH NVNFSGQLYD VEQYEVDPET GYIDYDELES LAREFDPDII VSGSSAYPRE 
FEYERIGDIA DAVDAYHLAD IAHVTGLVAA GVHASPVEHA EFVTGSTHKT IRAGRGGIIM 
CDEEFADDIN SAVFPGAQGG PLMHSVAGKA AGFAEASTDE FQSYAVQTIA NANTLADEFD 
DRGLSLVSGG TDKHLMLVDL RDSHPDITGE EAEELLSDVG IIVNKNTVPG ETRSPMVTSG 
IRVGTPALTT RGFGEKEMET VADLIVDVLD NPEDEDVHDR AASTVEHLCQ EFPIYG