Gene Snas_5038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5038
Symbol
ID	8886245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5347450
End bp	5348844
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	69%
IMG OID
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_003513768
Protein GI	291302490
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.332625
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.389719
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCATCG ATTGGCATCA ACTGCGCAAT CCCGGACTCG TCCCCGGGAG TCTCGACCCC 
GCCGCGGCCG TTGAGAGGGC CGCCCAACTC GGCCTCGACC GCTGGCGCGA TCTGCCCCGC 
GACCAGATGC CCCCGTGGGA GGACTACTCC GAGGTCGAGG ACGTCTACGG CGTCCTGAAA 
TCGGTTCCCC CGATCGTGGC GCCCTACGAG GTGGACGCGC TGCGCGACCA GCTCGCGCAG 
GTGTGCGCCG GGAAGGCGTT CCTGTTGCAG GGCGGCGACT GCGCCGAGAC CTTCATCGAC 
AACACCGAGG CCCACCTGCT GGGCCTGGCC CGCACCATCC TGCAGATGGC GGTCGTGCTG 
ACGTACGGCG CCAGCATGCC GGTGGTCAAG GTGGGCCGGG TCGCCGGTCA GTACACCAAA 
CCCCGCTCCA GCGCGACCGA CTCGCTGGGG CTGCCCAGCT ACCGCGGCGA CATGATCAAC 
TCGCTGGAGA AGACCCCCGA GGCCCGCCGG GCCGACCCGC AGCGCATGAT CCGCGCCTAC 
GCCAACGCGG CGGCGGCCAT GAACATGCTG CGCGCCTACC TGTCGGGCGG CATCGCCGAC 
CTGCGGGCGG TGCACCACTG GAACAAGGAC TTCGTCCGGC AGTCCCCGGC CGGGGAACGC 
TACGAGGCCA TCGGCCGCGA GATCGACCGG GCGCTGGCGT TCATGGACGC CTGCGGCGTC 
GACGACGACG CCCTGCACAC CGTCACGATG TACGCCAGCC ACGAGGCACT GGCGCTGGAG 
TACGACCGGG CGCTGACCCG CGTCAACAAC GACCGGGCCT TCGGGCTGTC GGGCCACTTC 
CTGTGGGTCG GCGAACGGAC CCGCCGCCTC GACGGGGCCC ACATCGACTT CATCTCCCGG 
CTGGCCAACC CGATCGGCGT CAAGATCGGC CCGTCCACGT CGCCGGACTG GGCGCTGGAA 
GCCTGCGAGA AGCTCAACCC GGACAACATC CCCGGCAAGC TGACCCTGAT CTCCCGCATG 
GGAAACCAGA AGATCCGCGA CGTGCTGCCC ACGATCGTGG CGAAGGTGCA CGCCGCCGGA 
CGGCAGGTCA TCTGGCAGTG CGACCCGATG CACGGCAACA CCCACGAATC GTCCAACGGC 
TACAAGACCC GCGACTTCGA CCGGGTCGTG GACGAGGTGC TGGGCTTCTT CGAGGTGCAC 
CGCTCCACCG GCACCCACCC CGGCGGTATC CACATCGAAC TGACCGGTGA GGACGTGACC 
GAGTGCGTCG GCGGCGCCCA GGCCCTGGAC GACAAGGACC TGGAGCAGCG CTACGAGACC 
GCCTGTGACC CCAGGCTCAA CACCCAGCAG TCGCTGGAGC TGGCGTTCCT GGTCGCGGAG 
ATGCTGCGGC ACTGA

Protein sequence

MTIDWHQLRN PGLVPGSLDP AAAVERAAQL GLDRWRDLPR DQMPPWEDYS EVEDVYGVLK 
SVPPIVAPYE VDALRDQLAQ VCAGKAFLLQ GGDCAETFID NTEAHLLGLA RTILQMAVVL 
TYGASMPVVK VGRVAGQYTK PRSSATDSLG LPSYRGDMIN SLEKTPEARR ADPQRMIRAY 
ANAAAAMNML RAYLSGGIAD LRAVHHWNKD FVRQSPAGER YEAIGREIDR ALAFMDACGV 
DDDALHTVTM YASHEALALE YDRALTRVNN DRAFGLSGHF LWVGERTRRL DGAHIDFISR 
LANPIGVKIG PSTSPDWALE ACEKLNPDNI PGKLTLISRM GNQKIRDVLP TIVAKVHAAG 
RQVIWQCDPM HGNTHESSNG YKTRDFDRVV DEVLGFFEVH RSTGTHPGGI HIELTGEDVT 
ECVGGAQALD DKDLEQRYET ACDPRLNTQQ SLELAFLVAE MLRH