Gene Snas_3997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_3997
Symbol
ID	8885198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	4265226
End bp	4266515
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	72%
IMG OID
Product	histidinol dehydrogenase
Protein accession	YP_003512742
Protein GI	291301464
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.327583
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.821981
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGAAAC GCATCGATCT ACGAGGGTCC ACCGACATTC CCGCGGGGTT GCTTCCCCGG 
GCGCGCTTCG ACGTCGCCGC CGCGCTGGCC GAGATCCAGC CGCTGCTGGA CGCCATCGCG 
CATCACGGTG CCGACCCGAT CCGACGCGTG ACGGCCGAAC GCGACGGCGT CGAGCTGGAC 
AGCCTGCGGG TACCCGCCGA GGCCCTGCGC GACGCACTGG ACTCATTGGA CCCCGCGCTG 
CGGGGTTCGC TGGAGGAGGC CGTTTCGCGG GTGCGCGCGG TGCACTCCGC CCAGCGTCGC 
GAGAACCTCG TCACCGAGGT CGCTCCGGGC GGCGTGGTCA CCGAGCGGTT CGTGCCGGTG 
CGGCGCGTCG GGCTCTACGT CCCCGGCGGG CTGGCACCGT TGGCGTCCAG TGTGGTCATG 
AACGTGGTGC CGGCGCAGCT GGCCGGGGTG CCGCAGATCG CGGTCGCCTC GCCGCCGCAG 
CGCGCCACCG GACTGCCCGA CGTCACGATC CTGGCCGTGT GCGCGATGCT GGACGTCACC 
GAGGTCTACG CCGTCGGCGG TCCCGCCGCC ATCGGCATGT TCGCCTACGG CGCCGACGAA 
TGCGCGCCGG TCGACATGAT CACCGGCCCG GGCAACATCT ACGTCACCGC CGCCAAACGC 
GCGGTGCGGG GCCTGGTCGG CATCGACGCC GAGGCCGGAA CCACCGAGAT CGCGGTGCTG 
GCCGACGACA CCGCCGACGC CGCCCACGTG GCCGCCGACC TGATCAGCCA GGCCGAACAC 
GACCCCGAGG CCGCCAGCGT GCTCGTCACG CCCTCGGCGG CCCTCGCCGA CGCCGTCGAC 
GCCGAAGTCA AGGCCATGGT CGACGAAGCC CGTCACGCGC AACGGATCCG GATCGCGCTG 
TCGGGCCCGC AGTCGGGCAT CGTCCTGGTC GACGACCTCG AACAAGGACT GTCGGTAGTG 
GACGCCTACG CGGCCGAGCA CCTGGAGATC CAGACAGAGG GCGCCCGCGA ACTGGCGATG 
CGGGTCACCA ACGCCGGAGC CATCTTCGTC GGCCCGTACT CGCCGGTCTC GCTCGGCGAC 
TACTGCGCCG GGTCCAACCA CATCCTGCCC ACCGGCGGCT GCGCCCGGCA CTCGTCCGGC 
CTGTCCGTCA CGAGCTTCCT GCGGCCGATC CAGGTCATCG AGTACGACCG CGAGGCCCTG 
GCAGCCGTCA GCGACGACGT GGTCCGGCTG GCCGAGGCCG AGAACCTGCC CTCGCACGGC 
AAGGCGGTCA CGGCGAGGTT CGGCCGGTGA

Protein sequence

MLKRIDLRGS TDIPAGLLPR ARFDVAAALA EIQPLLDAIA HHGADPIRRV TAERDGVELD 
SLRVPAEALR DALDSLDPAL RGSLEEAVSR VRAVHSAQRR ENLVTEVAPG GVVTERFVPV 
RRVGLYVPGG LAPLASSVVM NVVPAQLAGV PQIAVASPPQ RATGLPDVTI LAVCAMLDVT 
EVYAVGGPAA IGMFAYGADE CAPVDMITGP GNIYVTAAKR AVRGLVGIDA EAGTTEIAVL 
ADDTADAAHV AADLISQAEH DPEAASVLVT PSAALADAVD AEVKAMVDEA RHAQRIRIAL 
SGPQSGIVLV DDLEQGLSVV DAYAAEHLEI QTEGARELAM RVTNAGAIFV GPYSPVSLGD 
YCAGSNHILP TGGCARHSSG LSVTSFLRPI QVIEYDREAL AAVSDDVVRL AEAENLPSHG 
KAVTARFGR