Gene Snas_1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_1120
Symbol
ID	8882305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	1191725
End bp	1192849
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	68%
IMG OID
Product	Epoxide hydrolase domain-containing protein
Protein accession	YP_003509923
Protein GI	291298645
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.636504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.342191
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAGA TCGAACCGTT CACCATCGAC ATCGCCCAGT CCGAACTCGA CGAACTGACC 
GCTCGGCTCG AGCACACCCG TTGGCCTGAC GAGCTTCCCG GCGTCGGCTG GTCCTACGGC 
ACCGCGCTGG GCTACGTCCG CGACCTGGCC GGCCATTGGC GCGACGGTTT CGACTGGCGT 
GCTCAGGAGG CTCGTCTCAA CGAGCTGCCC CAGTTCACCA CGAGGATCGA CGGGCAGACG 
ATCCACTTCG TACACGTAAG GTCGCCGGAG CCGGACGCGT TGCCGCTGAT CCTCACCCAC 
GGCTGGCCCA GCACCTTCGC GGACTTCGCC GCGATGGTGG GACCGTTGAC GAATCCCCGG 
GCTCACGGGG GTGACCCCGC CGACGCCTTC GACGTGGTGA TCCCGTCGGT GCCGGGGTTC 
GCGTTCTCCG GGCCGACCAC CGAGACCGGC TGGGACTGCC AGCGGGTGGC GGCGGCCTGG 
GCGGAGTTGA TGCGCAGGTT GGGGTATGAC CGCTATGGCG TGCAGGGCAG CGATTTCGGG 
GCCCTGGTGA CGCCGAGGCT GGCCCGGTCG CAGCCGGATC GGGTGGTGGG GATGCACCTC 
AACGCGGTGC CCACCATGCC GCAGGTGGAT CCGTCCGAAA TGGATGACCT GAGTGCCGAG 
GAGCGGGAGT ACTTCGCCGG GATGGATCAG TGGGAGGAGG TGTCGGGATA CGCGGTCGTG 
CAGAGCACCC GTCCGCAGAC GCTGGCCTAC GCGTTGAGCG ATTCGCCGGT GGGGCAGTTG 
GCCTGGTACG GCGACTGGTA CGCCGCGCAC GGCACCAAGG TCGGCGACCT GTCGCCGGAC 
CGGATCCTCA CCAACGTCTC GCTGTTCTGG TTCACCCGCA CCGGAGGTTC GGCGATCCGG 
TTGTACAAGG AGAGCGCGGC GGCCTGGGCC GAGCAGCCCG AACGGTCGGA GGTGCCGACC 
GGTCTGACGT TCTTCAAGGG CGAGAACGGG GTCCGCCGTT TCGCGGAGCG GGAGTACCGC 
GTCACGCACT GGACCCACCA CGACGCGGGC GGGCACTTCG CCGCCCTCGA AGTGCCCGAA 
CTGCTGGCGG GCGACATCCG GACCTTCTTC CGAGAAGTTC GATGA

Protein sequence

MTQIEPFTID IAQSELDELT ARLEHTRWPD ELPGVGWSYG TALGYVRDLA GHWRDGFDWR 
AQEARLNELP QFTTRIDGQT IHFVHVRSPE PDALPLILTH GWPSTFADFA AMVGPLTNPR 
AHGGDPADAF DVVIPSVPGF AFSGPTTETG WDCQRVAAAW AELMRRLGYD RYGVQGSDFG 
ALVTPRLARS QPDRVVGMHL NAVPTMPQVD PSEMDDLSAE EREYFAGMDQ WEEVSGYAVV 
QSTRPQTLAY ALSDSPVGQL AWYGDWYAAH GTKVGDLSPD RILTNVSLFW FTRTGGSAIR 
LYKESAAAWA EQPERSEVPT GLTFFKGENG VRRFAEREYR VTHWTHHDAG GHFAALEVPE 
LLAGDIRTFF REVR