Gene Snas_5697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5697
Symbol
ID	8886912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	6059738
End bp	6061321
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	71%
IMG OID
Product	Uroporphyrinogen III synthase HEM4
Protein accession	YP_003514420
Protein GI	291303142
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATG TTCACAATCT CCCCGGACGT GTCCGATTCG TCGGAACCGG CCCCGGAGAC 
CCGGGCCTCT TGACCAAACG GGCCCTCGAC GCGATCGCCG TGGCCGATCT GGTGGTGCAC 
GACCGCAATC TGCCGCAGCA GATGCTGGAG GCGGCGCAGG AGCACGCGGG GGACAACGCC 
GTGTTCACGG TGGCCGACGC GACGTCCACC GAGCTGATCA AGGACCTGAT CACCGCCGCC 
CGCGAGGGCC GCAACGTCGC CCGGCTGCTG ACCGGCGACG CGTACCCCAA CGCGACCGCC 
CAGGACGAGA TCGCCGCGAT CCTGGACACC GAGGTGGCCG TCGAGGTCAT CCCCGGCGTC 
AGCTACGCCT CCGCCGTGGC CGGTTACGCG GGCATGCCGC CCGGCGGCCT GCGCACCCTC 
ATCGACGTCG ACGACGTGTC GCAACTGGAC ACCACGACGC TGGCCGCCGC GATCGCCAAC 
GGCACCCTGG TGCTCACCAG CGACGTCGCC AACCTGGCCG TGGTGCGGGA CAACCTGCGC 
GCCACCGGCA TCGACTCGGC CACCCCGGTC GCGGTCACCG GCGACGTCAC CGGCGAGACC 
CAGTTCACCG CGACCTCCAC GGTGGACACC TTCGTGGAGG CGGCGCTCGG CTTCGCCGGC 
CGCGTCGTCA TCACCATCGG CAAGGGCGTC GAGGACCGCA ACCGGCTGGG CTGGTGGGAG 
AACCGGCCGC TGTACGGCTG GAAGGTGCTG ATCCCCCGCA CCAAGGAGCA GGCCGGCGAG 
ATGAGCGACA AGCTGCGCGA GTACGGCGCC ATCCCGTGCG AGGTGCCGAC CATCGCCGTC 
GAGCCGCCCC GCACTCCGGC CCAGATGGAA CGCGCCATCA AGGGCCTGGT GGACGGCCGC 
TACGCCTGGA TCGTGTTCAC CTCCGCCAAC GCCGTCAAGG CCATCTGGGA GAAGTTCGCC 
GAGCACGGCC TGGACGCGCG CGCCTTCGGC GGTCTCAAGA TCGCCTGCGT CGGCGACGCC 
ACCGCCGCCA AGGTCCGCTC CTTCGGCATC GAGCCGGAGC TGCTGCCCAC CGGCGAGCAG 
TCCGGAACCG GTCTGCTGGA AGTGTTCCCG CCGCACGACA CCATCCTGGA CCCGGTCTCG 
CGGGTGCTGC TGCCGCGCGC CGACATCGCC ACCGAGGCAC TGTCGGCCGG GTTGCAGGAG 
CGCGGCTGGG AGGTCGACGA CGTCACCGCC TACCGGACGG TGCGCGCCTC GCCGCCGCCC 
GCCGACATCC GCGACGCCAT CAAGTCCGGC GGCTTCGACG CTGTGTTGTT CACCTCATCG 
TCGACCGTGC GGAACCTGGT CGGTATCGCC GGCAAGCCGC ACGCCCGCAC CGTCGTGTCG 
GTGATCGGCC CGCACACCGC CGAGACCGCC ACCGAGTTCG GCCTGCGTGT GGACGCGCAA 
CCGCAGCACG CCAACATGCC CAGCCTCGTC GAGGCGCTCG CCGAGTACGC GGTGGCGCTG 
AAGAAGCGGA TGGCCGAGGC CCCGGTGAAG CAGCGTCGCG GCGCCAAGGC GCAGGGTCCG 
ACCGCGCTAC GGTTTCGGTC ATGA

Protein sequence

MNDVHNLPGR VRFVGTGPGD PGLLTKRALD AIAVADLVVH DRNLPQQMLE AAQEHAGDNA 
VFTVADATST ELIKDLITAA REGRNVARLL TGDAYPNATA QDEIAAILDT EVAVEVIPGV 
SYASAVAGYA GMPPGGLRTL IDVDDVSQLD TTTLAAAIAN GTLVLTSDVA NLAVVRDNLR 
ATGIDSATPV AVTGDVTGET QFTATSTVDT FVEAALGFAG RVVITIGKGV EDRNRLGWWE 
NRPLYGWKVL IPRTKEQAGE MSDKLREYGA IPCEVPTIAV EPPRTPAQME RAIKGLVDGR 
YAWIVFTSAN AVKAIWEKFA EHGLDARAFG GLKIACVGDA TAAKVRSFGI EPELLPTGEQ 
SGTGLLEVFP PHDTILDPVS RVLLPRADIA TEALSAGLQE RGWEVDDVTA YRTVRASPPP 
ADIRDAIKSG GFDAVLFTSS STVRNLVGIA GKPHARTVVS VIGPHTAETA TEFGLRVDAQ 
PQHANMPSLV EALAEYAVAL KKRMAEAPVK QRRGAKAQGP TALRFRS