Gene Snas_5801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5801
Symbol
ID	8887017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	6162841
End bp	6164028
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	66%
IMG OID
Product	cytochrome P450
Protein accession	YP_003514524
Protein GI	291303246
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0291832
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.365285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACG AACCCTTCAA CCTCGTGATG TTTCAGCGCG ACGGTCTTGA TCCCGTGCCT 
GAACTGGCGC GCCGCCGTGC CGAAAACCCG GTGAGCAGGG TGCAATACCC GATCGGCCCG 
CCGATTTGGC TGGTGACCGG CTACGAGGAC ACCCGTACCG TGCTCGGGTC GAACAAGTTC 
AGCAATGACT TCGCCAAGAT GACGGCTGAA GACGACCTCG CCTTCCTCAA GGACGTCAAC 
CCGGGTGGCC TGGGATTCAA GGATCCGCCC GACCACACCC GGCTGCGCAA GATGCTCACA 
CCCGAGTTCA CGATGCGGCG GCTGCGGCGG CTGATCCCGC GTATCGAGGA GATCGTCGCC 
GAACGCCTGG ACGCGATGGA GGCCGCCGGG GACGGCGTCG ACCTGGTCGA CGCGTTCGCG 
GTGCCGATCC CCTCCCTGGT GATCAGCGAA CTGCTCGGTG TCCCGTACCC GGACCGCGCC 
GACTTCCAGC GGCTGTCGGA GTCCCGTTTC GACTTCCTGG GCGACATCGA GGGCTGCCTG 
GCCGCCGTTC AGGACACTTT GGAGTACCTG TCCGGCCTGG TGGCGCAACA GCGCGCCGAA 
CCGGGGGACA ACCTGCTGGG CATGCTGGTG CGCGAACACG GCGACAACAT CTCCGACGCC 
GAACTCACCG AGATCGCCGA CGGCATCCTC ATCGGCGGCC ACGAGACCAC CGCGAGCATG 
CTGGCACTGG GCGCCCTGCA CCTGATGACC AAACCCGAGC ACTTCGCGAT GGTCCGCGAC 
GACGACGACA AGGTCGTCCC GGTCGTCGAC GAACTGCTGC GCTACCTGAC CGTCGTGCAG 
GTGGCCTTCC CGCGGTTCGC GCTGGAGGAC GTGAAACTGT CCAACGGCCA GGTCGTCCGG 
AAGGGCGAGG TCGTGCTGGC CTCGCTGTCG GGCGCCAACC GCGACTCCGC CTTCGGCGCG 
GACGCCGAGA AGGTCAACAT CTTCCGCGAC ATGCCGCCGC ACGTGGCCTT CGGCTACGGA 
CTGCACCGCT GCGTCGGTGC CGAACTGGGC CGCATCGAAC TCCAGATCGC CTACCCGGCG 
CTGCTGCGCC GGTTCCCGAA CCTGCGGCTG GCGGTGCCGT TCGAGGAACT GAAGTTCCGC 
GAACTGTCCA TCGTGTACGG AGTCGAGAAG CTGCCGGTGA ACCTGTGA

Protein sequence

MSDEPFNLVM FQRDGLDPVP ELARRRAENP VSRVQYPIGP PIWLVTGYED TRTVLGSNKF 
SNDFAKMTAE DDLAFLKDVN PGGLGFKDPP DHTRLRKMLT PEFTMRRLRR LIPRIEEIVA 
ERLDAMEAAG DGVDLVDAFA VPIPSLVISE LLGVPYPDRA DFQRLSESRF DFLGDIEGCL 
AAVQDTLEYL SGLVAQQRAE PGDNLLGMLV REHGDNISDA ELTEIADGIL IGGHETTASM 
LALGALHLMT KPEHFAMVRD DDDKVVPVVD ELLRYLTVVQ VAFPRFALED VKLSNGQVVR 
KGEVVLASLS GANRDSAFGA DAEKVNIFRD MPPHVAFGYG LHRCVGAELG RIELQIAYPA 
LLRRFPNLRL AVPFEELKFR ELSIVYGVEK LPVNL