Gene Nmul_A1905 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1905
Symbol
ID	3784143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2194951
End bp	2196138
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	58%
IMG OID	637811991
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_412592
Protein GI	82703026
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGGCA TGTCTGACGA TTTTGAGCTG GAAACACTGG CGCTGCATAC GGGCATACAT 
CGCAGCCAAT TCAATGAACA CTCGGAGGCC TTATTCCTGA CTTCGAGTTT CGTCTTCGAC 
AGTGCCGCTC AGGCGGCAGC ACGTTTTTCC GATGCGGAAC CGGGTAACAT CTATTCGCGT 
TTTACCAACC CCACGGTTAC CGCTTTTCAG GAAAGACTGG CCGCCCTGGA GGGGGCGGAA 
GCCTGTGTCG CCACCTCCTC AGGCATGTCG GCCATTCTTG CCTGCACGAT GGGTCTCCTC 
CGTGCTGGAG ACCATATCGT GGCTTCGCGC AGCCTGTTCG GTGCGACCGT CAGCCTGTTC 
AACAATATCC TCAAGCGCTT CAACATCGAA ACGACGTTTG TTTCCGCTAC GGATGTTTCC 
GCCTGGGAAG CAGCGGTGAG ACCAGCCACC CGGTTGCTGT TCATGGAAAC GCCCTCCAAT 
CCGCTGACAG AGATTTCCGA CATTGCCGCG CTTGCAGCCG TAGCCAGGAA GGCGGGCGCG 
TGGCTCGCCG TGGACAATTG TTTCTGCTCT CCCGCGCTGC AACGTCCATT GGAATGGGGC 
GCAGACCTCG TGATTCACTC TGCAACCAAA TATCTTGAGG GCCAGGGCCG GGTATTGGGT 
GGGGCGGTGC TGGGCAAGCG CGATCTGGTG ATGGACGGGG GAATATTCGG TTTTCTGCGC 
ACTGCCGGAC CGACCCTGAG CCCGTTCAAT GCCTGGGTGA TCCTGAAGGG CATGGAAACC 
CTGAACCTTC GGATGGAAAG GCATTCCGAA AATGCGCTGG AAATTGCGCG CTGGCTGGAA 
GCCCAGCCCG GCGTAGCCAA AGTCCACTAT CCCGGCTTGC CATCGCATCC GCAGTACGAG 
CTTGCCAGCC GCCAGCAGAA AACCGGGGGG GGAATCGTTT CATTCGAATT GAAGAATGGA 
AGAGAAGCGG CATGGAGGGT GGTGGATTCT GTTCGCATGA TTTCCATCAC CGCCAACCTG 
GGAGATGCCA AGAGCACCCT TACCCATCCT GCCACCACCA CGCATGGGCG GATCAGCCAG 
GAAAACCGGG ATGCGGCTGG CATTACCGAG GGCTTGCTGC GCATTGCAGT GGGACTTGAA 
GCGGTAAAAG ACATAAAGGC CGATCTCGCA AGGGGCTTGA CCCGGTAG

Protein sequence

MSGMSDDFEL ETLALHTGIH RSQFNEHSEA LFLTSSFVFD SAAQAAARFS DAEPGNIYSR 
FTNPTVTAFQ ERLAALEGAE ACVATSSGMS AILACTMGLL RAGDHIVASR SLFGATVSLF 
NNILKRFNIE TTFVSATDVS AWEAAVRPAT RLLFMETPSN PLTEISDIAA LAAVARKAGA 
WLAVDNCFCS PALQRPLEWG ADLVIHSATK YLEGQGRVLG GAVLGKRDLV MDGGIFGFLR 
TAGPTLSPFN AWVILKGMET LNLRMERHSE NALEIARWLE AQPGVAKVHY PGLPSHPQYE 
LASRQQKTGG GIVSFELKNG REAAWRVVDS VRMISITANL GDAKSTLTHP ATTTHGRISQ 
ENRDAAGITE GLLRIAVGLE AVKDIKADLA RGLTR