Gene Jann_1854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1854
Symbol
ID	3934305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	1841576
End bp	1842769
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	64%
IMG OID	637904208
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_509796
Protein GI	89054345
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.58476
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00243487
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAAGATA CCGCTCGCAA ACACTGGTCC AAACGCACCC GCGCGGTGCA TGCAGGCTCC 
CGCCGCAGCC AATACGGAGA GCTGTCGGAA GCGATGTTCC TGACGCAGGG CTTCGTCTAT 
CCCACCGCCG AGGATGCGGA GGCCCGTTTC ATCAAATCCG GCGAGGATGA GTATATCTAC 
GCCCGCTACG GCAACCCGAC CGTGGCGATG TTTGAAGACC GCATCGCGTC GCTGGAAGGG 
GCGGAGGCGG GCTTTGCCAC GGCCTCGGGC ATGGCGGCAG TCAATGGCGC GCTCACGTCG 
ATGCTGCGGG CGGGCGATCA CGTGGTGTCG TCCCGCGCGC TTTTTGGGTC GTGTCATTAT 
GTCTTGGACG AGATCCTGAC CCGGTTTGGC GTGGACGTCA CCTTCGTGGA CGGCCCCGAT 
CTGGACGCGT GGCGCGCCGC CATGCGCCCG GACACCAAGG CGGTGTTCTT CGAATCGCTC 
TCCAATCCCA CGCTGGAGAT GATCGACATT CGCGCCGTGG CTGAGATCGC CCATGCCGTC 
GGTGCGACGG TCATCTGCGA TAACGTCTTT GCCACCCCCA CGTTCAGCGA TGCCATCGCC 
CAAGGCGTCG ATGTCGTTGT CTATTCCACC ACCAAACACA TTGACGGGCA GGGGCGCTGT 
CTGGGGGGCG TGATCCTGGG GACGGAAGAA TTTATCCGCA AAACGGTGGA GCCTTACCTC 
AAGCACACCG GCGGCGCGAT GTCGCCCTTC AACGCGTGGG TGATGCTGAA GGGGCTGGAG 
ACGATGGACC TGCGGGTGCG GGCGCAAACT GCGTCGGCTC AGGCGATTGC GGAGGCGCTG 
CAAGATGCGC CCGGTGTGGC GCGGGTGATT TATCCCGGCC TCGCCGACCA CCCCCAGCAC 
GCGCTCTGCC AGGCGCAGAT GGGCGAGGGG GGGACCGTCG TTGCGGTGGA GGCCACGGAT 
GGACAGGCGG GGGCGTTCCG CGCGCTCAAT GCGCTGGAGA TCTTCACGAT TTCCAACAAT 
CTTGGCGATG CGAAGTCCAT TGCCACCCAT CCCACGACGA CCACCCACCA GCGCCTGACC 
GATGAGCAGC GCGCGGAGAT GGGGATCACG CCGGGCCTGA TCCGTCTGTC GATCGGCTTG 
GAAGACACCG ATGATCTGGT CGCAGACCTG CTTGATGCGT TGGAACTGGC ATGA

Protein sequence

MKDTARKHWS KRTRAVHAGS RRSQYGELSE AMFLTQGFVY PTAEDAEARF IKSGEDEYIY 
ARYGNPTVAM FEDRIASLEG AEAGFATASG MAAVNGALTS MLRAGDHVVS SRALFGSCHY 
VLDEILTRFG VDVTFVDGPD LDAWRAAMRP DTKAVFFESL SNPTLEMIDI RAVAEIAHAV 
GATVICDNVF ATPTFSDAIA QGVDVVVYST TKHIDGQGRC LGGVILGTEE FIRKTVEPYL 
KHTGGAMSPF NAWVMLKGLE TMDLRVRAQT ASAQAIAEAL QDAPGVARVI YPGLADHPQH 
ALCQAQMGEG GTVVAVEATD GQAGAFRALN ALEIFTISNN LGDAKSIATH PTTTTHQRLT 
DEQRAEMGIT PGLIRLSIGL EDTDDLVADL LDALELA