Gene Jann_3803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3803
Symbol
ID	3936283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	3888386
End bp	3889336
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	61%
IMG OID	637906181
Product	N-acetylmuramic acid-6-phosphate etherase
Protein accession	YP_511745
Protein GI	89056294
COG category	[R] General function prediction only
COG ID	[COG2103] Predicted sugar phosphate isomerase
TIGRFAM ID	[TIGR00274] N-acetylmuramic acid 6-phosphate etherase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0010924
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000127342
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGGAGTCG CTGCCGTGTT TACCGCCGTC CAGTCAGATC TTGGGGCACT TGTGTCCGAG 
GCGAGCAATT CGCGCTCTGC GGACATTGAT CTGATGACCA CAGCCCAGAT CCTGGCCTGC 
ATGAACGCCG AGGATCGTAA AATCGCCGAT GCCGTCGCAG CAGAGCTTCC CGCGATTGCC 
CAGACTGTTG ACAGGATCGT CGCAGCGATT GGCCGTGGCG GGCGCCTTAT CTACATCGGT 
GCGGGCACCA GCGGTCGTTT GGGCGTATTG GATGCATCTG AATGCCCGCC CACGTTTTCC 
GTCCCTCCCG GCATGGTGGT TGGCCTGATC GCCGGTGGCG ACACAGCGCT GCGCACCTCG 
GTTGAGGCGG CCGAAGATGA TGAGGCAACG GGTGCGGAGG ACGTGAAAGC CATCGGGCTG 
ACAACCAAAG ATGTCGTCAT CGGTATCGCG GTCAGTGGCA GAACCCCCTT CGTGATGGGC 
GCGATAGACT ACGCCCGCCG CATTGGCGCG TTCACTGCCG CGCTGACCTG CAACCCAGGC 
TCGCCCATGG CGGACCTTGC TGACATCGCG ATCTCACCCG TTGTCGGGCC GGAGGTTGTG 
ACCGGCTCCA CGCGCCTCAA ATCCGGGACC GCGCAAAAAA TGATCCTGAA CATGCTGAGC 
ACCGCCAGCA TGATCCGCCT TGGTAAGACA TGGGGCAACC GGATGGTGGA TGTGACGATT 
TCAAATCGGA AATTGGCGGA CCGCGCCACT GCCATGTTGC GGGATGCCAC CGGGTGCAGC 
GCCGATGATG CGCGTACTTT GCTGGACCAA AGCAATGGCA GCGTGAAACT TGCCATCCTG 
ATGCAGATTA CGGGCTGTGA CGCAGATGCG GCCCGCGCAA ATCTGGAGGC TGAAAACGGC 
TTCCTGCGCA AAGCCATTGA ACGAGCGGAG AAAACTCCGC CGCAAAGCTA G

Protein sequence

MGVAAVFTAV QSDLGALVSE ASNSRSADID LMTTAQILAC MNAEDRKIAD AVAAELPAIA 
QTVDRIVAAI GRGGRLIYIG AGTSGRLGVL DASECPPTFS VPPGMVVGLI AGGDTALRTS 
VEAAEDDEAT GAEDVKAIGL TTKDVVIGIA VSGRTPFVMG AIDYARRIGA FTAALTCNPG 
SPMADLADIA ISPVVGPEVV TGSTRLKSGT AQKMILNMLS TASMIRLGKT WGNRMVDVTI 
SNRKLADRAT AMLRDATGCS ADDARTLLDQ SNGSVKLAIL MQITGCDADA ARANLEAENG 
FLRKAIERAE KTPPQS