Gene Jann_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1039
Symbol
ID	3933483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	992039
End bp	993238
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	64%
IMG OID	637903387
Product	hypothetical protein
Protein accession	YP_508981
Protein GI	89053530
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCA GCAGAGAGGG CTCCGGCGCG GCCCGTTTCA CGCGACCCAC GCAGCAGATC 
CTGCTGATGT TGATCATCCT TGCCCTTGTG TTGGCGGGGG GCATTTTGGT GTGGCCCCGG 
GTGCAGGATG TGTTCCTGAC CTCCCCCTAT CTCAACGGCA CAATCGGGAT CGTCTTCGTG 
GTCGGCGTCT TCGCGACCTT CTTTCAGGTG ACGCAGCTGT TCTCCTCGGT CGCGTGGATT 
GAGCATCTGG CGGGCGGATC GAAGACCGAT GAGGATGAGA AACCGCCGCG CCTGCTGGCG 
GCGATCTCGG GCGTGGCGCG GTTGCGCGGG TCCCGCACAC AAGTGACGCC TGCCTCTGCG 
AAATCCATCC TTGATAGCGT TGGCGCGCGG ATGGAGGAAA GCGGCGACAT CACGCGCTAC 
ATCGCCAACC TTCTGATTTT CCTCGGCCTT CTGGGCACGT TCTTTGGCCT TGCAACAACA 
GTGCCCGCGG TGGTGGAGAC CATCCGATCC CTGCAACCCA CGGATGGGGA AGAAGGGCTG 
GCCGTGTTCG GGCGCCTTAT GGATGGCTTG GACGACCAGC TTGGGGGCAT GGGGACGGCG 
TTTGCCTCCT CGCTGCTGGG CCTTGCCGGA TCCCTCGTGA TCGGCCTGTT GGAACTTTAT 
GCGGGCCATG GCCAGAACCG GTTTTATCGG GAGTTGGAGG AATGGCTGGC CTCCATCACC 
CGCGTATCCT TCTCTGGCGA CGGCGACGGG GCCATCGACA AGGCGGCGAT CGCCACTGTG 
CTGGACCATA TGGTTGACCA GATGGACACG CTGCAATCGC TATTTTCCCA GTCCGAGACG 
CGTCGCGCGG CCACCGAACA GCGCGTTCTG ACCCTGGCGC AGAGCATTGA GGGCCTGACT 
GATCGCCTTG GTCCGGGGCA GGTGGCGGCG GTTGAACGGC TGGCCACGGC ACAAGATCGT 
CTTGCCGCAG CGCTGGACGG TGTGGCTGCG GAGCAGGGGC TTGATGACGA ATCCCGCAAC 
AGGTTGCGGT CCATTGACGT GCAATTGTTC AAAATGGCTG AAGAGATCGG CACCACCCGC 
GACGCCGAGG TTATGGGGCT GCGCGGGGAT CTGGCGCATC TGACCGAAGC CTTGCAAGAA 
CTGACCCGCG CCGCTCGCGC CCCGGCGCAG GCCCGGGTGC GCCAACGCGG GGACAGCTAG

Protein sequence

MASSREGSGA ARFTRPTQQI LLMLIILALV LAGGILVWPR VQDVFLTSPY LNGTIGIVFV 
VGVFATFFQV TQLFSSVAWI EHLAGGSKTD EDEKPPRLLA AISGVARLRG SRTQVTPASA 
KSILDSVGAR MEESGDITRY IANLLIFLGL LGTFFGLATT VPAVVETIRS LQPTDGEEGL 
AVFGRLMDGL DDQLGGMGTA FASSLLGLAG SLVIGLLELY AGHGQNRFYR ELEEWLASIT 
RVSFSGDGDG AIDKAAIATV LDHMVDQMDT LQSLFSQSET RRAATEQRVL TLAQSIEGLT 
DRLGPGQVAA VERLATAQDR LAAALDGVAA EQGLDDESRN RLRSIDVQLF KMAEEIGTTR 
DAEVMGLRGD LAHLTEALQE LTRAARAPAQ ARVRQRGDS