Gene Jann_3420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3420
Symbol
ID	3935894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	3467291
End bp	3469342
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	68%
IMG OID	637905794
Product	capsule polysaccharide biosynthesis
Protein accession	YP_511362
Protein GI	89055911
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3563] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTCG CAGGCGATAG CGGCACGGAG CCTTCCGAGG CCCCGTCCGC GCCCCGCCGC 
CGTGCCTATC ACTACAATGC AGGTTTCCTG ACCAACACGC GCGTGCGCCG CATCCTGGCG 
TTGGCGGGCT ATGACTTGAA GCTCGGCACA CCGGACGCGG CGGATGACGT CATCGTCTGG 
GGCCATTCCC CCTATGCGCC GCGCGGTGAG GCTGTGGCCG ACAGCACCGG CGCCCATCTG 
GTGCGGGTGG AGGATGCGTT CCTGCGCTCC CTCCGTCCGG GCCGTTCCGG CGAGCCGCCT 
CTGGGCCTCG TGATCGACCG GCGCGGCATG TATTTCGATG CCACGCGCGC CTCGGATCTG 
GAACATATCC TGGCCACGCA CCCCTTTGAT GACACGGCGC TCTTGAACCG CGCCCGCGAT 
GTCATGGCCC GGATGGCCGA GGGGCATCTG TCGAAATACG CCGCGACGGA CCCGGCACTG 
GATCCGCCCG CGCCCGGTTA CGTTCTGCTG ATCGACCAGA CCAAAGGCGA CGCCTCCATC 
CAGCTCGGTC AAGCCACGCC CGACAGCTTT GCCGAGGCGC TGACCTGGGC CCGCGAAGAC 
CATCCCGACG CCCATATCGT CGTCAAGACC CACCCCGAAA CCCGCGACGG CCACCGCCCC 
GGTCACTTTG ACCCGGACGG ACTGCCGCCC AATGTCTCTC TCGATGATCG CCCGATCAGC 
CTTTGGCGCA TGTTTGAAGG CGCGCGGGCC GTTTATACCG TGACCTCCCA AGCGGGGTTC 
GAGGCGATCC TGGCGGGCCA CAAGCCAGTC ACCTTCGGCG TGCCGTTCTA TGCCGGATGG 
GGTCTGACCG ATGACCGCCG CCCGGTGCCC GTCCGTCGCC AACGGGTGCT GACCCGCGCG 
CAATTGGTCG CCGGGGCGCT GTTGCTCTAC CCCACATGGT ACGACCCCTA CCGCGACGGG 
TTGGGAGAGG TCGAAGACAC CCTCGGCGCG TTGGAGGCCC AGGCCCGCAG CTGGCGAGAG 
GACCGCGCGG GCTACACCGC CATCGGGATG AGCCGTTGGA AAAGGGGGCA TTTGCGGGCC 
GGGTTCGGCC AACACGGGCC GCTGGACTTC GCCGATCAGC CTGTCGCAGG GCGGCCGACG 
CTGGTCTGGG CCGGGAAGGA AACGTCTGAG CTTCAGGCCG CCTGCGGTGA CGCGCACCTG 
CTGCGGATGG AAGACGGGTT CCTGCGGTCG CGCGGTCTGG GGGCCGATCT TGTGCCGCCC 
CTGTCCCTCG TTCTCGACGA CCTCGGCATC TACTACGACC CCACGCGCGA GAGCCGGTTG 
GAGCGGTTGA TTGCAGAGGC CGCAGCCCTT CCTCCCGCAC GCCTGGACCG GGCGGAGCGT 
CTTATCCAGA CCCTGCGTCG AACGGGTCTG ACCAAGTACA ATCTGCCCGG CGGGGCGCTG 
CCGGATATTC CCCCGGATCG ACCATTGGTC CTTATCCCGG GACAGGTCGA AGATGACGCC 
TCCATCCGAC TCGGCGCAGG CGCGATCACC ACCAACGCCG CGCTGTTGGC CGAGGCGCGC 
AGGCTCCACC CGGGCGCCTA TCTCATCTAC AAGCCCCACC CCGATGTGGA GGCCGGATTG 
CGCATCGGGG TCCTTCCGGA GGAGGCGCGC CACCTGGCCG ATCATATCGC CGAGACGACT 
GGGGCGGAGG CGCTGTTGGC CCTCTCCCCC CACGTCATCA CCATGACCTC CGCTATGGGA 
TTTGAAGCGC TGATCCGGGG CCTTCCCGTC ACGACCCTCG GCGCGCCGTT CTATGCCGGA 
TGGGGCCTGA CGACGGACCT CGGTGACGTG CCCCCGCGCC GCACGGCCCG CCCCTCCCTG 
GCCGCGCTCG TCCACGCCGC GCTGATCACC TATCCCCGCT ACATGGACCC TCGCACCGGC 
CTGCCCTGCC CCGTCGAAAT CGCGGTCGAG CGGCTGTCAT CCGGCGAGGG TATGCCGTCC 
AAACCGATCC TGCGTATCGT GGCAAAATTG CAAATCTGGC TGTCCGGTCA ATCCCGGCTC 
TGGCGTCGGT AG

Protein sequence

MALAGDSGTE PSEAPSAPRR RAYHYNAGFL TNTRVRRILA LAGYDLKLGT PDAADDVIVW 
GHSPYAPRGE AVADSTGAHL VRVEDAFLRS LRPGRSGEPP LGLVIDRRGM YFDATRASDL 
EHILATHPFD DTALLNRARD VMARMAEGHL SKYAATDPAL DPPAPGYVLL IDQTKGDASI 
QLGQATPDSF AEALTWARED HPDAHIVVKT HPETRDGHRP GHFDPDGLPP NVSLDDRPIS 
LWRMFEGARA VYTVTSQAGF EAILAGHKPV TFGVPFYAGW GLTDDRRPVP VRRQRVLTRA 
QLVAGALLLY PTWYDPYRDG LGEVEDTLGA LEAQARSWRE DRAGYTAIGM SRWKRGHLRA 
GFGQHGPLDF ADQPVAGRPT LVWAGKETSE LQAACGDAHL LRMEDGFLRS RGLGADLVPP 
LSLVLDDLGI YYDPTRESRL ERLIAEAAAL PPARLDRAER LIQTLRRTGL TKYNLPGGAL 
PDIPPDRPLV LIPGQVEDDA SIRLGAGAIT TNAALLAEAR RLHPGAYLIY KPHPDVEAGL 
RIGVLPEEAR HLADHIAETT GAEALLALSP HVITMTSAMG FEALIRGLPV TTLGAPFYAG 
WGLTTDLGDV PPRRTARPSL AALVHAALIT YPRYMDPRTG LPCPVEIAVE RLSSGEGMPS 
KPILRIVAKL QIWLSGQSRL WRR