Gene Jann_0331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_0331
Symbol
ID	3932772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	336913
End bp	338025
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	62%
IMG OID	637902676
Product	chorismate synthase
Protein accession	YP_508273
Protein GI	89052822
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.288386
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATGA ATTCCTACGG TCACCTGTTC CGCGTCACCA CCTGGGGCGA AAGCCATGGA 
CCTGCCCTGG GCGCGACAGT TGATGGCTGC CCTCCGGGGA TCGACGTCGA TGCGGCCGCG 
ATCCAGCACT GGCTCGACCG TCGCAAACCT GGCCAGAACA AATACACCAC CCAGCGGCGA 
GAGGCTGATG AGGTGGAGAT TTTGTCGGGC GTCTATGAAG GACAGTCCAC CGGCACCCCC 
ATCCAGCTCA TGATCCGCAA CACCGATCAG CGATCCAAGG ATTACGGCGA TATTGCCGAG 
AAGTTCCGGC CCGGCCATGC GGACATTACC TATTGGCAGA AATACGGTAT CCGTGATCCG 
CGTGGCGGCG GACGGTCAAG CGCGCGTGAG ACGGCAGCAC GGGTCGCCGC GGGTGGCGTG 
GCGCGTCTGG CGCTTGCGGC GCTGGTGCCT GCGGTGAAGA TCACAGGTTA CATGGTGCAA 
ATGGGGCCGC ACGGGATTGA TCGCGAGTGC TTCGATCTGG CGCAGGTGGA CGAAAACCCA 
TTCTGGGTCC CCGATGCCAA GGCCGCTGAT GAGTGGGCCG CCTACTTGGA TGGTTTGCGC 
AAGTCCGGCG ACAGCGTCGG TGCCGTGATT GAGGTTCGCG CCAGCGGGCT GCCCGCAGGT 
CTTGGGGCGC CGATCTATGG CAAGCTGGAT ACCGATCTGG CCGCCGCGAT GATGAGCATC 
AATGCCGTCA AAGGCGTGGA GATCGGCGAC GGCATGGCGG CCGCGGCGCT GACCGGCTCG 
GCCAATGCGG ATGAGATCCA TATGGGCGAT AATGGCCCTG AATATTCCTC AAACCACGCG 
GGCGGCATCC TTGGCGGTAT CTCCACCGGG CAGGACGTCA TCGTCCGGTT TGCGGTCAAA 
CCGACATCCT CCATCCTCAC GCCGCGCGCG ACGATCACCA AGGCGGGCAC CCCGGCCGAG 
ATCATCACCA AAGGCCGCCA CGATCCCTGT GTGGGAATCA GGGCTGTGCC GGTTGGCGAG 
GCGATGATGG CCTGTGTCGT GCTAGACCAC ATTTTGCTGC AAAGAGGGCA AATTGGTGGC 
AAAGTCGGGG AAACCCGGGG AAAAATCGGA TAA

Protein sequence

MSMNSYGHLF RVTTWGESHG PALGATVDGC PPGIDVDAAA IQHWLDRRKP GQNKYTTQRR 
EADEVEILSG VYEGQSTGTP IQLMIRNTDQ RSKDYGDIAE KFRPGHADIT YWQKYGIRDP 
RGGGRSSARE TAARVAAGGV ARLALAALVP AVKITGYMVQ MGPHGIDREC FDLAQVDENP 
FWVPDAKAAD EWAAYLDGLR KSGDSVGAVI EVRASGLPAG LGAPIYGKLD TDLAAAMMSI 
NAVKGVEIGD GMAAAALTGS ANADEIHMGD NGPEYSSNHA GGILGGISTG QDVIVRFAVK 
PTSSILTPRA TITKAGTPAE IITKGRHDPC VGIRAVPVGE AMMACVVLDH ILLQRGQIGG 
KVGETRGKIG