Gene Cmaq_0807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0807
Symbol
ID	5708720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	842454
End bp	843449
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	49%
IMG OID	641275310
Product	3-deoxy-7-phosphoheptulonate synthase
Protein accession	YP_001540632
Protein GI	159041380
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.021936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.252673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAATAA GGGTAACGCC AGGTAAGATT AATGAAGTTG CATCAGCTCT AGATAAGGCT 
AAGGTAAGGT TCAGGGAGGT TAAGCTGCTT GGTGAGGAGT TAATAGTGAC TTGGCCTGAA 
GACCCTGTTG ATGAGGGAGC CATTAGAGTG ATTGACCCTG GGGCAGTACT AGTTAACGTT 
AAGGCCAAGT ACCAGTTAGC CAGTAAGCAA TGGAGGCAGA GGAGCATTGT GGATGTTTCA 
GGGGTTAAGA TAGGGGGTGA TGATTTAGTG GTTGCAGCTG GGCCATGTGC AGTGGAGAGT 
TATGAGCAGG TTAAGGAGAC TGCCGAGGCA GTTAAGGGGG CTGGAGCAAG ACTACTGAGG 
GGTGGGGCGT TTAAACCTAG GACAAGTCCC TACAGTTTCC AGGGACTTGG AGTAGATGGC 
TTAAAGATAC TGAGGCGAGT CTCAGATGAG GTTGGTTTAC CCGTAGTCTC TGAGGTTATG 
GATACTAGGA TGGTTGAGGT GGTGGCCAGT TACGTTGACA TGATTCAGAT AGGGGCTAGG 
AATGCCCAGA ATTTTGACCT ACTTAAAGAG GCTGGTAAGA CTGGGAAACC AATACTACTC 
AAGAGGGGTA TGGGAAACAC GGTTGAGGAG TGGCTTCAGG CAGCGGAATA CATCATGCTT 
GAGGGTAATG GTAACGTAGT GCTTTGTGAA AGAGGGATAA GGACCTTTGA GAACGCCACG 
AGATTCACGC TGGACTTAGG TGCAGTGGTG GCGGCTAAGA AATTAACCCA CTTACCAATA 
TGCGTGGATC CATCACACCC AGCCGGTAAG AGGGAGTACG TTATTCCACT GGCCTTAGCC 
GCAGTGGCAG CTGGGGCAGA TATGATTATT GTTGAGGTTC ACCCAAGGCC GTGGGAGGCT 
TTATCAGACT CCGAGCAGCA ATTAACCTTC GATATGTTTA ATGAATTAAT GAGTAAGGCT 
AAGGCAGTAG CCCAGGCAAT AGGTAGGGGT ATATGA

Protein sequence

MIIRVTPGKI NEVASALDKA KVRFREVKLL GEELIVTWPE DPVDEGAIRV IDPGAVLVNV 
KAKYQLASKQ WRQRSIVDVS GVKIGGDDLV VAAGPCAVES YEQVKETAEA VKGAGARLLR 
GGAFKPRTSP YSFQGLGVDG LKILRRVSDE VGLPVVSEVM DTRMVEVVAS YVDMIQIGAR 
NAQNFDLLKE AGKTGKPILL KRGMGNTVEE WLQAAEYIML EGNGNVVLCE RGIRTFENAT 
RFTLDLGAVV AAKKLTHLPI CVDPSHPAGK REYVIPLALA AVAAGADMII VEVHPRPWEA 
LSDSEQQLTF DMFNELMSKA KAVAQAIGRG I