Gene Tery_5008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_5008
Symbol	aroB
ID	4246663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	7651699
End bp	7652790
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	42%
IMG OID	638109818
Product	3-dehydroquinate synthase
Protein accession	YP_724394
Protein GI	113478333
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCCA TCACTGTTCA ACTTCCCCAA AAATCCTATG AAATAGCGAT CGCTTCAGGC 
CACCTCGACC AACTTGGCAG AAAAATGGAA TCCCTCAACC TGGGAAAAAA GGTCTTGCTG 
GTATCCAACC CAGAAATATT TGCTCATTAT GGCGAAAGAG CAATTATCTC ACTCCAAGAA 
GCCGGTTTTG ATGTCTCGGA CTGCATTCTC CCCTCAGGAG AAGAATATAA AACTCCTCAA 
AACCTTAACT GTATTTATGA TGCAGCTTTA GCACACCGTC TCGAACGCTC TTCCACAATA 
GTCGCTCTTG GTGGTGGAGT AGTTGGGGAT ATGACCGGGT TTGCTGCGGC AACTTGGTTA 
CGCGGTTTGA ATGTAGTACA AGTTCCTACT TCTCTTTTGG CGATGGTCGA TGCTGCTATT 
GGTGGAAAAA CAGGAGTTAA TCATCCTCAA GGCAAAAATC TTATCGGTGC TTTCCATCAA 
CCACGGTTAG TCTTAATTGA TCCAGAGGTA CTAAAGACTT TACCCTTGCG AGAATTTCGG 
GGAGGGATGG CAGAAGTGAT CAAATATGGA GTTATATGGG ATGCCGAGTT GTTTTTTCAA 
ATGGAAAATA GTCAGAGTCT TGATGACATT AACAATTTAA CACCAGGGTT ATTAGAGGAA 
ATCTTGATTA AGTCTTGCCA AAGTAAAGCA CATGTGGTAG CAAAAGATGA GAAAGAATCT 
GGGTTAAGAG CAATTTTGAA TTACGGTCAT ACCATAGGTC ATGCAGTGGA AAGTTTGACT 
GGTTATACCG CGGTGACTCA TGGTGAGGCG GTCAGTATTG GGATGGTGGC AGCAAGTGGG 
TTAGCATTAG AGTTAGGAAT GTGGGATGAG CAGAGCGATC GCCGTCAGTT AGTCTTGATA 
GAAAAAGCTA GTTTGCCAAC CAAACTTCCG GATGGCTTGG ATATTGATGA TATTTTGGTT 
TCTTTACAGA CAGATAAAAA GGTAAAAGCA GGTAAGGTAC GATTTGTTTT ACCTACTGGA 
ATAGGATCAG TTACAGTGAC AGATAAGGTA AGTCAAGATG TGTTGAGGAG AGTATTGTTG 
AGAATCAGTT AA

Protein sequence

MASITVQLPQ KSYEIAIASG HLDQLGRKME SLNLGKKVLL VSNPEIFAHY GERAIISLQE 
AGFDVSDCIL PSGEEYKTPQ NLNCIYDAAL AHRLERSSTI VALGGGVVGD MTGFAAATWL 
RGLNVVQVPT SLLAMVDAAI GGKTGVNHPQ GKNLIGAFHQ PRLVLIDPEV LKTLPLREFR 
GGMAEVIKYG VIWDAELFFQ MENSQSLDDI NNLTPGLLEE ILIKSCQSKA HVVAKDEKES 
GLRAILNYGH TIGHAVESLT GYTAVTHGEA VSIGMVAASG LALELGMWDE QSDRRQLVLI 
EKASLPTKLP DGLDIDDILV SLQTDKKVKA GKVRFVLPTG IGSVTVTDKV SQDVLRRVLL 
RIS