Gene PCC8801_4183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4183
Symbol
ID	7104581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4387578
End bp	4388678
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	39%
IMG OID	643477170
Product	3-dehydroquinate synthase
Protein accession	YP_002374269
Protein GI	218248898
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAATTA TTATTCCTGT TAAGTTACCC CATACTTCTT ACAACATTGC GATCGCCCCT 
GGTAGTCTTT CTCAGTTAGG AAGCCATCTA GAACCCCTCA AATTAGGTCA AAAAATCCTG 
ATCATTTCTA ACCCTGAAAT TTTTAACTAT TATGGTGATG TAGTTGTCAA TTCCCTCAAG 
AAATCAGGTT TTGAAGTATT TACCCATCTT ATTCCGGCCG GAGAAGCTTA CAAAACTCTA 
GACTCCATCG CCCAAGTCTA TGATACCGCC TTAGAACATC GGTTAGAAAG GTCATCAACA 
ATGATAGCCC TAGGGGGAGG GGTCATTGGG GATATGACGG GGTTTGCTGC GGCAACTTGG 
CTAAGGGGAA TCAATTTTGT TCAGGTGCCC ACCTCTCTAT TAGCCATGGT AGATGCTTCT 
ATTGGGGGTA AAACAGGGGT CAACCATCCC CAAGGAAAAA ACCTCATTGG AGCCTTTTAT 
CAACCCCGTT TAGTGTTTAT TGATCCTTCG GTGTTAAAGA CGTTGCCTGT GCGGGAATTT 
CGGGCAGGAA TGGCGGAAGT CATTAAATAT GGCATTATTT GGGATAAAGC GTTATTTGAG 
CAATTAGAAC AAGCCAAAAC ACTCGATCAT CTTAATAGTT TAAATGATGA ATTATTGCAA 
ACCATTATTA CCCGTTCTTG TCAAGCGAAG GTCGATGTTG TTAGCCAAGA TGAAAAAGAA 
AGTGGTTTAA GAGCTATTTT GAATTATGGT CATACTATTG GTCATGCAAT AGAAAGTTTA 
ACCGGATATG AAACCATTAA TCATGGTGAA GCGGTAGCAA TGGGGATGGT AGCTGCGGGA 
AAAATCGCCA TTAAATTATC ATTATGGACA CAAGAAGAAA CCATTCGACA AGACCAGTTA 
ATTGACAAAG TTGGATTAAT TTCTACCATT CCTAAGACGC TAGATATTGA TCAAGTGATT 
GAGAGTTTAC AGAGCGATAA AAAAGTCAAA AGCGGAAAAG TTCGGTTTAT TCTCCCAACG 
AGCATTGGTA AGGTTATTAT TAGCGATCAA GTTTCTTCGG AAATTATTAA ATCAGTTATG 
ATTCATCAGG TTAATAAGTA A

Protein sequence

MSIIIPVKLP HTSYNIAIAP GSLSQLGSHL EPLKLGQKIL IISNPEIFNY YGDVVVNSLK 
KSGFEVFTHL IPAGEAYKTL DSIAQVYDTA LEHRLERSST MIALGGGVIG DMTGFAAATW 
LRGINFVQVP TSLLAMVDAS IGGKTGVNHP QGKNLIGAFY QPRLVFIDPS VLKTLPVREF 
RAGMAEVIKY GIIWDKALFE QLEQAKTLDH LNSLNDELLQ TIITRSCQAK VDVVSQDEKE 
SGLRAILNYG HTIGHAIESL TGYETINHGE AVAMGMVAAG KIAIKLSLWT QEETIRQDQL 
IDKVGLISTI PKTLDIDQVI ESLQSDKKVK SGKVRFILPT SIGKVIISDQ VSSEIIKSVM 
IHQVNK