Gene PCC8801_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1037
Symbol
ID	7104254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1092723
End bp	1094069
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	47%
IMG OID	643474128
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_002371268
Protein GI	218245897
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATCTA TTACCATCAA ACCTGTTGAA AATCAACAAG ATTTAATCAT TGATAATTCC 
GATCAAAATG TTTCATTACA AGGAACCCTT AAAATTCCTG GCGATAAATC GATCTCCCAT 
CGATCGCTAA TGTTAGGGGC GATCGCACAA GGAGAAACCA TCATCGAGGG ACTCTTATTA 
GGGGAAGATC CCCGCAGTAC CGCCGCCTGT TTTCGCGCCA TGGGGGCAGA AATTTCGCCC 
CTCAATAGCC AAAGCATCAC CGTAAAAGGG GTGGGATTGG GAAACCTCCA AGAACCCCTA 
GATATCCTCG ATGCGGGCAA TTCTGGAACC ACCATGCGGT TAATGTTGGG GTTTCTTGCG 
TCCCATCCTG GCCGCTTTTT CTGCGTCACG GGGGACAATT CCCTGCGATC GCGTCCGATG 
TCCCGCGTCG TCAAACCCTT GCAAGAAATG GGGGCAAACA TTTGGGGTCG TCAGCAAAAT 
TCCCTTGCCC CCCTCGCCAT TCAAGGGCAA AACCTGACTC CTATCCATTA TCATTCCCCC 
ATTGCCTCAG CGCAAGTTAA GTCCTGTATC TTACTCGCGG GACTGATGAC AGAGGGCAAA 
ACGACGGTGA CAGAACCCAC TTTATCGCGG GATCACAGCG AACGGATGTT ACAAGGGTTT 
GGGGCTCAGT TGGAGATCGA TCCCGAAACC CATAGCGTCA CTATTACAGG AAAACCGACC 
TTAATTGGTC AAAAAGTGGT GGTTCCAGGG GATATTAGTT CCGCAGCCTT TTGGTTAGTG 
GCCGGGGCGA TCGTTCCAGG GTCAGAATTA TTAATAGAAA ATGTGGGAAT TAATCCAACG 
CGAACGGGAA TTTTAGAAGC TTTAGAAATG ATGGAAGCTG ATATTAAATT AGAAAATAAA 
CGGATTGTAA CAGGCGAACC TGTGGCGGAT ATACGGGTTA AATTTAGTCA ATTAAAAGCC 
TGTACTATTG GCGGTGATTT GATTCCTCGT TTAATCGATG AGATTCCTAT TTTAGCAGTA 
GCTGCGGTCT GTGCCCAAGG GACGACTATT ATTAAAGATG CAGCCGAATT ACGGGTTAAA 
GAAAGCGATC GCTTAGCGGT AATGGCTTCA GAATTAAGCC GCATGGGAGC AAAAATTACT 
GAGTTACCTG ATGGGTTAGA AATTACCGGA GGAACCCTGT TAAAAGGAGA GGAAGTTGAT 
AGTTATACCG ATCATCGCAT CGCTATGAGT TTAGCGATTG CTTCCCTTAT TGCTAAGGGT 
TCAACCACCA TTCATCGCGC GGAAGCTGCT GCGGTTTCCT ATCCTGAATT TGTTACCACT 
TTGCAACAGG TGATTCAAGT TAGTTGA

Protein sequence

MTSITIKPVE NQQDLIIDNS DQNVSLQGTL KIPGDKSISH RSLMLGAIAQ GETIIEGLLL 
GEDPRSTAAC FRAMGAEISP LNSQSITVKG VGLGNLQEPL DILDAGNSGT TMRLMLGFLA 
SHPGRFFCVT GDNSLRSRPM SRVVKPLQEM GANIWGRQQN SLAPLAIQGQ NLTPIHYHSP 
IASAQVKSCI LLAGLMTEGK TTVTEPTLSR DHSERMLQGF GAQLEIDPET HSVTITGKPT 
LIGQKVVVPG DISSAAFWLV AGAIVPGSEL LIENVGINPT RTGILEALEM MEADIKLENK 
RIVTGEPVAD IRVKFSQLKA CTIGGDLIPR LIDEIPILAV AAVCAQGTTI IKDAAELRVK 
ESDRLAVMAS ELSRMGAKIT ELPDGLEITG GTLLKGEEVD SYTDHRIAMS LAIASLIAKG 
STTIHRAEAA AVSYPEFVTT LQQVIQVS