Gene PCC8801_1377 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1377
Symbol
ID	7103068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1440560
End bp	1441720
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	46%
IMG OID	643474456
Product	citrate synthase
Protein accession	YP_002371593
Protein GI	218246222
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01800] 2-methylcitrate synthase/citrate synthase II

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTAT GTGAATATAT ACCCGGGTTA GAAAATATTC CCGCGGCCAA ATCAAGTATC 
AGCTATGTGG ATGGTCAAGA GGGCATACTG GAATATCGAG GCATTCGCAT CGAAGAACTA 
GCAACAAAAG GTAGCTTTGT AGAAACCGCC TATCTCCTCA TTTGGGGTGA ACTACCCACC 
CAAGAAGAAC TCGATGCCTT TGAAGGGGAA ATTCGTTACC ATCGCCGCAT CAAATACCGC 
ATCCGTGACA TGATGAAGTG TTTTCCTGAA ACGGGACACC CCATGGATGC TTTACAAACC 
TCAGCAGCAG CGTTAGGTTT GTTTTACGCC CGTCGCGCCT TGGATAACCC GGATTATATT 
CGACAAGCGG TCGTTCGTCT ATTAGCCAAA ATTCCGACGA TGGTAGCAGC CGCCCATCAA 
ATGCGCCGAG GAAATGATCC CATTCAACCC AACGATAACC TAGATTATGC TGCCAATTTC 
CTCTACATGA TGACGGAACA AAAACCTGAC CCCCTAGCAG CAAAAATTTT TGATGTTTGT 
CTGACGCTTC ATGCGGAACA CACCATCAAT GCGTCTACTT TCTCGGCCAT GGTAACGGCT 
TCTACCTTAA CCGATCCCTA TGCCGTTGTC GCTTCGGCGG TAGGAACCTT AGCCGGTCCC 
TTACACGGGG GGGCAAACGA GGAAGTTTTA GCGATGTTAG AGGAAATTGG GTCAGTGGAA 
AATGTTCGTC CCTACATCGA AAAGTTGGTA GCCAATAAAC AGAAAATTAT GGGGTTTGGC 
CATCGAGTTT ATAAGGTTAA AGATCCTCGC GCTACTATTC TGCAAAATTT AGCGGAACAA 
CTCTTTGAAA AAACTGGCCG TGATGAATAT TATGCCATTG CCCAAGAAGT GGAAAAAGTG 
GTGGAAGAAA AGTTAGGGCA TAAAGGAATT TATGCTAATG TGGACTTCTA TTCGGGGTTA 
GTTTACCGTA AGTTAGGCAT TCCCAGTGAT TTGTTTACGC CCTTATTTGC GATCGCGCGC 
GTAGCGGGAT GGTTAGCCCA TTGGAAGGAA CAATTAGCTG TTAACCGTAT TTTCCGTCCT 
ACCCAAGTTT ACATCGGCGA ACGCAATCAG CCCTATGTTC CCATGGAAAA ACGGCTCATG 
GTTAACCGTA ATGGCTTATA G

Protein sequence

MNVCEYIPGL ENIPAAKSSI SYVDGQEGIL EYRGIRIEEL ATKGSFVETA YLLIWGELPT 
QEELDAFEGE IRYHRRIKYR IRDMMKCFPE TGHPMDALQT SAAALGLFYA RRALDNPDYI 
RQAVVRLLAK IPTMVAAAHQ MRRGNDPIQP NDNLDYAANF LYMMTEQKPD PLAAKIFDVC 
LTLHAEHTIN ASTFSAMVTA STLTDPYAVV ASAVGTLAGP LHGGANEEVL AMLEEIGSVE 
NVRPYIEKLV ANKQKIMGFG HRVYKVKDPR ATILQNLAEQ LFEKTGRDEY YAIAQEVEKV 
VEEKLGHKGI YANVDFYSGL VYRKLGIPSD LFTPLFAIAR VAGWLAHWKE QLAVNRIFRP 
TQVYIGERNQ PYVPMEKRLM VNRNGL