Gene PCC8801_3702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3702
Symbol
ID	7102947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3893122
End bp	3894318
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	42%
IMG OID	643476711
Product	thioester reductase domain protein
Protein accession	YP_002373814
Protein GI	218248443
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3320] Putative dehydrogenase domain of multifunctional non-ribosomal peptide synthetases and related enzymes
TIGRFAM ID	[TIGR01746] thioester reductase domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTATT CTTTAGCGAA GGGTAACTTA AATCGGGAAG CATACCTAGA TCCATCTATC 
CAATATCTAC CCCTATCCCC GTTTAGACAA CGGACTAAAC GGAGAGCATT TTTGACGGGA 
GCAACGGGTT TTCTGGGTGC TAACCTACTC CACGATCTGC TCAAACACAC TCTTTTTGAA 
GTATATTGCT TAGTACGCGC ATCAAACGCC GATGAAGGGA AAGTCAAACT ACGCCAGGCT 
CTTAAAGCGC AAAATCTCTG GATGAAAGCC TTTGAATTTA GGATACATCC AGTTGTTGGC 
GACTTAAGCA AACCTCAGTT AGGACTTTCC GATGCTGCCT TTGCAAGTTT GGGTAAACAG 
ATAGAAGTCA TCTATCACAA TGCTTCTTGG CTCAATCTCT CCTATCCTTA CTCGACTCTC 
AAAGCGACTA ACGTCAAGGG AACAGAAGAA ATTCTTCGAC TCGCAGCGAT TAAACCACAG 
ATCGCCGTAC ACTATGTTTC AACGCTTTCT GTCTTCAGTC CTCGCGTTTA CAATAATCAA 
TCAGAAATTG CGGAATGCTT CTGGGTACAA GAACCCATTG GATTACAGCA AGGTTATCCT 
CAAAGTAAGT GGGTTGCGGA ACAGTTAATC AATATCGGGT CACAACGCGG ACTTTTTGCC 
TGGATTTACC GACCTGGAAT GATTACCGGC CATAGTGAAA CGGGTATCTG TAACAATAAG 
GATAAATTCT CTATTCTGCT ACGGACTTGC CTTGAGCTTG GTTTAGTGCC AGAATTTAAA 
GGAACTGTTT ACATGACTCC TGTTGATTAT GTCAGTCGCT CAATTATCGA GCTTTCAGAA 
TTAGTCAGCG AAACTGATCA AGCTTTTCAT CTGATTACAC CCCAACCAAT GTCTTGGACA 
AAAGTTGTTA AAACAATGCT TGATACTTAT CCTACTATGA ACTCGATGCC TTATAGTCTT 
TGGTTTAAGG AAGTTCAGCA ATCAGCTAGA CAGTCGGTGA GTCAGGAACT GCGGACTTTA 
GTTGCCTTAC TTTTTCATCC GACCATTCCA CCCTTTTCGA CTAATCAAGA CGTACAGTTT 
AGCTGTGAGA ACACCATGAA GGTGTTATCC ACTAAGTTTA ACATTGAATG GACACAAGAT 
AATCCAACCT TATTAAGACG CTACCTCTCT TATTTAGCGG AAGTTCCCTC CTGGTAA

Protein sequence

MSYSLAKGNL NREAYLDPSI QYLPLSPFRQ RTKRRAFLTG ATGFLGANLL HDLLKHTLFE 
VYCLVRASNA DEGKVKLRQA LKAQNLWMKA FEFRIHPVVG DLSKPQLGLS DAAFASLGKQ 
IEVIYHNASW LNLSYPYSTL KATNVKGTEE ILRLAAIKPQ IAVHYVSTLS VFSPRVYNNQ 
SEIAECFWVQ EPIGLQQGYP QSKWVAEQLI NIGSQRGLFA WIYRPGMITG HSETGICNNK 
DKFSILLRTC LELGLVPEFK GTVYMTPVDY VSRSIIELSE LVSETDQAFH LITPQPMSWT 
KVVKTMLDTY PTMNSMPYSL WFKEVQQSAR QSVSQELRTL VALLFHPTIP PFSTNQDVQF 
SCENTMKVLS TKFNIEWTQD NPTLLRRYLS YLAEVPSW