Gene PCC8801_4169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4169
Symbol
ID	7105992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4371164
End bp	4372531
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	47%
IMG OID	643477156
Product	Aldehyde Dehydrogenase
Protein accession	YP_002374255
Protein GI	218248884
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTATCG CTACGGTTAA CCCAGCAACG GGGGAAACCC TAAAAACCTT TGAACCGCTA 
ACGCCATCGG AAATTGAAGC GAAACTTGCT CTCGCGGATG CAACCTTTAA ACAATACCGC 
AAAACCTCAA TGGTGCAGCG TAGCCAATGG TTAAAGCAAG CAGCAGATAT TTTAGACAAA 
GATAGCCAAA AATGGGGCGA ATTAATGACC TTAGAAATGG GGAAACCCAT TAAAGGCGCG 
ATCGCAGAAG CTAAAAAATG CGCCCTCGTC TGCCGTTATT ATGCCGAAAA CGCTCCTGAA 
TTTCTCAAAG ATACTCCCGT TTCTACCGAT GCTAGTCGTA GTTTTATTCG CTACCAACCA 
TTAGGTATTA TTTTAGCGGT TATGCCTTGG AATTTTCCTT TCTGGCAAGT TTTTCGCTTT 
GCAGCCCCCG CTTTAATGGC CGGAAACGTT GGTATCCTCA AACACGCTTC TAACGTCCCT 
CAATGCGCTT TAGCCATTGA AACCATTCTT AAATCCGCCG GATTTCCTGA AGGAGCGTTT 
CAAACGCTGT TAATTACCGC CAACCAAGTA GAAGCAGTGA TCAACGATGA TCGCGTCAAA 
GCAGCAACCC TAACGGGAAG CGAATATGCA GGGGCAAGTC TAGCCTCAGC CGCCGGTAAA 
CACATCAAAA AAACCGTCCT TGAATTGGGG GGGAGCGACC CGTTTATTGT TCTCGAAAGT 
GCGGACTTGG AAGCAGCCGC GACGACTGCT GTTACCGCCC GAATGCTCAA TAACGGACAA 
TCTTGTATCG CAGCAAAACG GTTTATCCTA GTAGATGCGA TCGCCGATCG CTTTGAACAG 
TTGTTAGCCG AAAAATTCCA AACCTTGAAA GTGGGTGATC CCCAGTCAGA GGATACTGAC 
ATTGGTCCGT TGGCCACTGC TTCTATTCGG CAAGAGATTG AACAGCAAGT TCAAGAAACG 
GTAACAAAAG GGGCTAAAAT TGTGATTGGA GGCCAATCTT ACCGCGATCG TCCTGGTAAC 
TTCTACCCGC CTACCATTTT AAAAGATATT CCGATGGATT CCCCTGGTTA TAGCGATGAG 
TTCTTTGGAC CGGTGGCTTT ACTCTTTCGG GTTAAAGATA TCGACGAAGC AATCGAATTA 
GCTAATAGTA CCATTTTTGG TTTGGGCGCG AGTGGGTGGA CTCACGATGC GACAGAACAA 
GAACGGTTAA TCGAGGAAAT TGAGTCTGGA TGCGTCTTTA TCAATGGGAT GGTTAAATCC 
GATCCCCGTC TGCCCTTTGG GGGAATCAAG CGATCGGGTT ACGGACGGGA ATTGAGTAGC 
CAAGGCATTC AGGAATTTGT TAATGTCAAA ACCGTTTGGA TTAAGTGA

Protein sequence

MGIATVNPAT GETLKTFEPL TPSEIEAKLA LADATFKQYR KTSMVQRSQW LKQAADILDK 
DSQKWGELMT LEMGKPIKGA IAEAKKCALV CRYYAENAPE FLKDTPVSTD ASRSFIRYQP 
LGIILAVMPW NFPFWQVFRF AAPALMAGNV GILKHASNVP QCALAIETIL KSAGFPEGAF 
QTLLITANQV EAVINDDRVK AATLTGSEYA GASLASAAGK HIKKTVLELG GSDPFIVLES 
ADLEAAATTA VTARMLNNGQ SCIAAKRFIL VDAIADRFEQ LLAEKFQTLK VGDPQSEDTD 
IGPLATASIR QEIEQQVQET VTKGAKIVIG GQSYRDRPGN FYPPTILKDI PMDSPGYSDE 
FFGPVALLFR VKDIDEAIEL ANSTIFGLGA SGWTHDATEQ ERLIEEIESG CVFINGMVKS 
DPRLPFGGIK RSGYGRELSS QGIQEFVNVK TVWIK