Gene Cyan8802_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3039
Symbol
ID	8392369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3074452
End bp	3075522
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	45%
IMG OID	644980988
Product	oxidoreductase domain protein
Protein accession	YP_003138720
Protein GI	257060832
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGAGC AACAACCGAC CTTAACAGGA CAAAGGAACC CCTTTGACCC CATTCGTATT 
GGCGTAATTG GGGTCGGTAA TATGGGGCAA CATCATACCC GTATTCTCAG CTTACTGAAA 
GACGTGGAAT TTGTCGGCGT TTCCGATGTT AATGTAGAAC GTGGCCTCGA TACAGCTAGT 
AAGTATCGGG TACGATTCTT TGAAAATTAC CATGATTTGC TGCCCCATGT CGATGCCGTT 
TGTATCGCTG TTCCAACTCG GCTGCATCAC TCTGTCGGGA TGGACTGTCT TAAGGCAGGT 
GTCCACACTC TGATTGAAAA GCCTATTGCG GCGAGTATCG CTGAAGCAGA ATCCTTAGTC 
AATGCTGCAG CTTCATCCCA TGGAATCCTA CAAGTAGGAC ACATTGAACG GTTTAACCCT 
GCTTTCCAAG AACTGAGTAA AGTCCTCAAA ACCGAAGAAT TATTGGCTGT TGAAGCCCAC 
CGTATGAGTC CCTATTCCCA ACGGGCGAAC GATGTCTCCG TTGTGTTAGA TCTCATGATA 
CATGACATCG ACCTCTTACT GGAATTAGTG CAAGCTCCTG TGGTTAAATT AACCGCCAGT 
GGGGGGCGTT CTTCCCATTC GGGTTATCTT GATTATGTTA CCGCAACCCT AGGCTTTGCT 
AATGGGATTG TTGCTACCTT AACCGCAAGT AAAGTCACTC ACCGAAAAAT CCGCCGCTTA 
GCTGCCCATT GCAAAAACTG TCTGACGGAA GCAGATTTCT TGAATAATGA GATTTTAATC 
CATCGTCAAA CTACCGCGAA TTATAGTACA GATTACGGTC AAGTTCTCTA TCGTCAGGAT 
GGACTCATTG AAAAAGTCTA TACCAGTAAT ATTGAACCCT TACACGCTGA ATTGGAGCAT 
TTTGTCCATT GTGTACGGGG AGGAGATCAG CCCTCGGTGG GAGGTGAACA GGCGTTAAAA 
GCGTTGCGTT TAGCCAGTTT GATCGAACAA ATGGCTTTAG ATTGTCAAAT TTGGCAACAA 
TCTGACTGGA ATTATCAATA TCTTAATCCT CCAGAGATTA GGGTTTCTTG A

Protein sequence

MSEQQPTLTG QRNPFDPIRI GVIGVGNMGQ HHTRILSLLK DVEFVGVSDV NVERGLDTAS 
KYRVRFFENY HDLLPHVDAV CIAVPTRLHH SVGMDCLKAG VHTLIEKPIA ASIAEAESLV 
NAAASSHGIL QVGHIERFNP AFQELSKVLK TEELLAVEAH RMSPYSQRAN DVSVVLDLMI 
HDIDLLLELV QAPVVKLTAS GGRSSHSGYL DYVTATLGFA NGIVATLTAS KVTHRKIRRL 
AAHCKNCLTE ADFLNNEILI HRQTTANYST DYGQVLYRQD GLIEKVYTSN IEPLHAELEH 
FVHCVRGGDQ PSVGGEQALK ALRLASLIEQ MALDCQIWQQ SDWNYQYLNP PEIRVS