Gene Cyan8802_3477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3477
Symbol
ID	8392814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3544575
End bp	3545645
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	47%
IMG OID	644981410
Product	dehydrogenase (flavoprotein)
Protein accession	YP_003139136
Protein GI	257061248
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00015718
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0486362
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCATTA TCGGTGGAGG TCCAGCCGGG TTAGCAACGG CGATCGCTCT CACCGATCTT 
GACATCAATT CTATCGTGAT TGAGAGCAGC CATTATCTTG ACCCTCGTTT GGGAGAACAT 
CTGACCCCAG AAGGGGTGGG AATCTTAAAA CAACTAGGGA TCTGGGATAG CCAATTTCTG 
GAAAAACATC GTTTATGTTA TGGGGTGCGT TCTGCTTGGG GAGAGACTCA AGTGACCTAC 
AGTGACTACC TCTTTCATCC CGATGGTACG GGAGTTAATT TGAGTCGTCC CACCTTTGAC 
CGCAATTTAG CAACCTTAGC GGATGGTAAG GGGGTTCGTT TGTTGCTCTC AAGTCAACTC 
AAACAGGCTC AACAGGAACA GAACGGATGG ATACTTTCTC TCGACACCCC AAACGGTCTT 
CAGGAGGTAA GGTCTAGAGT GGTTGTGGAT GCGAGTGGAC GCAAGGCTTT ATTTGCTAGG 
AGTCAGGGTC GAACTTCTGT CTATTGCGAT CGCTTGGTGG GTATTGCTGC TTTTTTAGAG 
CCTTTGGCAG AAAATCATGA TCAAGAGGAA ACCTTGTGGC TCGAATCGGG AGAGTGTGGC 
TGGTGGTACT TTGCCCGTCT TCAGGATAGT AGGGGGGTTT TTTTGCATAT AACGGATGCT 
GATCAACTGG AGTCAGGAAA AGATGCTCCT CTGCAAACGT GGTCAAAACG GCTAAAATCA 
ACTAACTTTT TCTCGGAACT GGCTGGTTAT TATCATCCTG TTGAACAGGT TCTGGTGCGA 
TCGGCTCGTA GTCATTGTCT TGATCAAGCA ACAGGTCATC ATTGGCTGGC TGTGGGGGAT 
GCTGCCATGA GTTTTGATCC CTTATCGTCT ATGGGGATTA CTAAAGCTTT AAAGGCTGGT 
ATTTTTTCGA GTCAAGTCAT TTTAAGGGTT TTGAATGGGG AAACAACGGT TCTGAAAGAC 
TATGAGGCAG AAATTCAACA ACAATTCAAC GAATATCTCC AGATTCGTGC TCAATATTAT 
CAGATGGAGC AGCGTTGGCC AAGCTCACTT TTTTGGCAAC GGCGACATTA G

Protein sequence

MVIIGGGPAG LATAIALTDL DINSIVIESS HYLDPRLGEH LTPEGVGILK QLGIWDSQFL 
EKHRLCYGVR SAWGETQVTY SDYLFHPDGT GVNLSRPTFD RNLATLADGK GVRLLLSSQL 
KQAQQEQNGW ILSLDTPNGL QEVRSRVVVD ASGRKALFAR SQGRTSVYCD RLVGIAAFLE 
PLAENHDQEE TLWLESGECG WWYFARLQDS RGVFLHITDA DQLESGKDAP LQTWSKRLKS 
TNFFSELAGY YHPVEQVLVR SARSHCLDQA TGHHWLAVGD AAMSFDPLSS MGITKALKAG 
IFSSQVILRV LNGETTVLKD YEAEIQQQFN EYLQIRAQYY QMEQRWPSSL FWQRRH