Gene PCC8801_2847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2847
Symbol
ID	7104372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2937498
End bp	2938514
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	41%
IMG OID	643475883
Product	hopanoid biosynthesis associated radical SAM protein HpnH
Protein accession	YP_002373002
Protein GI	218247631
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR03470] hopanoid biosynthesis associated radical SAM protein HpnH

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTTC AATTGCGACA AGCACTCAAG GTTGGCACTT ATATTATTAG TCAGCGTTTA 
TCGGGTCGTC AACGCTACCC CCTGGTATTG ATGCTAGAAC CCCTATTTCG CTGTAATTTA 
GCCTGTTCAG GTTGCGGAAA AATTCAGCAT CCTCCCGAAA TTTTAACCCG TAATTTGACC 
CCCGAAGAAT GTTTTACAGC AGTAGAAGAA TGTGGTGCTC CGGTGGTGTC TATTCCTGGG 
GGAGAACCCT TGTTACATCC CCAAATTGAT GAAATTGTTA AGGGGTTAGT CCAACGGAAA 
AAGTTTGTCT ATCTATGTAC TAATGCAATT TTACTAGAAA AAAGCCTCGA TAAATTTGAA 
CCGTCTCCCT ATCTAACCTT TAGTGTTCAC CTCGATGGGT TACGGGAACA TCATGATAAA 
TGTGTTGATC GTCAAGGGGT ATTTGATAAA GCGATTCAGG GTATTCGTGC TGCTAAAGAA 
AAGGGATTTC GTGTAACAAC AAATACGACC ATTTTTGAAG GAACCGATCC TCAAGAAATG 
CAGGAATTTT TTGACTTTCT GGAAACCTTG GGAACTGATG GTATGATGAT TTCTCCAGGG 
TATAGTTACG AATGGGCTCC CGATCAAGAA CACTTTCTTA AACGGGAACA AACCAAGGCA 
TTATTTCAAC AAATTTTGAT GCCTTGGAAG ACAGGGAAAA AGCGTTGGAA TTTTAATCAC 
AATCCCCTAT TTTTAGATTT TCTGTTAGGA GAAAAAGACT ACGAATGTAC TCCTTGGGGA 
AGTCCGAGTT ATAGTGTTTT GGGATGGCAA AAACCCTGTT ATTTGCTCAA TGAAGGACAC 
TATAAAACCT TCAAAGAACT GTTAGAAGAA ACCAACTGGG AAAACTATGG ACGCAAGAGT 
GGTAATCCTA AATGTGCTGA CTGTATGGTA CATTGCGGAT ATGAACCCAC GGCTGCCGTT 
GATGCCATGA ATCCTGCTAA CATGGGACGA GCATTAGAAA GTTTGTTTAG TGCGTAA

Protein sequence

MAVQLRQALK VGTYIISQRL SGRQRYPLVL MLEPLFRCNL ACSGCGKIQH PPEILTRNLT 
PEECFTAVEE CGAPVVSIPG GEPLLHPQID EIVKGLVQRK KFVYLCTNAI LLEKSLDKFE 
PSPYLTFSVH LDGLREHHDK CVDRQGVFDK AIQGIRAAKE KGFRVTTNTT IFEGTDPQEM 
QEFFDFLETL GTDGMMISPG YSYEWAPDQE HFLKREQTKA LFQQILMPWK TGKKRWNFNH 
NPLFLDFLLG EKDYECTPWG SPSYSVLGWQ KPCYLLNEGH YKTFKELLEE TNWENYGRKS 
GNPKCADCMV HCGYEPTAAV DAMNPANMGR ALESLFSA