Gene PCC8801_3212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3212
Symbol
ID	7103940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3355148
End bp	3356110
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	47%
IMG OID	643476234
Product	NADH ubiquinone oxidoreductase 20 kDa subunit
Protein accession	YP_002373344
Protein GI	218247973
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAATG TTCTTTGGCT ACAAGGTGGT GCTTGCAGTG GGAATACCAT ATCATTCCTG 
AATGCAGAAG AGCCCACCAT TGTTGATTTG ATTACGGATT TTGGTATTAA TGTTCTCTGG 
CATCCATCCC TCGGACTGGA ATTGGGAGAC AGCTTACAGC AACTCCTAAG AGACTGTGTT 
AGTGGCAAAA TTGCCGTTGA TATCCTGGTT TTTGAAGGAA GTGTGGTTAA TGCACCCCAT 
GGAACCGGAG AATGGAATCG GTTTGCTGGC CGTCCCATGA AAGACTGGTT AGCGGACTTA 
TCCAAAATTG CCGGGTTCGT TGTGGCTGTA GGAGACTGTG CCACCTACGG GGGTATTCCA 
GCGATGGAAC CTAACCCCAG TGAGTCCATT GGAGTACAAT TCCTTAAACG CAAAGAAGGA 
GGCTTTTTAG GGGCAGATTA CCGTTCCCAA GCGGGACTCC CTGTCATTAA TATACCCGGT 
TGTCCGGCGC ATCCTGACTG GATTAGTCAA ATTTTAGTCG CGGTAGCTAC GGGACGGGTA 
GGAGACATCA CCCTTGATGA GTTTCACCGT CCTGAAACCT TCTTCAAGTC CTTTACCCAG 
ACGGGTTGTA CTCGCAATAT GCACTTTAGC TATAAAGCGA CAACTCAGGA CTTTGGACAG 
CGTACGGGAT GTCTCTTCTA TGATATGGGC TGTCGTGGTC CGATGACCCA TTCTTCGTGT 
AATAGAATCC TCTGGAACCG AGTTTCGTCC AAAACTCGCG CGGGAATGCC CTGTTTAGGC 
TGTACTGAAC CGGAATTTCC CTTCCATGAT CTTAAACCAG GAACTGTCTT TAAGACCCAA 
ACGGTGATGG GTGTTCCTAA AGAATTACCC CCAGGGGTCA ACAAAAAAGA TTATGCCTTA 
TTAACGGTTG TTGCTAAAGA TGCCAGTCCA TCTTGGACAA ACGATGATAT GTTCACCGTC 
TAA

Protein sequence

MANVLWLQGG ACSGNTISFL NAEEPTIVDL ITDFGINVLW HPSLGLELGD SLQQLLRDCV 
SGKIAVDILV FEGSVVNAPH GTGEWNRFAG RPMKDWLADL SKIAGFVVAV GDCATYGGIP 
AMEPNPSESI GVQFLKRKEG GFLGADYRSQ AGLPVINIPG CPAHPDWISQ ILVAVATGRV 
GDITLDEFHR PETFFKSFTQ TGCTRNMHFS YKATTQDFGQ RTGCLFYDMG CRGPMTHSSC 
NRILWNRVSS KTRAGMPCLG CTEPEFPFHD LKPGTVFKTQ TVMGVPKELP PGVNKKDYAL 
LTVVAKDASP SWTNDDMFTV