Gene PCC8801_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0472
Symbol
ID	7105012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	483020
End bp	484129
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	38%
IMG OID	643473581
Product	AAA ATPase
Protein accession	YP_002370724
Protein GI	218245353
COG category	[R] General function prediction only
COG ID	[COG3950] Predicted ATP-binding protein involved in virulence
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAG AATCCATTAC AATTCAAAAT TTTAAGCGAT TTGATAATAT TGAGGTTTCT 
TTTAAGAACA AAACCCTGCA AGAGGTTACT AATCGCTTCC TAATTCTTGG AGACAATGGG 
ACAGGTAAAA CAACGCTTCT CCAGGCAATT GCTCTCCCAC TAGCTCTAGC TACAAAAAAA 
ATTCAAACAG TATCTGAATT TGACTGGGTA GGTTTTTTGC CAGGTCGATT TTGGATTGGA 
GGTTCACCCC ATATTGAACT AGAAATATCA TTTGAAGATG AGGAACTTGA AGCAACAAAG 
TCGGTAGCTA GAAGATGGTA CGAGAAGCAA CCAGTTGAAT TTCGTCCTCC TGATTTTGTT 
GAACCTGGTA ATAGTCATTT AGTTAAGTTA ACTCTCAATG GAGAATATTG GAAGGTTGGA 
GAAGATAATA AACTTGAAGA ACGCTCTCAA TTTCAAGGTC GTTACTATGC TCAAAGATTG 
ATGAGAAGTG ACCCTTCTGT GCGCTCTGAA TTTTCTAGAC TTCCTGGTAT TTTTTGGTTC 
GATCAGTTTC GAAATCTTGG TTCAAATCCA CTGACTGAAA GTAGTGGAGA TGGACAAACA 
GATCATACGG CTGGCATTTC GTTTGATCTA GGTGTAGGAC GTTTACGTCA GTATTTAATT 
CAGTGGGATC AAAAAAGAAG AACAGGGCAA AATAATACTT CTATTGACTA TCTCAAAGAA 
TTACAGATTT ATTATACAAA GGTTTTTCCT GAACGTTCAT TCAGTGGAGT TGAATATCAA 
CCCAGTAATG ATTCGCCAAC GGAAATGAAT ACATATTTTA CCCTATATGA CGGGCATCGA 
ACTTATGATA TTGTTGAGAT GTCAGCAGGA GAACAAGCAG TTTTTCCGAT GCTCTATGAG 
ATTGTTAGAC AGCAAATTTC ATACTCAATT GTTTTAGTCG ATGAAATTGA TTTAAACCTT 
CATCCTCCAG CAGCTCAGCT CTTGGTTAAT CAACTTCCCA AGATTGCTCC TACTTGTCAA 
TTCCTATTCA CAACTCATTC TGAGGCTGTA AATGATGTAA TTGGCGAAGA GGAAACTTAT 
CGATTGCCAG GAGGGTCTTT GTGCCTGTAA

Protein sequence

MKVESITIQN FKRFDNIEVS FKNKTLQEVT NRFLILGDNG TGKTTLLQAI ALPLALATKK 
IQTVSEFDWV GFLPGRFWIG GSPHIELEIS FEDEELEATK SVARRWYEKQ PVEFRPPDFV 
EPGNSHLVKL TLNGEYWKVG EDNKLEERSQ FQGRYYAQRL MRSDPSVRSE FSRLPGIFWF 
DQFRNLGSNP LTESSGDGQT DHTAGISFDL GVGRLRQYLI QWDQKRRTGQ NNTSIDYLKE 
LQIYYTKVFP ERSFSGVEYQ PSNDSPTEMN TYFTLYDGHR TYDIVEMSAG EQAVFPMLYE 
IVRQQISYSI VLVDEIDLNL HPPAAQLLVN QLPKIAPTCQ FLFTTHSEAV NDVIGEEETY 
RLPGGSLCL