Gene PCC8801_3003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3003
Symbol
ID	7104494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3109994
End bp	3112984
Gene Length	2991 bp
Protein Length	996 aa
Translation table	11
GC content	48%
IMG OID	643476032
Product	ATPase, P-type (transporting), HAD superfamily, subfamily IC
Protein accession	YP_002373146
Protein GI	218247775
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0474] Cation transport ATPase
TIGRFAM ID	[TIGR01494] ATPase, P-type (transporting), HAD superfamily, subfamily IC

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAC CTAATTCAAT TGATTGTCAT CAGCCAAGGG AAACATCTTT TGTCAAAATT 
CTCCACGGAA CTGTCAAAGG AAGAGGTCGA TACAAAGTTC AAGGATTATT CGGTTCAAAC 
CCACTCAAAC GGTATTTAGA GTTCAATTTA TCCCTACGAA AAGGCATAAA AACCGTTCAA 
GCTAACCCCA ATACAGGCAA TATTCTTCTA CACTTCCATA AAGACAAAAC AACTCAAGAA 
ATAGCCATCC TCATTGATTC CCTGGTCCAA GATTATTATC GATCGCCTAA AGAGTTCGCC 
CAACTTTTTT ATCAACAAAC AATGGTTATC CTTAACACCT CAGTTCCTTG GCATCTCAAA 
GAGATTGATA CCATTGTTGC GGAACTCAAC ACCTCAACAG AAAGGGGACT TTCCCACGCC 
GATGCCCAAA CTAACCTAAG ACAATATGGG AGTAATGCCC TCACTGAAGC TGAACCCCGT 
TCTGGGTTGA GCATTTTTCT TGACTACTTC AAATCTGTTC CCGTTGCCCT GTTAAGCGGT 
GCAGCCCTTC TTTCCGTCCT AACCGGAGGC ATCGCTGATG CGATCGTAAT CATGGGAGTT 
GTCAGTATTA ATGCCATTTT AGGGTATGTC ACCGAAAGTA ACTCAGAACG GATCATTAAT 
TCCCTCAAAC ACTTTATTAA CCCCTCTGCC TGGGTACTTC GAGAAGGCCA ATTAATTGAA 
ATTAATAGCC AAGATCTGGC CGTCGGGGAT ATTTTACTCC TACAACCCGG TTCCTATGTT 
CCGGCTGATG CCCGATTAAT CGAAGCTGAT CGCCTGAGTA TCGATGAATC TGCCCTAACC 
GGGGAAAGTT TGCCCATCCG TAAACACCAA GAGATCCTAG CCTCTCCTCA AGAAACTATT 
CCTCTAGCGG AACGGAAAAA TATGGTCTAT CGGGGTACAT TTGTCACGGG AGGCCAAGGC 
CGAGGGGTGA TAGTCTCCAC GGGAAATTCA ACGGAAATGG GACAAATCCA GTCCTTAGTC 
GGGGAAACTA GCCAACCGTC TACTCCCATG GAACGACAAC TCGAACAAGC CGGAAGCCAA 
CTGGTTTTAC TGTCGAGTGT GGTTTGCGCT TTAGTCTTTG CCATCGGATT GTTACGAGGA 
TACGGCTTGC TAGAAATGGT AAAAAGCTCC ATTTCTCTCG CGGTTGCTGC TGTTCCCGAA 
GGATTACCCA CCGTAGCTAC TACTACCCTG GCCTTGGGTA TCCTGAATAT GCGTAAACAA 
AAAGTTCTGA TTCGTCGGTT AGAAGCGATC GAAGCCCTCG GTTCTATTCA AGCCCTCTGC 
TTGGATAAAA CAGGCACGCT AACGGCTAAT CGGATGACGG TATTAAAGGT GTGTTGGGAT 
GGACGGGAGA CTAAGCTGGC AGATGGTCAT TTTTGGGTAG ACAATCAAGA AATCAATCCC 
TATAGCTGCG ACGAATTATT AAAACTGATT CATATCGCCG TCCTGTGTAA CGACAGTCAG 
ATTAATACTC ATCAAGACGG AACCTACATC ATTGACGGTT CTGCGACAGA AAATGCCTTG 
ATAGAAATGG CGATCGCAGC CGGAGTCACC GTTGCCGACC TCAATCACAA ATATCCGCGC 
CTTCTGACCT ACCACCGTTC CACCGAACAC AATTTCATGG CCACGGTGCA TCGCATCCAT 
GAATCCGCCT ATCTCATGGC CGTCAAAGGC AACCCCTCAG AAGTCCTCGA TCGCTGTTCA 
ACCCAGATGC GAAACGGTCA ACCCGTCGAG TTAACCGAAG CTGATCGACA AGCGATCGAA 
GAACAAAATG AAAGCTTGGC CGGCCAAGCT TTACGGGTCT TAGGTATCGC TTACAGCCAA 
GGGGAAACCG CCGATATCGA GTCCTTGCCC GTCTCTAATC TCATTTGGGT TGGGCTCATT 
GGTATGGCTG ATCCCATTCG CCCCGGGGTT ACAGAAACCA TCGCCGATTT TCACACCGCC 
GGGATCAACA CCCTGATGAT CACTGGGGAT CAAAGCCCCA CTGCCTACGC GATCGGCAAA 
GAGTTGAATC TCAGCCAAGG ACAACCTCTA AAAATCCTCG ATTCTACCGA ATTAACCGAT 
CTTTCTCCAG ACGTATTAGC CGGGTTGTCG GAACAGGTCC ATATTTTTGC CCGAATTAGC 
CCTGCCCACA AACTTCAGAT TGTCCAGGCA CTCCAGCAAC GCGGCTTAGT TGTGGCCATG 
ACGGGGGATG GCATTAATGA TACTCCGGCC TTGAAAGCGG CAGAAGTGGG CATTGCCATG 
GGACATACGG GGACGGATGT CGCGCGAGAA GTCGCTGATG TTGTCCTAGA GGATGATAAC 
CTGCAAACGA TGATTATTGC GGTGAGTCAG GGACGCACGA TTTACAACAA TATTCGTAAA 
TCGGTTCATT TTCTGCTGTC AACCAACCTC AGCGAAATTA TTGTCATGTT ATTCGCTACC 
ACTGGAGGAC TCGGACAACC CCTGAACGCG ATGCAGCTAC TGTGGCTCAA TTTAGTCACC 
GATATCTTTC CGGGGTTAGC CTTAGCCCTA GAAGCCCCTG AACCGGACGT TTTAACCCTT 
CCGCCGCGAT CGCCTGATGA ACCGATTATT AAATCCTCCG ATTTTCGACG GATTGTGTGG 
GAATCGACGG CGTTATCGGT GAGTTCTTTA GCGGCCTATG GCTATGGTAT CGCTCGTTAT 
GGGATCAGTC CCCATGCTAG TACCATCGCG TTTATGAGTT TGGTTAGCGG ACAACTCCTC 
CATGCCCTCA GTTGTCGGTC ATCAAGACCT TTACGAAGCC AACAACTGCC CCCAAATCCC 
TACTTAACGG GAGCCCTGGC TGGATCGATG GGGCTTCAGT GGGTATCCTT GGCTACCCCT 
GGATTGAGAA ATCTCTTACA CCTGACTCCC CTTAATCTGG CTGATAGTTT GGTGATTGGA 
GGTAGTGCTA TTTTGCCGTT GATTATCAAT GAAGGAACGA AACCTCAATA A

Protein sequence

MKRPNSIDCH QPRETSFVKI LHGTVKGRGR YKVQGLFGSN PLKRYLEFNL SLRKGIKTVQ 
ANPNTGNILL HFHKDKTTQE IAILIDSLVQ DYYRSPKEFA QLFYQQTMVI LNTSVPWHLK 
EIDTIVAELN TSTERGLSHA DAQTNLRQYG SNALTEAEPR SGLSIFLDYF KSVPVALLSG 
AALLSVLTGG IADAIVIMGV VSINAILGYV TESNSERIIN SLKHFINPSA WVLREGQLIE 
INSQDLAVGD ILLLQPGSYV PADARLIEAD RLSIDESALT GESLPIRKHQ EILASPQETI 
PLAERKNMVY RGTFVTGGQG RGVIVSTGNS TEMGQIQSLV GETSQPSTPM ERQLEQAGSQ 
LVLLSSVVCA LVFAIGLLRG YGLLEMVKSS ISLAVAAVPE GLPTVATTTL ALGILNMRKQ 
KVLIRRLEAI EALGSIQALC LDKTGTLTAN RMTVLKVCWD GRETKLADGH FWVDNQEINP 
YSCDELLKLI HIAVLCNDSQ INTHQDGTYI IDGSATENAL IEMAIAAGVT VADLNHKYPR 
LLTYHRSTEH NFMATVHRIH ESAYLMAVKG NPSEVLDRCS TQMRNGQPVE LTEADRQAIE 
EQNESLAGQA LRVLGIAYSQ GETADIESLP VSNLIWVGLI GMADPIRPGV TETIADFHTA 
GINTLMITGD QSPTAYAIGK ELNLSQGQPL KILDSTELTD LSPDVLAGLS EQVHIFARIS 
PAHKLQIVQA LQQRGLVVAM TGDGINDTPA LKAAEVGIAM GHTGTDVARE VADVVLEDDN 
LQTMIIAVSQ GRTIYNNIRK SVHFLLSTNL SEIIVMLFAT TGGLGQPLNA MQLLWLNLVT 
DIFPGLALAL EAPEPDVLTL PPRSPDEPII KSSDFRRIVW ESTALSVSSL AAYGYGIARY 
GISPHASTIA FMSLVSGQLL HALSCRSSRP LRSQQLPPNP YLTGALAGSM GLQWVSLATP 
GLRNLLHLTP LNLADSLVIG GSAILPLIIN EGTKPQ