Gene PCC8801_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4037
Symbol
ID	7104613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4230072
End bp	4231865
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	45%
IMG OID	643477032
Product	AMP-dependent synthetase and ligase
Protein accession	YP_002374132
Protein GI	218248761
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAA TTATTGAAAC CTCAACCATC CCTACCACCT TAATTGACTT ATTACGCTTA 
CGCGCAAGCC AAACTCCCCA TAATCACGCC TATACCTTTC TCATTGATGG CAAAAAAGCA 
ACCCCACCCC TAACCTACGC CGAATTAGAC CGACAATCAA GAGCGATCGC TGCCTTACTT 
CAACAATACC AAGCCAGAGG AGAACGGGCT CTTCTGCTCT ATCCCCAAAG TTTAGAAGTT 
ATTGCCGCCT TTTGTGGCTG TTTATACGCC GGAGTTATCG CTATTCCCGT TCCTCCTCCA 
GAGTCCGGCC GACTCAAGCG TACTTTACCC AGATTACGCG CTATCGTCAA AGATGCTAAC 
GCCAAATTTG CCTTAACAAC CGCTGGAATT TTCGACCTGA TTAACAATTT TAAGTCTGAG 
TTTCCCGAAT TTGACCAAAT GAACTGGATA GATACTGCCA AGGTCGACCT ATCCCTCGCA 
GATGACTGGC AAGATCCCAA CATCGACAAA GACGAGTTAG CCTATCTTCA GTATACGTCC 
GGCTCTACTT CTACGCCAAA AGGGGTCATG CTCAGTCATT TTAACCTAAT GCACCACGCT 
CGCTACCTCC AAAGGGCTTG TGGCTACGAA CCCGATAGCG TTACCCATAC TTGGATGCCC 
TATTTTCATG ATTATGGGTT AGTTGAAGGT ATAATGGTTC CCCTCTACAA CGGAACCCCC 
TGTTATCTGA TGTCTCCGTT CTCGTTTATT AAGCGTCCTA TCCAATGGCT GCACAATATC 
ACAAAATACG GTGTTACCCA CTCCCAAGCC CCTAATTTTG CCTATGATTT GTGTATTCGT 
CGCGTTAAAG ACAAAGATAT CCCCCAACTC AATTTAAGCT GTTGGCAAGC AGCCGGAAAC 
GCAGCAGAAC CGATTAATCC GAGGGTCATG GCGGATTTTG TTGAAACCTT TGCTCCTTGC 
GGTTTTTCTT GGGAAACTTT TGCTCCTGCT TTTGGGTTAG CGGAGTATAC GTTACTGGTA 
TCGAGTAAAC CCAAGGGAAC TGCTCCTGTT TTTGTTTGTT TGGATAGTTC TGCACTAGAA 
AGGGATAAAA TTGTTGAAGC TAACCCGGAT CAAGACCAAG GGGTGAGAAT AATGCCCAGT 
TGTGGTCAGT TGGTCTGTGA GACCCAGGTA GCGATTGTTC GTCCTGACAC CTTAACCCGT 
TGTGCTTCCG ATGAAGTAGG AGAAATTTGG GTCTCTGACC CCAGTATGTC TCAAGGCTAT 
TGGCAACGTC CCCAAGAAAC CCAAGAAACC TTCGGAGCTT ACCTTAAAGA TACGGGAGAA 
GGTCCGTTTT TAAGAACCGG AGATTTAGGG TTTCTTAAAG ACGGAGAATT ATATATTACG 
GGACGGATGA AAGACTTAAT TATTATCCGA GGGACTAATC ATTATCCCCA AGATATTGAA 
TGGACGGTAC AACATCTTAA CTCGGTTTTT CGTCCTGACT ATGGGGCTGC TTTTTCGATT 
ACAGATCAGG GGGAAGAAAA GTTAGTCGTG GTTCAAGAAA TAGAACGCCG TAGCAGCGAC 
TTGGATACAG AAAAATTATT AGCAGATATT CGTCAAGAAA TTGCTGAAGA ACACGAAATT 
TTTACCCATG CCATTGTTTT AGCAAAGTCG GGAACTATCC TAAAAACCGC TAGTGGTAAA 
ATTCAGCGTC GTGCTTGTCG TCAAAACTTT CTCAATGGAA CCATCAATAT TATCGCTGCT 
TGGAGTGAAA ATCCGGCATT AGTTGCTAAT TTTAAAGAGT CTGAAACTGA CTAA

Protein sequence

MTQIIETSTI PTTLIDLLRL RASQTPHNHA YTFLIDGKKA TPPLTYAELD RQSRAIAALL 
QQYQARGERA LLLYPQSLEV IAAFCGCLYA GVIAIPVPPP ESGRLKRTLP RLRAIVKDAN 
AKFALTTAGI FDLINNFKSE FPEFDQMNWI DTAKVDLSLA DDWQDPNIDK DELAYLQYTS 
GSTSTPKGVM LSHFNLMHHA RYLQRACGYE PDSVTHTWMP YFHDYGLVEG IMVPLYNGTP 
CYLMSPFSFI KRPIQWLHNI TKYGVTHSQA PNFAYDLCIR RVKDKDIPQL NLSCWQAAGN 
AAEPINPRVM ADFVETFAPC GFSWETFAPA FGLAEYTLLV SSKPKGTAPV FVCLDSSALE 
RDKIVEANPD QDQGVRIMPS CGQLVCETQV AIVRPDTLTR CASDEVGEIW VSDPSMSQGY 
WQRPQETQET FGAYLKDTGE GPFLRTGDLG FLKDGELYIT GRMKDLIIIR GTNHYPQDIE 
WTVQHLNSVF RPDYGAAFSI TDQGEEKLVV VQEIERRSSD LDTEKLLADI RQEIAEEHEI 
FTHAIVLAKS GTILKTASGK IQRRACRQNF LNGTINIIAA WSENPALVAN FKESETD