Gene PCC8801_3419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3419
Symbol
ID	7103115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3566815
End bp	3567825
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	45%
IMG OID	643476434
Product	pentapeptide repeat protein
Protein accession	YP_002373543
Protein GI	218248172
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGTCAG AAGTCCCTAT GAAAGCCAAT GAACTGATTG AGCGTTATTC GTCTGGAGAA 
ACTCACTTTA ATGGGTTAAA ATTACCTGGA ATTAACCTAG TTGGTGCGGA TTTAATTGGC 
ATTATTTTTA ATGAAGCCGA TCTTCATGGA GCGAATTTTT TATTAGCTTA CCTCAACCGA 
GCCAGCTTTA CCCAAGCGAA TTTAGTAGAA ACCAATTTAA GCGGAGCTAA TCTCAGTCAA 
GCCGATCTTA GTGGAGCCGA TCTTCGCAGT GCTATCTTAC ATGGAGCCAT TTTACAAGGA 
GCTAATCTTA GGGATACGGA TATTACCCTA GCCATCCTTT TAGACGCTAA TCTAGTCGCA 
GCAGATTTAC GCGGAGCCGA TTTGAGTGGG GCAACCCTGA CAGGGGCTTG TCTGCGGGGG 
GCAAATATGC GCCAGGAGAA AAAAAGTTAC TATACCAATC TCCAGGCAGT TAATTTGACC 
AAAGCCGACC TTCAAGGGGC AAATATGAAG GGGGTTGATC TTAGTCGTGC CAATCTGACG 
GGAGCCAATC TCAAAGAAGC TAACCTGCGA GACTCCGATC TTCGCAAAGC CGATCTCACC 
GATGCTAATC TTAAAGGAGC GTTACTCACA GATACCAATT TTACCGGGGC TAAACTCACA 
GGAGCCAATC TAACGAATGC TAATTTAGTC CGAGCCCAGA TGTCCCATAC TGATATGGTA 
GGTGTGATGG CCAAGGGTTC TGTGATGACC CATGCTGATT TGAGTCGTGC CAATCTCAGT 
CAAGCGAATT TAGACCTAAG TCGCATGAAT CATGCTGATT TGAGCCGCTC TAATTTATCA 
GGAGCCAGTT TTAAGGATGC TGAGTTAGTC GAGGTTTTCT TAGCTAAAGC TAATCTGATG 
GGAGCTAATT TAACCCAAGC CAATTTAACT CGGGCTGAGT TGATGAGTGC TAATTTAACG 
GGTGCGATTT TGCGCGGGGC AACCATGCCA GATGGTCGCG TTCGGGATTA A

Protein sequence

MRSEVPMKAN ELIERYSSGE THFNGLKLPG INLVGADLIG IIFNEADLHG ANFLLAYLNR 
ASFTQANLVE TNLSGANLSQ ADLSGADLRS AILHGAILQG ANLRDTDITL AILLDANLVA 
ADLRGADLSG ATLTGACLRG ANMRQEKKSY YTNLQAVNLT KADLQGANMK GVDLSRANLT 
GANLKEANLR DSDLRKADLT DANLKGALLT DTNFTGAKLT GANLTNANLV RAQMSHTDMV 
GVMAKGSVMT HADLSRANLS QANLDLSRMN HADLSRSNLS GASFKDAELV EVFLAKANLM 
GANLTQANLT RAELMSANLT GAILRGATMP DGRVRD