Gene PCC8801_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3643
Symbol
ID	7103325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3800311
End bp	3801531
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	43%
IMG OID	643476653
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_002373761
Protein GI	218248390
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAGG GGTTCGAGTT TGATGTGTTT CTAGCGCATA ATAGTGTGGA TAAACCCCAT 
GTTAGGGAGA TTAGTAACAA ACTAAGGGAA CGAGGGTTAA AACCTTGGCT AGATGAGGAA 
CAAATCCCTC CTGGGATGTC ATTTCAGGAT GAAATTCAAA AAGCGATTCC CCTGATTAAA 
TCGGCAGCTA TTATTATTGG TACTCAGGGA TTAGGAAAAT GGCAGATCAT GGAACTGCGA 
TCGCTTATCA CTAAATTTGT GAATCTAAAA ATTCCTGTTA TTCCTGTTTT GTTGCCAGGG 
GTTAATAATA TTCCAGGTGA TTTACTATTC CTACAAGAAC TTAATTGGGT TAAGTTTGAA 
CAGATTGATG ATGCTACGGC TTTTTATCGG CTAGAGTGGG GCATTACTCA GGTTAAGCCG 
GAGTTACATC CCAAAACTGT ACAATTGACT GCCGAGGAAT GGTTTAACCT TGGCTATAAC 
AAGGGTGAAT CAGGAGACAA CCAAGGTGCG ATCGCTGACT TTAATCAAGC CATTAAAATC 
AAATCCGACT TGGCAGAAGC GTACTACAAT CGCGGGTTAG CCAAGTCTAA CTTAGGAGAC 
TATCAAGGTG CGATCTCTGA CTACAATCAA GCCATTGAAA TCAAACCCGA CTATGCTGCT 
GCCTACAACA ATCGTGGATT AACTAAGTAT AACTTAGGAG ACAACCAAGG TGCGATCACA 
GACTACACTC AAGCGATTGA AATCAAACCC GACGATGCTG ATGCCTACTA TAATCGCGGG 
TTAGCCAAGT ATAACTTAGG AGACAAGCAA GGGGCGATCG CTGACTACAA TCAAGCGATT 
AAAATCAAAC CCGACTATGC TACTGCCTAC AACAATCGCG GGAATGCTAA GTATAACTTA 
GGAGACAAGC AAGGGGCGAT CGCTGACTAC AATCAAGCGA TTAAAATCAA ACCCGACTAT 
ACCCTTGCCT ACATCTGTTG CGGGTTAGCC AAGTCTAACT TAGGAGACAA CCAAGGTGCG 
ATCACTGACT ACAATCAAGC GATTAAAATC AAACCCGACT ATGCTGATGC CTACATCTGT 
CGCGGGAATG CCAAGAAAAA CTTAGGAGAC AACCAAGGTG CGATCGCTGA CTACAATCAA 
GCAGCACAAC TTTACTCGCA GCAAAATAAT ATGGAATGGT ATCTTAAAGC CCTTGAAAAG 
ATCAAAAAAC TTGAACAATG A

Protein sequence

MSEGFEFDVF LAHNSVDKPH VREISNKLRE RGLKPWLDEE QIPPGMSFQD EIQKAIPLIK 
SAAIIIGTQG LGKWQIMELR SLITKFVNLK IPVIPVLLPG VNNIPGDLLF LQELNWVKFE 
QIDDATAFYR LEWGITQVKP ELHPKTVQLT AEEWFNLGYN KGESGDNQGA IADFNQAIKI 
KSDLAEAYYN RGLAKSNLGD YQGAISDYNQ AIEIKPDYAA AYNNRGLTKY NLGDNQGAIT 
DYTQAIEIKP DDADAYYNRG LAKYNLGDKQ GAIADYNQAI KIKPDYATAY NNRGNAKYNL 
GDKQGAIADY NQAIKIKPDY TLAYICCGLA KSNLGDNQGA ITDYNQAIKI KPDYADAYIC 
RGNAKKNLGD NQGAIADYNQ AAQLYSQQNN MEWYLKALEK IKKLEQ