Gene Cyan8802_3088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3088
Symbol
ID	8392418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3120717
End bp	3122303
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	53%
IMG OID	644981034
Product	TonB family protein
Protein accession	YP_003138766
Protein GI	257060878
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3064] Membrane protein involved in colicin uptake
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0726849
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTTT CTAATTTGTG TATTGAACAG CGTAATCAAG AAAAAGAAAT CCTCAAAAAG 
TTCATCCTCT ATGGACTCGC AGGTTCAGTT GCGCTGCATG GGTTACTGAT ATTAAGTCTC 
AAATGGCTAC CAACCAGCGA AACCATGGCA GAAGAGCCCA TTGAACTGAT CATGATTGAA 
GAACCCCAAG CCGAAATAGA GCCCCCAAAA CCCGAACCCG AACCGAAATT AGAAACTAAA 
TTAACCCCAG ACCCCTTACC CCAACTCGAA CAGCCAAACA TCGAGCAATT TCAAGCCAGT 
TCTCAAATAT CGTCAAATCC CGTGGCTCAA CCCTTGCCAC CCATGGCTAT CCCCTCCCAA 
CCCGCGCAAG ACACCTCAGC CCCTGAACCT GCCCCTGCCA TTGAACCCCC CGTTGAACCT 
CTCCCTAACC CTGACCCTCA ACCGGCTGCG TCCCTTCCCG AACCGGTCAC CTCAGCCCCT 
CCCACTCTTC CCAAAGAACC TGTTCAAGCC CAAACCACTC CTGAAACACC TACCCCAGAG 
ACAACCGTCG CCGTCGCAGA ACCCACCATG AGTCGTTCTG TGCCCAACCG TCCAAGCCTT 
CCCGCTAACC CCTTAACCGC AGCTACAGAA ACCATCAAAA ACCTAGGCGA TCGCCTACGG 
GGGAATCCTA GCTCTAATGC CCCAGAAACG GGCAATCCGT CAGGAAATCC CAGTAATCCA 
GGGGGAGTTG CTGCCAATCG TTCCCGACCC GGTGGCGGCG CAGCTAGAAC CCAAGCTCTC 
AGTTCTAACC CTGGCGGCGG GTTAGGACAG CTAAGAAGTG GTCTACAAGG CGGCACGGGA 
ACTGGAAGCA CTAGGGGGAC GGGAAAGGGA ACTGGCAGTA GTACGGGAAG CGGTTCAAAC 
CCCGGAAACC CTGGTAATGG GTCTGCTGCT GCCAATCGGG CTGCGCCAGG TCGTCCTGGC 
AATTCTCAGG AACTTAGTAC CTCCGGGGCA GGGTGTACAG CCCCGGCTAA GCCCAATTTT 
CCCACCGCTT TAGCCAATAA AGGCATTGAA GCCCGACCCG TGGTAGAAGT GATCACCAAT 
GCCAGTGGTA AGGTGATTAC TGCCAATATT CGGTCATCGA GTGGCTATCC CCAGTTAGAT 
CAATTGGCCA TCAATACGGC TAAAAATGTT CGCTGTCCAT CAGGGAATAG AGGAAGAAAA 
CTCCAACTAG CTATCACTTT TGCCCAACAG GGCAGCACCT TAGAACAAGA AGCCCGACAA 
CGACAAGCAG AACTCGAACG GCAGCGACAG GAAAAAGAAC GACAAGAAGC TGCCCGACGA 
CAAGCAGAAA TCGAACAACA GCGACAAGCA GAAGCGCAAC GACGCGCAGA AGCCGAACGA 
CAACGACAAG AAGAAGCAAA ACGACAAGCA GAGGAGGAAA GACAGCGTAA AGAACAAGAA 
AGACAAGCAG AAGCCGAACG ACAGCGACAA GCGGAGTTAG AACAGCAACG TCAGCAGGAA 
TTACAGCCCA AACCAGAATT AACTCCTGAA CCTGAACCTC CCACAACGGA ATTACCGCCC 
CTAGACCCGG TTCCTTCCGT TGAATAA

Protein sequence

MSLSNLCIEQ RNQEKEILKK FILYGLAGSV ALHGLLILSL KWLPTSETMA EEPIELIMIE 
EPQAEIEPPK PEPEPKLETK LTPDPLPQLE QPNIEQFQAS SQISSNPVAQ PLPPMAIPSQ 
PAQDTSAPEP APAIEPPVEP LPNPDPQPAA SLPEPVTSAP PTLPKEPVQA QTTPETPTPE 
TTVAVAEPTM SRSVPNRPSL PANPLTAATE TIKNLGDRLR GNPSSNAPET GNPSGNPSNP 
GGVAANRSRP GGGAARTQAL SSNPGGGLGQ LRSGLQGGTG TGSTRGTGKG TGSSTGSGSN 
PGNPGNGSAA ANRAAPGRPG NSQELSTSGA GCTAPAKPNF PTALANKGIE ARPVVEVITN 
ASGKVITANI RSSSGYPQLD QLAINTAKNV RCPSGNRGRK LQLAITFAQQ GSTLEQEARQ 
RQAELERQRQ EKERQEAARR QAEIEQQRQA EAQRRAEAER QRQEEAKRQA EEERQRKEQE 
RQAEAERQRQ AELEQQRQQE LQPKPELTPE PEPPTTELPP LDPVPSVE