Gene Cyan8802_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1054
Symbol
ID	8390363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	1079488
End bp	1080621
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	48%
IMG OID	644979068
Product	threonine synthase
Protein accession	YP_003136821
Protein GI	257058933
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.470109
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00082788
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAGTTG ATCATCTAAC GCAACAATCG CAACCTAACC CCGTAGAATC CCCTAAGCTC 
CCCCCTTCAG ACCTAAAACC CTGGCGAGGG TTAATTGAAA CCTATCGCCC CTATCTTCCT 
GTTACCGACA CAACTCCTGT CATTACCCTA CTTGAAGGGA ATACCCCTCT AATTCCCGTT 
CCCTATATTT CCCAACAAAT CGGACGGGGA GTCAAAGTTT TGGTTAAATA CGATGGATTA 
AACCCCACGG GAAGCTTTAA AGATCGCGGC ATGACTATGG CTATCTCCAA AGCCGTCGAA 
AACGGGGCTA AAGCGGTTAT TTGTGCCAGT ACGGGGAATA CCTCAGCAGC AGCAGCAGCC 
TACGCGAGAC GGGGCAAAAT GCGGGCATTC GTCATCATTC CTGATGGCTA TGTTGCCCTC 
GGAAAACTAG CCCAAGCTTT ACTTTATGGG GCAGAAGTGA TCGCCATTGA TGGCAATTTT 
GATGATGCCT TTAAGATTGT TCGAGGGATG GCCGAAAATT ACCCCGTAAC CTTGGTTAAT 
TCCGTTAATC CCTATCGCTT AGAGGGGCAA AAAACGGCAG CCTTTGAAGT TGTTGATGTC 
TTAGGCAATG CCCCCGACTG GTTGTGTATT CCCGTGGGGA ATGCCGGGAA TATTAGTGCC 
TATTGGATGG GGTTTTGTCA ATATCATGGG TTAGGAAAGT GCGATCGCTT GCCAAAAATG 
ATGGGCTTTC AAGCAGCCGG GGCTGCACCG TTTCTAACGG GTCAACCTGT ACCCCATCCT 
GAAACCTTAG CAACTGCCAT TCGTATTGGC AACCCGGCTA ATTGGAACAA AGCTTGGGAA 
ACCCAAAAAG CCAGTCACGG GGCGTTTAAT GGTGTCACCG ATGAGGAAAT TTTAGCAGCC 
TATCGTATGT TGGCATCCCA AGAGGGGATT TTCTGTGAGC CAGCCAGTGC TGCTTCTGTG 
GCAGGATTAT TAAAGGTTAA GGATCAAGTC CCCAGTGAAG CAACGGTCGT CTGTGTCCTG 
ACGGGTAATG GACTTAAAGA TCCTGATTGT GCCATTAAAC ACAGCGATAA TCAACTTAAA 
TCAGGGATTA AGGCTGATTT AGCTACAGTT GCTCAAGTGA TGGGGTTTGC GTAG

Protein sequence

MTVDHLTQQS QPNPVESPKL PPSDLKPWRG LIETYRPYLP VTDTTPVITL LEGNTPLIPV 
PYISQQIGRG VKVLVKYDGL NPTGSFKDRG MTMAISKAVE NGAKAVICAS TGNTSAAAAA 
YARRGKMRAF VIIPDGYVAL GKLAQALLYG AEVIAIDGNF DDAFKIVRGM AENYPVTLVN 
SVNPYRLEGQ KTAAFEVVDV LGNAPDWLCI PVGNAGNISA YWMGFCQYHG LGKCDRLPKM 
MGFQAAGAAP FLTGQPVPHP ETLATAIRIG NPANWNKAWE TQKASHGAFN GVTDEEILAA 
YRMLASQEGI FCEPASAASV AGLLKVKDQV PSEATVVCVL TGNGLKDPDC AIKHSDNQLK 
SGIKADLATV AQVMGFA