Gene Cyan8802_4066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_4066
Symbol
ID	8393417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	4188921
End bp	4190219
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	48%
IMG OID	644981985
Product	threonine synthase
Protein accession	YP_003139698
Protein GI	257061810
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0219584
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGG CAACTCAAAC CCAAACCAAA GCCGCCACCT TTACTCATCT TGTTTCTAAA 
GAAGGTGGCG TTAAATATCC CCTCAAAGCC CTTCACGTTT GCGAGGAAAC CTTCTCTCCC 
CTGGAAGTGG CCTATGATTA CGATGCCATC CGTGCCCAAG TGACCCGCGA AAGCATCCAA 
GCTGGACCCA ACTCCATTTG GCGTTACAAA GCGTTTTTGC CCGTAGAAAG CGAAAATCCC 
ATTGATGTTG GCACCGGGAT GACCCCCCTC GTTAAATCGC ACCGTTTAGC CCGTCGCCTG 
GGTCTAAAAA ATCTTTATAT CAAAAACGAT GCCGTCAATA TGCCCACCCT CAGCTTCAAA 
GATAGGGTGG TGTCCGTTGC TCTCACTAGA GCCAAAGAAC TGGGATTTAC CACCGTTTCC 
TGCGCCAGTA CGGGGAATTT AGCCAATTCT ACAGCAGCGA TCGCCGCCCA TGCAGGGTTA 
GACTGTTGCG TGTTCATTCC GGCAGATTTA GAAGCGGGTA AAGTCCTGGG TACTCTCATC 
TACAATCCGA CCGTGATGGC CGTCAAAGGG AACTACGACC AAGTGAACCG TCTCTGCTGC 
GAAGTGGGTA ACAGCTACGG ATGGGGCTTT GTTAACATCA ATTTACGTCC CTACTACTCG 
GAAGGGTCAA AAACGCTAGG ATTTGAAGTG GCCGAACAAT TAGGGTGGAA ACTCCCTGAT 
CACGTCGTTG CTCCCTTAGC GTCGGGTTCC CTCTACACCA AGATTTACAA AGGCTTCCAA 
GAGTTCATCA AAACCGGGTT AGTCGAAGAT AAAGCGGTTC GGTTCAGTGG AGCCCAAGCG 
GAAGGTTGTT CTCCCATTGC GGCTGCGTTT AAAGAAGGTC GGGACTTTGT AACCCCAGTT 
AAACCCAATA CTATTGCTAA ATCCATCGCT ATTGGTAATC CTGCTGATGG TTATTACGCC 
TTAGATATTG CGCGTAAAAC CAACGGGAAT ATTGAAAGCG TCACCGATGC AGAGATCGTC 
GAAGGGATTA AACTTTTAGC GGAAACCGAA GGCATTTTCA CGGAAACCGC AGGGGGAACT 
ACCATTGCGG TCCTCAAAAA ACTGGTAGAA GCGGGTAAAA TTGATCCTGA AGAAACTACC 
GTAGTTTATA TCACCGGAAA CGGATTAAAA ACCCAAGAAG CGGTGCAAGA GTACATCGGT 
CAACCCCTAA TTATCGAGCC TAAATTAGAC AGTTTTGAAA GAGCCCTGGA ACGTTCTCGG 
ACTCTAGAAC GTCTAGAATG GCAACAGGTT TTAGTTTAG

Protein sequence

MTQATQTQTK AATFTHLVSK EGGVKYPLKA LHVCEETFSP LEVAYDYDAI RAQVTRESIQ 
AGPNSIWRYK AFLPVESENP IDVGTGMTPL VKSHRLARRL GLKNLYIKND AVNMPTLSFK 
DRVVSVALTR AKELGFTTVS CASTGNLANS TAAIAAHAGL DCCVFIPADL EAGKVLGTLI 
YNPTVMAVKG NYDQVNRLCC EVGNSYGWGF VNINLRPYYS EGSKTLGFEV AEQLGWKLPD 
HVVAPLASGS LYTKIYKGFQ EFIKTGLVED KAVRFSGAQA EGCSPIAAAF KEGRDFVTPV 
KPNTIAKSIA IGNPADGYYA LDIARKTNGN IESVTDAEIV EGIKLLAETE GIFTETAGGT 
TIAVLKKLVE AGKIDPEETT VVYITGNGLK TQEAVQEYIG QPLIIEPKLD SFERALERSR 
TLERLEWQQV LV