Gene PCC8801_4109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4109
Symbol
ID	7101899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4306670
End bp	4308670
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	49%
IMG OID	643477098
Product	glycine oxidase ThiO
Protein accession	YP_002374197
Protein GI	218248826
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating) [COG2022] Uncharacterized enzyme of thiazole biosynthesis
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAA GTAACGACAT TCTCATCATC GGCGGCGGAA TTATCGGACT AGCCATTGCC 
GTTGACCTTA AATTACGAGG TGCATCTGTC ACTGTCCTTG ACCGCAATTT TCCCCATAGG 
GCAAGTCAAG CAGCAGCCGG AATGTTAGCC CCCTTCGCAG AAAATCTTCC CCCTGGTCCG 
ATGCTAGATC TCTGCTTGAA GTCCCGATGG CTATACCCGG AATGGGTTCG TAAACTGCAA 
GACCTCACAG GACTCGATTT AGGCTACAAT CCCTGTGGTA TCCTCGCCCC CGTTTATGAG 
TTACCCTCGG AACAATTTTG TCATAATACC GCTTCTCAAT GGCTAGATAA AACGGCTATT 
CGTCTGTATC AACCCGGGTT AGGGGATGAT GTGGTCGGAG GATGGTGGCA TCCCGAAGAT 
GGCCAAGTAG ACAACCGCCA AGTAATGGCA GCCTTACAGC AAGCAGCCCA ACAATTAGGT 
ATTCAGGTAA AGAACGGTGT CACAGTTCAG ACGATCCAAC AGCGTCAGGG AAAAATAGCC 
AGTATTTTAA CATCTGAAGG CGAATTTGAA GCGAAAACCT ATGTTTTAGC GAGTGGATCT 
TGGGCAAGTC AGATTTTACC CTTACCCGTC CGTCCGATCA AAGGGCAAAT GTTAGCCGTC 
ACTATGCCAC AGCAACCCGG AGAACCTTTC CCTCTGCAAC GGGTGTTATT TGGTCCGAGT 
ACCTATCTGG TCCCCCGACG CAATGGACGC TTAATTATTG GGGCAACCTC CGAAGACGTG 
GGATGGACTC CTCATAATAC TCCCCAAGGG ATCGTTACGT TAATCCAACA GGCAACTCGA 
CTCTATCCGG CGATCGCAGA CTGGCCGATT GAAGAAATTT GGTGGGGTTA TCGTCCAGGG 
ACACCAGATG AATTACCAAT TTTAGGGCAA AGTTCCTGTG AAAATTTGAT TTTAGCCACG 
GGACACTACC GTAACGGGAT TTTACTCGCT CCTGTGACCG CTAGTTTAAT CGCCGATTTA 
ATTATTAATC AAACATCCGA TCCGCTTTTA GATGCTTTTC GAGGCGATCG CTTCTATACC 
CAACCTAGTC CCACAACCGT AATTATGACC GCTTTTAATA GTATTCCGAC AAAATCCCAG 
AACGGAACCA ACGGATCACC CCCCTATCGA GAACTTACTC CGACTAACGC TGATGAATTA 
ATCATTGCAG GTCGTCGCTT TCGATCGCGC TTGATGACGG GAACTGGGAA ATATCCTACC 
ATTGCCAGTA TGCAGCAAAG TGTAGCCGTC AGTGGGTGTC AAATTGTGAC CGTAGCCGTT 
CGACGAGTTC AAACGAAAGC CCCCGGCCAT GAAGGGTTAG CCGAAGCCCT CGACTGGAGT 
AAAATTTGGA TGTTGCCCAA TACCGCCGGA TGTCAAACGG CCGAGGAAGC CATACGAGTC 
GCTAGATTAG GGCGGGAAAT GGCTAAATTA TTGGGTCAAG AGGACAATAA TTTCGTAAAA 
TTAGAAGTTA TCCCCGATTC TAAATATTTG TTACCTGACC CGATTGGCAC GCTACAAGCT 
GCGGAACAAT TGGTTAAGGA AGGGTTTGCC GTTTTGCCCT ACATCAACGC TGATCCTCTG 
TTGGCTAAGC GTTTGGAAGA GGTGGGGTGT GCGACGGTGA TGCCCTTGGG ATCTCCCATC 
GGATCGGGTC AAGGTATCCG AAATACCGCT AATATTGCCA TTATCATCGA AGAAGCGACG 
GTTCCGGTGG TGGTGGATGC GGGGATAGGA ACCCCCAGTG AAGCTGCCCA GGCGATGGAA 
TTGGGGGCGG ATGCGGTGTT AATTAATAGT GCGATCGCTT TGGCTAAAGA TCCTGTAATC 
ATGGCTAAGG CCATGGGAAT GGCAACAGAA GCGGGACGGT TAGCCTATCT CGCGGGACGG 
ATACCCGTTA AAGAATATGC TAGTGCCAGT TCTCCCTTAA CGGGCAATAT TAACAGTAAT 
CAGTTAGCCG CGATCGGTTA A

Protein sequence

MNASNDILII GGGIIGLAIA VDLKLRGASV TVLDRNFPHR ASQAAAGMLA PFAENLPPGP 
MLDLCLKSRW LYPEWVRKLQ DLTGLDLGYN PCGILAPVYE LPSEQFCHNT ASQWLDKTAI 
RLYQPGLGDD VVGGWWHPED GQVDNRQVMA ALQQAAQQLG IQVKNGVTVQ TIQQRQGKIA 
SILTSEGEFE AKTYVLASGS WASQILPLPV RPIKGQMLAV TMPQQPGEPF PLQRVLFGPS 
TYLVPRRNGR LIIGATSEDV GWTPHNTPQG IVTLIQQATR LYPAIADWPI EEIWWGYRPG 
TPDELPILGQ SSCENLILAT GHYRNGILLA PVTASLIADL IINQTSDPLL DAFRGDRFYT 
QPSPTTVIMT AFNSIPTKSQ NGTNGSPPYR ELTPTNADEL IIAGRRFRSR LMTGTGKYPT 
IASMQQSVAV SGCQIVTVAV RRVQTKAPGH EGLAEALDWS KIWMLPNTAG CQTAEEAIRV 
ARLGREMAKL LGQEDNNFVK LEVIPDSKYL LPDPIGTLQA AEQLVKEGFA VLPYINADPL 
LAKRLEEVGC ATVMPLGSPI GSGQGIRNTA NIAIIIEEAT VPVVVDAGIG TPSEAAQAME 
LGADAVLINS AIALAKDPVI MAKAMGMATE AGRLAYLAGR IPVKEYASAS SPLTGNINSN 
QLAAIG