Gene Cyan8802_1395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1395
Symbol
ID	8390707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	1427291
End bp	1428880
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	43%
IMG OID	644979398
Product	tryptophan halogenase
Protein accession	YP_003137148
Protein GI	257059260
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACAA CAACATCAAG ATCCCCTCAA GCTATTGAAA ACGTATTAAT TGTCGGAGGG 
GGGACTGCCG GCTGGATGAC GGCAACTTAC CTTAATAAGG CATTTGGACC TCAAGTCAAA 
GTAACCCTGA TGGAATCTCC TAGTGTTCCA CGTATAGGCG TAGGAGAGGC AACTGTACCC 
AACTTACAAA GGACTTTTTG GGACTTCCTA GGCATTCCTG AACGGGAGTG GATGAAAGAA 
GTCAATGGAG CTTTCAAAAC AGCAGTTCGC TTTGTCAATT GGCGAAAACC CAAATCAGGA 
GAAGGGGTTA ATCACTTCTA CCATCCCTTT GGCATTTTGC CTAACCTTGA GGGGGTTCTT 
CTGCCTCACT ACTGGTATCA CCTGACTAGA GGCACAGATC CAGTTGATTA TTCCTGTTTC 
CGTGAACCTC CTTTGATGGA CGCGAAAAAA GCCCCTGTTT ATAGGGATGG TACCTCCGCC 
GTACCCCATG CTTGGCACTT TGATGCCCAT CTGGTGGCTA AATTCCTGAG TAACTGGGGT 
AAAGAACGGG GCGTTGTACA TATCTTAGAT TATTTAGAAA ATGCTACCCT CGATGAGCAA 
GGCAATATTG CCTCTATTCA AACCCGAAAT GGATTAACCT TAGAAGCCGA TCTGTTTATC 
GACTGTACTG GATTTCGTGG CTTGTTGATC AATAAAGCTT TGAATGAACC CTTTATTGAT 
ATGAATGATC ACTTGCTCTG TGATAGTGCA GTGGCTGCTG CTATTCCTTC TAATGATGAA 
AGGGATGATA TTGAACCTTT TACCAGTGCT TTTGCCCAAG AAGCCGGTTG GATTTGGAAA 
ATTCCCATGA TGGGGCGTTT TGGTTCAGGC TATGTTTATT GTAGTCAGTT TCTCAGCGAA 
GACGAAGCAG CAACCAATTT CTGCAAGTTT TGGAACGTTG ATGAATCGAA AACGAATCTC 
AACCGTATTC GCTTTAGAAC CGGTCGCAAT CGCCGAGCTT GGGTCAAAAA CTGCGTTAGT 
ATTGGACTTT CTTCGTGTTT CTTAGAGCCT TTGGAGTCCA CAGGAATTTA CTTTATCACG 
GGTGCGATTT ATCAGTTGGC CAAGTATTTT CCTAGCAAGC AGATGGAACC CGCTTTACGA 
GATAAATTCA ATGAAGAAAT TGAATTTATG TACGACGACT GTCGGGACTT TATTCAAGCT 
CACTACTTAA TCACAACACG AGATGATAGT CCTTTTTGGT TAGCTAATAA GCACGAACTG 
ACTATGAGTG ACTCGATTAA AAACAAGCTT GAACTCTATA AAGCGGGACT GCCCGTTTCT 
CCCTTGCCTT CGAGTGAAAA GGATTATTAT GCTAACTTAG ATAACGAATT TCATAACTTT 
TGGACTGATG GTAGCTACTA TTGCATCCTA TCTGGTTTGG GCTGTTTTCC TGAACAATCC 
CATCCCTATC TTCGGGATCA TCCAGAAACC GTTAGAGAGT CAGTTGAAGT TTTTACTAAG 
ATTAAGGAAC AGCAACAAGA ATTATTAGAA GAGTTGCCGA GTAATTATGA ATACCTCAGA 
CAACTTCATA AAGTTGATCA TCTGGTCTAA

Protein sequence

MQTTTSRSPQ AIENVLIVGG GTAGWMTATY LNKAFGPQVK VTLMESPSVP RIGVGEATVP 
NLQRTFWDFL GIPEREWMKE VNGAFKTAVR FVNWRKPKSG EGVNHFYHPF GILPNLEGVL 
LPHYWYHLTR GTDPVDYSCF REPPLMDAKK APVYRDGTSA VPHAWHFDAH LVAKFLSNWG 
KERGVVHILD YLENATLDEQ GNIASIQTRN GLTLEADLFI DCTGFRGLLI NKALNEPFID 
MNDHLLCDSA VAAAIPSNDE RDDIEPFTSA FAQEAGWIWK IPMMGRFGSG YVYCSQFLSE 
DEAATNFCKF WNVDESKTNL NRIRFRTGRN RRAWVKNCVS IGLSSCFLEP LESTGIYFIT 
GAIYQLAKYF PSKQMEPALR DKFNEEIEFM YDDCRDFIQA HYLITTRDDS PFWLANKHEL 
TMSDSIKNKL ELYKAGLPVS PLPSSEKDYY ANLDNEFHNF WTDGSYYCIL SGLGCFPEQS 
HPYLRDHPET VRESVEVFTK IKEQQQELLE ELPSNYEYLR QLHKVDHLV