Gene Tery_1166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1166
Symbol
ID	4245749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	1826159
End bp	1827190
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	40%
IMG OID	638106388
Product	coproporphyrinogen III oxidase
Protein accession	YP_721000
Protein GI	113474939
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0408] Coproporphyrinogen III oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000235619
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGTAGTTT CGAGTAAGGA CCAAGAAATA TCTTTATCTG TACCAGCGAG TGACACAAAA 
GAACGAGTCA GTCAATTTAT GCAGACTCTA CAAGATGAAA TTTGCCAAGG ACTAGAAGAA 
TTAGATGGAG TTAGTAAGTT CAAGGAAGAC TCTTGGAAAC GTCCAGGTGG CGGCGGAGGA 
AAGTCTCGTG TAATAAGAGA CGGTGGAGTT TTTGAACAAG GGGGAGTTAA TTTTTCAGAA 
GTATGGGGAG ATAAATTACC TCCAAGTGTA CTGAAGCAAA GACCAGAAGC GGCAGGTAAT 
AGTTTCTATG CCACAGGAAC CTCTATGGTG CTGCACCCTA AAAATCCTTA TGTACCAACA 
GTACATCTTA ACTATCGTTA TTTTGAAGCT GGATCTGTAT GGTGGTTTGG TGGTGGTGTA 
GATTTAACAC CTTACTATCC TTATGCCGAA GACGCAGCGC ACTTTCATCA AACGATTAAG 
GCAGCCTGTG ACAAAAGCCA TAAAGAGTAT TATCCTATAT TTAAAAGATG GTGTGATGAA 
TATTTTTACT TAAAGCATCG TCAAGAAACG CGGGGTGTAG GAGGTATCTT TTTTGATTAT 
CAAGATGGTC AAGGAGAATT ATACAAAGGG CCTGATAATC AAGGACCAGC AGCAACCTAT 
AGTAAGGATT TAGGAATTCT TGAATCTCGT AGTTGGGAAT CTTTATTTAC ATTTGTACAA 
AATTGTGGTG TATCATTTTT ACCAGCATAC AAGATAATAG TAGAGAGACG GCAACCCATG 
AAATATGGTG ACCGGGAACG CAACTTTCAG CTATACCGAC GTGGCCGTTA TGTTGAATTT 
AATTTAGTAT ATGATAGGGG TACAATTTTT GGTTTGCAAA CCAATGGTCG TACAGAATCA 
ATCTTGATGT CTTTACCACC TTTAGTTCGT TGGGAGTATG GTTACAACCC AGAACCCAAC 
ACACCAGAAG CTGAACTATA TGAAGTATTC TTAAAACCTC ATGACTGGGC TGACTGGAAA 
CCAAATCATT AG

Protein sequence

MVVSSKDQEI SLSVPASDTK ERVSQFMQTL QDEICQGLEE LDGVSKFKED SWKRPGGGGG 
KSRVIRDGGV FEQGGVNFSE VWGDKLPPSV LKQRPEAAGN SFYATGTSMV LHPKNPYVPT 
VHLNYRYFEA GSVWWFGGGV DLTPYYPYAE DAAHFHQTIK AACDKSHKEY YPIFKRWCDE 
YFYLKHRQET RGVGGIFFDY QDGQGELYKG PDNQGPAATY SKDLGILESR SWESLFTFVQ 
NCGVSFLPAY KIIVERRQPM KYGDRERNFQ LYRRGRYVEF NLVYDRGTIF GLQTNGRTES 
ILMSLPPLVR WEYGYNPEPN TPEAELYEVF LKPHDWADWK PNH