Gene Ava_4996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4996
Symbol
ID	3679048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	6279595
End bp	6280638
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	47%
IMG OID	637720356
Product	coproporphyrinogen III oxidase
Protein accession	YP_325488
Protein GI	75911192
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0408] Coproporphyrinogen III oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.000411147
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.314593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCGTC ATTCCGATAA TTCTCTGCAA GAATCTCCAA ATCACACAGA ATTGCTGATA 
TCACCTACCA ATACAATACC CAAGGATTCA CGGCAGCGAT CGCAGCAATT CATGCAGAAC 
TTACAGGATG AGATTTGCAC AGCGTTAGAG CAAATTGACG GGAAAGCAAG CTTTCACCAA 
GACTATTGGG AGCGAGCAGA AGGGGGAGAA GGACGTACCC GCGTGATTCG AGAAGGACGG 
GTGTTTGAAC AAGGTGGCGT GAACTTTTCC GCAGTGTGGG GAAATAGCCT ACCTGCTTCA 
ATTTTGGCGC AACGTCCAGA AGCAGCCGGA CATGAGTTTT TTGCCACAGG AACTTCAATG 
GTGTTGCATC CTCGCAATCC TTATGTACCA ACAGTACATC TCAACTATCG CTACTTTGAA 
GCTGGCCCTA TTTGGTGGTT TGGTGGTGGG GCGGATTTAA CCCCATACTA CGCCTTTGAA 
GAGGATGCGG TTCACTTTCA TCAGACGCTA AAAAATGCTT GTGATGTCCA TAATCCAGAG 
TATTATCCAG CATTTAAACG CTGGTGTGAT GAATACTTCT ATTTACGACA TCGCCAAGAA 
CAGCGAGGTA TTGGCGGTAT TTTCTTCGAC TATCAAGATG CTAGCGGTAA GCTTTACATT 
GGCACTCAAG CAGATAGTCC AGCCGCAATT TACAGCCAGA AAGTGGGAAA TGTGACGCGG 
AATTGGGAGG ATATTTTTGC GTTTGTCCAG TCTTGCGGTC AGGCTTTCTT ACCTGCTTAC 
TTGCCTATTG TAGAACGCAG GCAAGCAACT GAGTACGGCG ATCGCCAACG TAATTTCCAA 
CTATACCGCC GTGGTCGTTA TGTTGAATTT AATTTAGTTT ACGACCGGGG AACTGTGTTT 
GGCTTGCAAA CTAAGGGACG GACAGAATCG ATTCTCATGT CTTTACCACC CTTAGCACGT 
TGGGAATATT GCTACGAACC GAAAGCTGGA AGCCCAGAAG CGGAACTAAC AGAAGTTTTT 
CTCCAGCCTA GAGATTGGGC GTAG

Protein sequence

MGRHSDNSLQ ESPNHTELLI SPTNTIPKDS RQRSQQFMQN LQDEICTALE QIDGKASFHQ 
DYWERAEGGE GRTRVIREGR VFEQGGVNFS AVWGNSLPAS ILAQRPEAAG HEFFATGTSM 
VLHPRNPYVP TVHLNYRYFE AGPIWWFGGG ADLTPYYAFE EDAVHFHQTL KNACDVHNPE 
YYPAFKRWCD EYFYLRHRQE QRGIGGIFFD YQDASGKLYI GTQADSPAAI YSQKVGNVTR 
NWEDIFAFVQ SCGQAFLPAY LPIVERRQAT EYGDRQRNFQ LYRRGRYVEF NLVYDRGTVF 
GLQTKGRTES ILMSLPPLAR WEYCYEPKAG SPEAELTEVF LQPRDWA