Gene Aazo_2958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2958
Symbol
ID	9340762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3041032
End bp	3042360
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	40%
IMG OID
Product	pheophorbide a oxygenase
Protein accession	YP_003721890
Protein GI	298491713
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0467803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCTG AATTCAACTT TTTCCACCAC TGGTATCCTC TCTCACCAGT TGAGGACCTT 
GATTCACCGC GACCTGTTCC CGTAACTTTA TTAGGAATTC GATTAGTTAT ATGGAAGCCT 
AGAGATGCAG ACAATTACCG TGTATTTTTA GATCAGTGTC CTCACCGTCT TGCACCCTTG 
AGTGAAGGAA GAGTAGACGA TAAAACTGGG AATCTCATGT GTAGTTATCA CGGTTGGCAG 
TTTGATGGTC GGGGTATTTG TACTCACATT CCTCAAGCTG AGAATCCTCA ACTTGTAGCT 
AAAAATCAAC AAAATTTCTG TGTACTTTCC CTACCAGTGC GGCAAGAAAA TGATTTACTC 
TGGGTTTGGC CTGATGCTAA ATCAGCGGAA CTAGCTGCAA CTACACCCCT ACCTTTATCA 
CCACACATAG ATACTAACAA AGGTTTTGTC TGGTCTTCTT ATATTCGTGA CTTAGAATAT 
GATTGGCAAA CCTTAGTAGA AAATGTAGCA GATCCTAGTC ATGTTCCCTT TTCTCATCAT 
GGGGTACAGG GTAATCGTGA CAAAGCAACA TCCATTCCTC TTAATGTTGT CCAATCAACA 
ATCAATTTAA TTGAAGTTTC CATTTCCAAA GCCTTGCCCA CAACAATCAC TTTTCAACCA 
CCTTGTCTGT TAGAGTATGC AATTAGTATT GGTGACACTG ACAAGAAATT AGGATTGATA 
GTTTATTGTG TACCAGTTTC TCCTGGTAAA TCTAGAATTG TTGCTCAGTT TACTCGCAAC 
TTTGCCAAAA ACCTGCATTA TCTTATACCG CGTTGGTGGG AACACATCAA AATACGGAAT 
CTAGTTCTAG ACGGAGATAT GATGCTGCTA CATCAGCAAG AATATTTATT GCAACAAAGA 
CAAGAAAGCG AAAGTTGGAA AACTGCCTAT AAGTTGCCTA CAAGCGCAGA TCGTTTAGTA 
ATTGAGTTTC GGACTTGGTT TGATAAATAT TGTCATGGTC AACTACCTTG GAGTAAGGTG 
GGAATTAGTA ATCCAGAAAC TAAAATCAAT AACAACCGTG CTGTCATGTT GGATCGTTAC 
CACCAACATA CCCAACATTG TAGTAGTTGC CGGAAGGCGC TGAAAAATCT ACAAAGATTA 
CAAATCTTGC TTTTAACCTA TGTTGTAACT TCTGTTTGTG GAGTTGCAGT TCTTTCTGAT 
GCTTTACGTA TGCAGCTAGG TCTACCAGTG GTCATTACAG CACTTTTAGG ATTGGGAGTT 
TATTCTTGGT TGAAATTTTG GCTCATTCCT AAATTCTACT TTGTAGACTA TATCCATGCT 
GAGAAATGA

Protein sequence

MQAEFNFFHH WYPLSPVEDL DSPRPVPVTL LGIRLVIWKP RDADNYRVFL DQCPHRLAPL 
SEGRVDDKTG NLMCSYHGWQ FDGRGICTHI PQAENPQLVA KNQQNFCVLS LPVRQENDLL 
WVWPDAKSAE LAATTPLPLS PHIDTNKGFV WSSYIRDLEY DWQTLVENVA DPSHVPFSHH 
GVQGNRDKAT SIPLNVVQST INLIEVSISK ALPTTITFQP PCLLEYAISI GDTDKKLGLI 
VYCVPVSPGK SRIVAQFTRN FAKNLHYLIP RWWEHIKIRN LVLDGDMMLL HQQEYLLQQR 
QESESWKTAY KLPTSADRLV IEFRTWFDKY CHGQLPWSKV GISNPETKIN NNRAVMLDRY 
HQHTQHCSSC RKALKNLQRL QILLLTYVVT SVCGVAVLSD ALRMQLGLPV VITALLGLGV 
YSWLKFWLIP KFYFVDYIHA EK