Gene Aazo_4269 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4269
Symbol
ID	9342073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4341107
End bp	4342312
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	42%
IMG OID
Product	oxygen-independent coproporphyrinogen III oxidase
Protein accession	YP_003722766
Protein GI	298492589
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.281837
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAAA AAGATATTGC TGTTCAAGTT CCTAGTGCGG CTTACGTACA TATCCCCTTT 
TGTCGGCGGC GGTGTTTTTA TTGTGACTTT CCGGTGTTTG TGGTGGGCGA TACCTACGGC 
GAGCCAAGCT ACCGCTCACA GGGTAAAACA TCTGGTACAA TTTCCCAATA TGTTGACGCA 
CTGTGTCACG AAATCAGCAT CTCACTAGCT TTTAGTCAAC CAGTAACAAC TATTTTCTTT 
GGTGGTGGTA CTCCTTCGCT GTTATCGACA GAACAGTTGC AATGTATATT AACAGCGTTA 
GAGAAGCGTT TTGGCATTGC GGCTGGCGTG GAAATTTCCA TGGAAATGGA CCCCGGTACT 
TATGATTTGG CACAGATTGC AGGTTATTGC AGTACAGGTG TCAACCGGGT AAGTTTGGGT 
GTACAAGCCT TTCAAGATGA ATTACTAACA GTTGCTGGGC GATCGCACTC AGTTAATGAT 
ATCTTTGCAG CTATTGATTT AATCAACCAA GTCGAGATAC CCCAATTTAG CTTAGACCTA 
ATTTCTGGGT TGCCACATCA GTCTTTAGTT CAGTGGGAAG ATTCCCTAAC TAAAGCGGTA 
GAAGTTGCCC CCACTCATAT ATCTATCTAT GATTTAACCA TTGAACCAGG GACAGCTTTT 
GGTCGTTATT ACAAACCGGG AGATAATCCC CTACCGACAG ATGAAACCAC TGTCACAATG 
TACCAACTAG GGCAAAAAGT CTTAACTGGC GCAGGTTATG AACATTATGA AATTTCCAAC 
TATGCTAAAA GCGGACATCA ATGTAAACAT AATCGAGTTT ATTGGGAAAA TCGCTCTTAT 
TATGGTTTTG GTATGGGTGC AGCCAGTTAT GTGCATGGTA AACGCTTCAC TCGTCCTCGG 
AAAACTAAAG AATATTACGA ATGGTTGCAA AATGGTGCAT TGATTGATTG TGAAGTCACA 
CCTTTAGAGG ATGAATTGTT AGAAACTTTA ATGCTGGGGT TGCGGTTAGC AGAAGGTTTG 
AGTTTGACGG TGTTGGTGGA GAAGTTTGGA AAAGAAAAGG TTGAGGAAAT TACACAATGT 
TTGCAACCTT ATTTTAAGCA GGGTTGGGTG GAAGTTGTGG AGGAAAGGTT GCGTTTAACT 
GATCCTGATG GGTTTTTGTT TTCTAATATG GTGTTGGCAC ATTTGTTTGA GAAGTTGGGG 
GAATAA

Protein sequence

MSQKDIAVQV PSAAYVHIPF CRRRCFYCDF PVFVVGDTYG EPSYRSQGKT SGTISQYVDA 
LCHEISISLA FSQPVTTIFF GGGTPSLLST EQLQCILTAL EKRFGIAAGV EISMEMDPGT 
YDLAQIAGYC STGVNRVSLG VQAFQDELLT VAGRSHSVND IFAAIDLINQ VEIPQFSLDL 
ISGLPHQSLV QWEDSLTKAV EVAPTHISIY DLTIEPGTAF GRYYKPGDNP LPTDETTVTM 
YQLGQKVLTG AGYEHYEISN YAKSGHQCKH NRVYWENRSY YGFGMGAASY VHGKRFTRPR 
KTKEYYEWLQ NGALIDCEVT PLEDELLETL MLGLRLAEGL SLTVLVEKFG KEKVEEITQC 
LQPYFKQGWV EVVEERLRLT DPDGFLFSNM VLAHLFEKLG E