Gene Aazo_4068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4068
Symbol
ID	9341873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4129464
End bp	4130969
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	33%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003722647
Protein GI	298492470
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.736051
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATTG GTAAACCTAA TTTAAAAATC ATTGTAGATG GAGTGTTTTT CCAACTTCAT 
ATTTTGGGGG TAGCTAGAGT ATGGATGGAA TTACTCAAGG CATGGATTAA AAGCGGATAT 
GCTGAAAACA TAATTGTTTT AGATCGTCAA GGAAGTGCAT TTAATTTTCC TCCAGATGCT 
GTTTTTCATC CATTAGGGAC AATGCCAAGA TTACCAGGAT TAAAGTATAG GTTAATTCCT 
GGTTATAGTT ATGAAAATGC TCAAACTGAT ATGCAAATGT TACAAGAAAT TTGTGATGAG 
GAAAATGCTG ATTTATTTGT TTCTACCTAC TATACAAGAC CTATTAATAC TCCCAGTGTT 
TTAATGCTTC ATGATATGAT TCCTGAAATT GAGGGTTTGG ATGAACCTCA ATGGAAGCAG 
AAACATGAAT GTATTAGATC TGCCTCTGCA TATATAGCAG TTTCTCAAAA TACAGCTAAA 
GATTTTTCCC ACTTCTTTCC AGAAATTGAT CATGTTTTAG TTAAGGTCAT TTATAATGGT 
GTAGATCATC AAGTATTTCG TCCAGCTAGT TTAACCGAAA TTAATCAATT TAAACAATCT 
TATGGTATTA CTAAACCCTA TTTTCTTTTA GTGGGAGTAA GAACTGGTTA TAAGAATGCT 
CTCTTATTTT TTAAGTCGTT TGCTCAGTTA CCAAATCAAG AAGATTTCTC TATTGTTTGT 
GTTGGTGGTG GTTGGGGAAT AGAAGAACAA TTTAAAGAAT ATATTACTCA AACACAAATT 
TTAAAATTGC AACTTACTGA TCAGGAATTA AGTATGGCTT ATTCAGGTGC GATCACACTT 
GTTTACCCGT CTTTGTATGA AGGATTCGGT CTAGCTGTGT TAGAAGCTAT AGCTTGTGGT 
TGTCCAGTAA TTACTTACCC CAGTTCTGCT ATTCCTGAGG TGCTTGGTAA AGCCGCGCTT 
TATATTGATG ATGATATTGA AATCATGAAA AGAGCTTTAA TAACTATTCA ACATGAACAA 
ATAAGACAAA CTCTCATTCA AGCAGGATTA GCACAAGCTG AGAAGTTTTC CTGGTCAAAA 
ATGGCTGAAG AAGTGAGTAA TGTTTTCATT GATGAAACTC TAAAGTTTTT AAACTTGCGA 
GAAATTAATC TAATCATATT CCCTGATTGG AGTCAATCAG AAGGTGATTT ATATATTCAA 
CTAGTTGAAG TAATTAAAAA ACGAGTGAGC GATATTAATT CTTATAAAAC TACTTTACTG 
ATATATGTTC TTGATGATAC TGAAGGGGAA ACTGCTGATT TACTGTTATC CAGTATAGCA 
GTTAATTTAA TGATGGAAGA TGAGATTGAT ATTACCGAAA ATCTGGAAAT TTCACTAATG 
CTAGACATCA ATGAAAAACA TTGGAAAAGT CTCTTACCAC ATTTGCATGG TAGAATTATA 
TTAGATGCGG AAAATCAAGA AGTTATAGTC AAATTTTCAG CAGAAAAACT ACTAGTTTGG 
AAATAG

Protein sequence

MTIGKPNLKI IVDGVFFQLH ILGVARVWME LLKAWIKSGY AENIIVLDRQ GSAFNFPPDA 
VFHPLGTMPR LPGLKYRLIP GYSYENAQTD MQMLQEICDE ENADLFVSTY YTRPINTPSV 
LMLHDMIPEI EGLDEPQWKQ KHECIRSASA YIAVSQNTAK DFSHFFPEID HVLVKVIYNG 
VDHQVFRPAS LTEINQFKQS YGITKPYFLL VGVRTGYKNA LLFFKSFAQL PNQEDFSIVC 
VGGGWGIEEQ FKEYITQTQI LKLQLTDQEL SMAYSGAITL VYPSLYEGFG LAVLEAIACG 
CPVITYPSSA IPEVLGKAAL YIDDDIEIMK RALITIQHEQ IRQTLIQAGL AQAEKFSWSK 
MAEEVSNVFI DETLKFLNLR EINLIIFPDW SQSEGDLYIQ LVEVIKKRVS DINSYKTTLL 
IYVLDDTEGE TADLLLSSIA VNLMMEDEID ITENLEISLM LDINEKHWKS LLPHLHGRII 
LDAENQEVIV KFSAEKLLVW K