Gene Aazo_4919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4919
Symbol
ID	9342726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5034939
End bp	5036099
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	38%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003723178
Protein GI	298493001
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.568144
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAATCT TATTTGTTAG CAGCAGTTCT GGGTCACGAG GTGGAGGTGA ACTCTATTTA 
ATTTATCTGG GGCAAGAACT AGCAAATCGG GGCTATGCTG TGGGATTGTG GTGTTCTCAA 
CATCCGATCA TGAATGAATT AGCAAGTTCA TTTGGTAGGT TTGGAGAAGT ATTGCGCTCG 
CCATACCAAA ACACATACAG TCTTAAATTA AGATCCTTTA CCCATATATT CCCCCAAATA 
AATCAAAAGA TTATTTCTCA GTGGCAAGCA TTTAAACCTG ATATTCTTCA TTTCAACAAG 
CAGAATTTAG AAGATGGTTT AGATTTACTA TCCTGGAGTC ATTATTTATC AATTCCGTAT 
TTGGTAACCA TTCATATTAC CCAAACGCAG GACAGCTTAG GGGCATTCTT GGGAAAGTGG 
CGGGATTTAA TAGCCAAAAT CTCATTGAGA AAATATAGAG GTTCACTAGT AGCAATTTCC 
GAACATCGAG GTAAAGAATT AACATCTTTC CTTGCTACCT CATCTGCAAG TTCAGAAAAA 
ATAGTCGTTA TCCAGAATGG AGTTCCAATA CCAGAGGAAA CAGAACATTT AGTCAAACGA 
CAAGCATCTC GTTTACAACT AAAACTTCAT CCAGAAGAAT TATTAATATT AGCAGTGGGA 
AGAATGGAAG CACAAAAACA ACCACTGCTA TTTTTACAAT GGGCTAGTCA CCTCAAAAGC 
AATCTACCAT CTGCTCGTTT CTTATGGGTG GGAGATGGTC GCTTAACTTC TTTATGGGAT 
CAATGGGTGA TAGAAAATCA TGCCCAAGAC TATATCCAAC GCCTAAGCTG GCAAAATGAC 
GTAACACCAT ATTTAGCAGC CGCAGACGGA TTTTTTCATC CTGCGGCCTT TGAAGGTTTA 
CCATTTGCAC TATTAGAAGC AATGGCTTGG TCTTTACCCT GTGTAATTAC CTCAACTCTG 
GCGGATGAGT TAAAGTTTCC TCAAGGTGTT TATTTCGTAG CTTCTGAACA AGACCAATTT 
AAAGATCTAA AGAATTTTAT TAATTCTCAG GAGCGTAATG CAGTAGCAAA TGTTGGCTAT 
CAAATAATCA AAGAGCAATT TTCCCTGGAA AAAATGGTAG ATACCTACGT ATCCTTATAT 
ATAGCAATTC TAAATTATTA A

Protein sequence

MRILFVSSSS GSRGGGELYL IYLGQELANR GYAVGLWCSQ HPIMNELASS FGRFGEVLRS 
PYQNTYSLKL RSFTHIFPQI NQKIISQWQA FKPDILHFNK QNLEDGLDLL SWSHYLSIPY 
LVTIHITQTQ DSLGAFLGKW RDLIAKISLR KYRGSLVAIS EHRGKELTSF LATSSASSEK 
IVVIQNGVPI PEETEHLVKR QASRLQLKLH PEELLILAVG RMEAQKQPLL FLQWASHLKS 
NLPSARFLWV GDGRLTSLWD QWVIENHAQD YIQRLSWQND VTPYLAAADG FFHPAAFEGL 
PFALLEAMAW SLPCVITSTL ADELKFPQGV YFVASEQDQF KDLKNFINSQ ERNAVANVGY 
QIIKEQFSLE KMVDTYVSLY IAILNY