Gene Aazo_2541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2541
Symbol
ID	9340340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2645403
End bp	2646551
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	40%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003721560
Protein GI	298491383
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.433843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATAG CCTGGATTGG AAAAAAATCG CCATTTTGCG GCAATGTCAC CTACAGTCGA 
GAAATTACTA ATGCGTTGCT AGACCGGGGA CATCAAGTTA GCTTTCTTCA CTTTGCTCAA 
GAAGAATCCC AAGCAGATAA CTGGCCTAAT TTTCAGGAAG TTTCTTTACC CTTCATTTAC 
AAATCTCAGG TTTACACTAT TCCCACTTTT AAAGCGACTA AGGTTTTAAC TCAGTCACTA 
AGGGAAATCA AGCCAGATAT TGTTCATGCT TCCTTGACTC TATCGACTCT GGATTTTGTT 
TTACCAGAAA TTTGTGAAGA ATTAAATGTC CCTCTCATTG CCACTTTCCA CACTCCATTT 
GCTGGTAAAG GGGCAAAATT AATTTCTGGT ACCCAGCTTT TAGCTTATCA ACTATACGCA 
CCTTTTTTAG ATCACTATGA TCGGGTCATC GTTTTTTCCC AAATTCAAAG GGAATTATTG 
GCACGCATGG GAGTTAGGGA AGAAAAAATT GCTGTTATTC CTAACGGTGT TGATACTGCT 
AAGTATTCTC CTGGTAGTTC TCAAATAAAA GCCGAATTTG GTGCAGAGCG CTTATTTGTC 
TATCAAGGTC GCATAGCCCC AGAGAAAAAC GTTGAATCCA TGCTACGCGC TTGGAAGCAG 
TCAGATATGG CGACTGATAG TAAATTGTTA ATGGTTGGTG ATGGCCCGTT AAAATCTTCC 
TTAGAAACTT TTTATGGTGC AGAATACGGT ATCCACTGGT TAGGATTTAT AGCAGATGAA 
AACCGCCGCA TAGAAATATT ACGCGGTGCA GATGTATTTA TTTTACCTTC TTTGGTTGAA 
GGTCTATCTT TATCTCTTTT AGAAGGAATG TCCTGTGGTG TAGCTTGTTT AGCCACTGAT 
GTGGGTGCAG ATGGGGAAGT ATTGGAAAAA GGTGCAGGTG TAGTGATTAG TACCAGTTCT 
GTGCGATCAC AACTCAGAAC ACTTTTACCA CTATTCCAAG ATCATCCAGA GTTAACAACC 
CTGTTGGGGC AGAAAGCCAG AAAGCGAGTA TTAGAACGTT ATACCCTGAA TGATAATATC 
ACGCAATTAG AAGAACTTTA TAACCGAGTT CTTGCACAGC GACCTTTAAC ACTAAGTTGG 
GGTGTTTAA

Protein sequence

MRIAWIGKKS PFCGNVTYSR EITNALLDRG HQVSFLHFAQ EESQADNWPN FQEVSLPFIY 
KSQVYTIPTF KATKVLTQSL REIKPDIVHA SLTLSTLDFV LPEICEELNV PLIATFHTPF 
AGKGAKLISG TQLLAYQLYA PFLDHYDRVI VFSQIQRELL ARMGVREEKI AVIPNGVDTA 
KYSPGSSQIK AEFGAERLFV YQGRIAPEKN VESMLRAWKQ SDMATDSKLL MVGDGPLKSS 
LETFYGAEYG IHWLGFIADE NRRIEILRGA DVFILPSLVE GLSLSLLEGM SCGVACLATD 
VGADGEVLEK GAGVVISTSS VRSQLRTLLP LFQDHPELTT LLGQKARKRV LERYTLNDNI 
TQLEELYNRV LAQRPLTLSW GV