Gene Aazo_3845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3845
Symbol
ID	9341648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	3896723
End bp	3897958
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	37%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003722483
Protein GI	298492306
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000452091
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACATA TTTCACAAAT AGGGACACAT ATTAGGGAGA AAACTGCTTA TCCAGATATC 
CTTGTTATCT CCCGCATATT TCAGCCACAA GAAGCTGTCA TTGGAGAATA TATATATAAT 
CGCTGTTTAC AAGACCCAGA AAGAGTAATC GTCCTAACCG CTAGTTGTTT AGGAGATAGA 
ATATTTGATA AATCTCAAAA TTTTCCTGTT TATCGTTGGC CTAACTTTAC TTTCTGGACT 
AGTACATTAT TGACTAAATT AGTGAAGCCC ATATTCAATA TTATTGGCTC CGTATTACTA 
GCCATAAAGC TTTATTTCCG TTATCATTAC CGCTACATTG AATGGTGTCA CGGTTACGAT 
TTCCCCGCCT TACTTATACT AAGTTATATC TTACCTATTC GCTTTTTTAT CTACCTCCAC 
GGTAATGATT TAGTTAGTAA TTTACGTAAT CCATTGTGGC GATCACTATT TAAACTTACC 
CTCAAAAGAG CCGAAGGAAT TGTTTGCAAC AGTTCCTATA TTCGAGATAT TTTAAGAAAA 
AACTTTCGGC TAGATACTCC TACTCATGTA ATTAACCCAG TAGTAAGACC AGAAAAATTT 
GGTACTCCTA CCAGTCCCAG TCATCTCGAT GATTTACGTA TCCGGTTACG TCAAGCTTAT 
AATATTCCTG AAACAGCTAT TCTGATTCTT TCTGTTGGTA GATTAGTTCA ACACAAAAGC 
TTTGACCGCA TCATAGATAA CATTCCTTTA CTATTAACTA TAGGCATAGA TGTCCATTAC 
ATAATTTGTG GCACCGGACC TTGTGAACAA CAGCTAAAAT CCCAAGCCCA ACGCTTGCGG 
GTAGACAAAC GAGTACACTT TGCAGGCCAT GTACCAGAAC GAGAATTAGC TAGTTATTAT 
GTAGCCTGTG ACATTTTCTC CATGCTAACT TTGTGGGAAG ACAAAGATAA AAGTATAGAT 
AACTTTGGCA TGGTTTACTT AGAGGCAGAA TACTTTGGTA AGCCCATAAT TGCCTCTCGT 
TTAGGGAGTA TTTTAGATGC AGTTCACCAT GAAGAAAATG GCCTGTTGGT AAATCCCAAT 
TCTGGCTATG CAGTTTTGCA AGCTTTTAAA CGCTTATGTC AAGACAAACA ACTACGAGAA 
AAACTCGGTC GTCAAGGACA AGAATTTGCC AAACGGAAAA CATATCACCG TTGGCTATAT 
AATCCAGAGT CTCGTTATTC TTGTTTATTG AATTAG

Protein sequence

MEHISQIGTH IREKTAYPDI LVISRIFQPQ EAVIGEYIYN RCLQDPERVI VLTASCLGDR 
IFDKSQNFPV YRWPNFTFWT STLLTKLVKP IFNIIGSVLL AIKLYFRYHY RYIEWCHGYD 
FPALLILSYI LPIRFFIYLH GNDLVSNLRN PLWRSLFKLT LKRAEGIVCN SSYIRDILRK 
NFRLDTPTHV INPVVRPEKF GTPTSPSHLD DLRIRLRQAY NIPETAILIL SVGRLVQHKS 
FDRIIDNIPL LLTIGIDVHY IICGTGPCEQ QLKSQAQRLR VDKRVHFAGH VPERELASYY 
VACDIFSMLT LWEDKDKSID NFGMVYLEAE YFGKPIIASR LGSILDAVHH EENGLLVNPN 
SGYAVLQAFK RLCQDKQLRE KLGRQGQEFA KRKTYHRWLY NPESRYSCLL N