Gene Aazo_1310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1310
Symbol
ID	9339105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1386803
End bp	1388083
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	45%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003720706
Protein GI	298490529
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCCAGA CTACACAAAA TCGGGTTGCG CTTATTTCCG TTGATGGTGA TCCATCTGCA 
AAAATTGGTC AAGAGGAAGC TGGGGGTCAG AATGTTTATG TGCATCAAGT AGGTATGGCT 
TTGGCTGAAC AGGGTTGGCA AATGGATATG TTCACTCGTC GCAGTTGTCC GAGACAGACA 
ACAATAGTAC CCCATCATCC CAACTGTCGC ACCATTCGGT TAAACACTGG GCCTGCAGAG 
TTTATTGGGC GAGATCATTT GTTTGACTAT CTACCAGAAT TTCTAGCGGA ATTTCAAAAA 
TTCCAACAGC AGCAAGGATT ATATTATCCC ATAGTGCATA CCAACTACTG GTTATCTGCT 
TGGGTGGGTA TGGAACTGAA AAAACGTCAA CCACTGATTC AAGTGCATAC TTACCACTCT 
CTAGGGGCAG TTAAATACAG AAGTGTGGGT CATATTCCCG TGATTGCTAT CCAAAGGTTA 
GCAGTGGAAC AAGCTTGTTT GGAAACAGTA GACTGTGTGG TTGCTACCAG TCCCCAGGAA 
CAGAAGCATC TGCGAATACT AGTTTCTTAC AACGGACGGA CAGAAATGAT TCCCTGTGGT 
ACTGATCTTC AGAAATTTGG TGGACTTCCC AGGTTAGAGG CTAGGGAAAA GCTAGGAATT 
ACCCCTGATG CCAAAATGGT TTTTTATGTT GGGCGTTTTG ATCAGCGTAA AGGAATTGAC 
ACTCTGGTAA AAGCCGTTGC CCAGTCCACG TTTAGAGATG AGGGAAAGGT GAAACTGGTA 
ATTGGTGGTG GTAGTTGTCC TGGTTACATT GATGGAATGG AACGCGATCG TATTACCACC 
ATTGTTGCAG AACTAGGACT GGAAGATATA ACCATCTTTC CCGGTCGCCT AGATCATAGC 
GTCCTCCCTT ACTATTACAG TGCTGCTGAT GTCTGCGTTG TTCCTAGTCA CTACGAACCC 
TTTGGTTTAG TGGCTATTGA AGCAATGGCT AGTCAGACTC CCGTTGTTGC TAGTGATGTC 
CGTGGGTTGC AATTTACAAT TGTACCAGAG GTTACAGGTT TACTCGCCCC TCCCAAAAAC 
GACGTAGCTT TTGCAGCAGC TATTGACCGC ATACTTGCTA ATCCATCTTG GCGTGACGAG 
TTAGGTGTAG CTGGACGCGA ACGGGTAGAA ATTGCTTTTA GCTGGAATAG TGTGGGTTCT 
CGACTATCTC AGCTTTATCT GCGGCTGATG ATGCAAGCAG CAGAACAATA TCAAAACCAA 
ACTCAGATTC TTGCGGCTTA A

Protein sequence

MFQTTQNRVA LISVDGDPSA KIGQEEAGGQ NVYVHQVGMA LAEQGWQMDM FTRRSCPRQT 
TIVPHHPNCR TIRLNTGPAE FIGRDHLFDY LPEFLAEFQK FQQQQGLYYP IVHTNYWLSA 
WVGMELKKRQ PLIQVHTYHS LGAVKYRSVG HIPVIAIQRL AVEQACLETV DCVVATSPQE 
QKHLRILVSY NGRTEMIPCG TDLQKFGGLP RLEAREKLGI TPDAKMVFYV GRFDQRKGID 
TLVKAVAQST FRDEGKVKLV IGGGSCPGYI DGMERDRITT IVAELGLEDI TIFPGRLDHS 
VLPYYYSAAD VCVVPSHYEP FGLVAIEAMA SQTPVVASDV RGLQFTIVPE VTGLLAPPKN 
DVAFAAAIDR ILANPSWRDE LGVAGRERVE IAFSWNSVGS RLSQLYLRLM MQAAEQYQNQ 
TQILAA