Gene Aazo_5204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5204
Symbol
ID	9343011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5328898
End bp	5329992
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	39%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003723364
Protein GI	298493187
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGAG TAAATAATTC CTTCTCTAAT CAATTAATAA TAAATTTATC TATTATCTTC 
TCTCAACCAA CCGGCATCAG CAACTATGCT CTAAATTTAT TTCCCTATTT ACAATCTCTC 
CAACCTACCC TATTAACAGC GCAAAAATAT TCTGAATTCA ACTGCTACCC AGTCCCAAAT 
GATCTTACTC CTGCTGACGG TATTAAAGGA CATTTACGCC GGCTAATGTG GACACAATTT 
CAACTGCCAA AGATATATAA AAACTTTAAA TCTCAACTTT TATTTTCCCC CATACCAGAA 
GCACCTCTTT ACAGTAACTG TCGTTTTATC ATCATGTCTC ATGACATGAT ACCATTACAC 
TTTCCCAAAC CATTTTCACC GCTAACACCA TACCACCGTT ACTATACTCC CCAAGTGTTT 
AAGGAAGCAC AACATATTAT TTGTAACTCA GAAGCAACCG CTAAAGACAT CACCGAATTT 
TACCAAATAC CCACCAGTAA AATCACACCT ATTCTCCTAG CACACAATCG CACTCACTTC 
CGTTGTCTGA ACCTACCCAC CAGTAATTAC TTCCTATACA TCGGTCGTCA AGACCCTTAC 
AAAAACTTGC AGCGACTCAT CAGTTCCTTT GCTGCGCTAC CTAATAAGGG AGATTATGAA 
CTATGGTTAG CAGGTCCCAC TGATAAACGT TACACCCCAT TATTGCAAGC GCAAGTTGAA 
GAACTGGGTA TCACTCATCG TGTCAAATTC CTCAACTACG TACCTTACAG TGAACTACCA 
ACAATCATAA ATCAAGCAGT TGCTCTCGTT TTTCCGAGTT TGTGGGAAGG GTTTGGTTTT 
CCTGTCCTGG AAGCAATGGC TTGTGGAACT CCCGTTATTA CCTCTAATCT TTCTTCACTT 
CCCGAAGTAG CTGGTGATGC TGCTATTCTC ATTAATCCTC ATAACACAGG GGAAATCACA 
GAAGCAATGC AAGCAATTAT CAATGATTCA GGAATGAGAA AACAACTTTG TCAAAAAGGC 
ATAGAGAGAG CAAATTTGTT TAGCTGGGAA AAAACCGGAC TTGCTACAGC AGAAGTTTTA 
AAACAATATT TCTGA

Protein sequence

MNRVNNSFSN QLIINLSIIF SQPTGISNYA LNLFPYLQSL QPTLLTAQKY SEFNCYPVPN 
DLTPADGIKG HLRRLMWTQF QLPKIYKNFK SQLLFSPIPE APLYSNCRFI IMSHDMIPLH 
FPKPFSPLTP YHRYYTPQVF KEAQHIICNS EATAKDITEF YQIPTSKITP ILLAHNRTHF 
RCLNLPTSNY FLYIGRQDPY KNLQRLISSF AALPNKGDYE LWLAGPTDKR YTPLLQAQVE 
ELGITHRVKF LNYVPYSELP TIINQAVALV FPSLWEGFGF PVLEAMACGT PVITSNLSSL 
PEVAGDAAIL INPHNTGEIT EAMQAIINDS GMRKQLCQKG IERANLFSWE KTGLATAEVL 
KQYF