Gene Aazo_3301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3301
Symbol
ID	9341105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3380967
End bp	3382376
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	44%
IMG OID
Product	family 2 glycosyl transferase
Protein accession	YP_003722101
Protein GI	298491924
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.144563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGCGA ATTCCTGGCC GGAAAACGAC TCTGATAACG GAACCTCTGC TCCTCTTAAC 
TCCCTAGTGT CTGACCTATC AGCACAACAA GAGTTAGTGG AAGACGCGAA TGCTATGTCT 
GTACTTTCAC ACCGATTTAA ACGACGTACA CCCAAAGCCG CCCTGGTCTT GACTATTGTC 
TGGAGTGGGA CGATCGCTTT GCATTTAGTT TCCTGGGGTT ATATTTTCAT TCTCGGACTG 
ACAACTATCC TTGGTATTCA CGCCTTGGGT ATTATTTTTG CTAGACCCCG CCACCATCAC 
AAAGAAATAC ACGGAGATTT GCCTTCTGTA TCTTTGTTGG TGGCTGCAAA AAATGAAGAA 
GCAGTTATTA CTAGATTAGT CAAGAGTCTT TGTAGTCTGG AATATGCCAA TGGGGAATAT 
GAAGTCTGGA TTATTGACGA TAATAGTACG GACAATACGC CGCATTTATT GGCAGAACTG 
AAGCAGGAAT ACAAGCACCT CAAGGTGTTC AGACGTTCTG CTGAGGATAG TGGTGGTAAG 
TCAGGAGCTT TAAATCAAGT CCTACCAATG ACAAAGGGGG ATATTATTGT GGTATTTGAT 
GCTGATGCCC AAGTTAACCC AGATTTACTA TTACAGGTAG TGCCTTTGTT CCAAAAAGAA 
CAGGTGGGGG CGGTGCAGGT GCGAAAAGCG ATCACCAACG CTAAGGAGAA TTTTTGGACT 
AAGGGACAAA TGGCAGAAAT GGCTGTTGAT ACTTGGTTTC AACAACAACG GACTACTATT 
GGTGGTCTTG GTGAACTGCG GGGTAATGGT CAATTTGTCC GTCGTCAAGC TTTGGATGGC 
TGTGGTGGCT GGAATGAGGA AACCATCACC GATGATTTGG ATTTGACAAT TCGCCTGAAT 
CTGGATAAAT GGGATATTGA ATGTATGTTC TATCCCCCAG TGCAAGAAGA AGGAGTCACA 
AATGTGATCG CTCTTTGGCA TCAACGTAAC CGTTGGGCTG AAGGTGGTTA TCAGCGTTAT 
TTAGATTACT GGGATCTGAT CCTTCAAAAC CGGATGGGGA CGCGGAAAAC CTGGGATTTG 
CTGATTTTCC TCCTGATTAT GTATATCCTA CCCACAGCAG CAATACCAGA TTTATTAATG 
TCTCTAATTC GCCATCGTCC ACCAGTATTA ACCTCTGTAA CTGGTCTGTC AGTTACGATG 
TCTTTTGTGG GGATGTTTGC TGGTTTAAGG CGGACACGCC AAGATCAGAA AACATCTAAC 
TATTTTGTGT TACTTCTACA AACCATTCGC GGTAGTATTT ATATGTTGCA TTGGTTGGTA 
GTTATGAGTA GCACTACCGC CCGGATGTCA GTACGTCCCA AACGTCTAAA ATGGGTGAAA 
ACCGTGCATA CAGGTGTTGA GAAAGATTGA

Protein sequence

MPANSWPEND SDNGTSAPLN SLVSDLSAQQ ELVEDANAMS VLSHRFKRRT PKAALVLTIV 
WSGTIALHLV SWGYIFILGL TTILGIHALG IIFARPRHHH KEIHGDLPSV SLLVAAKNEE 
AVITRLVKSL CSLEYANGEY EVWIIDDNST DNTPHLLAEL KQEYKHLKVF RRSAEDSGGK 
SGALNQVLPM TKGDIIVVFD ADAQVNPDLL LQVVPLFQKE QVGAVQVRKA ITNAKENFWT 
KGQMAEMAVD TWFQQQRTTI GGLGELRGNG QFVRRQALDG CGGWNEETIT DDLDLTIRLN 
LDKWDIECMF YPPVQEEGVT NVIALWHQRN RWAEGGYQRY LDYWDLILQN RMGTRKTWDL 
LIFLLIMYIL PTAAIPDLLM SLIRHRPPVL TSVTGLSVTM SFVGMFAGLR RTRQDQKTSN 
YFVLLLQTIR GSIYMLHWLV VMSSTTARMS VRPKRLKWVK TVHTGVEKD