Gene Aazo_3119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3119
Symbol
ID	9340922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3209323
End bp	3210525
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	39%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003721980
Protein GI	298491803
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATTT GCATTGTTAC CCATAAAATC CGAAAAGGTG ATGGTCAAGG ACGAGTCAAT 
TATGAAGTAG CTATGGAAGC ACTCCGTCGT GGTCATAATT TGACATTATT GTCGAGTGAA 
ATAGCACCTG AATTAGAACA TAATACTGCA GTAAATTGGG TTTCCATTTC TGTTGATGGA 
TATCCGAGTG AATTTGTTCG CAATTTTGTA TTTGCTAAAA AAAGCGGTGA TTGGTTACGT 
AAACATCGGG GCGAAGTTGA TTTAATTAAA GCCAATGGTG CGATTACCAT GGGCGCTACT 
GATGTCAATG CTGTGCATTT CGTCCATAGT TCTTGGTGGA AATCGCCTGT ACATATTGCT 
CGTCAACGAC GAGATTTATA TGGTTTATAT CAGTGGCTCT ACACTGCTAT TAATGCTTAT 
TGGGAAAAAG AAGCTTTTCG CCAAACTAAA GTTGTTATCG CTATATCTAC AAAAGTAGCT 
GAAGAATTAG TTAATATTGG CGTACCCCGT GCTAATATTC GTGTGATTGT GAATGGAGTT 
GATTTACAAG AATTTTCCCC TGGTGCGAGT TCTCGCCAAA AGTTGGGGAT ACGTGAAAAT 
GTGACGTTGG CATTGTTTGC TGGAGATATT CGCATTTCTC GCAAAAACTT AGATACTGTA 
CTTCATGCCT TAGTAAAAGT TCCTAGTTTA CATTTAGCAG TTGTTGGTGA AACCAAAGAT 
AGCCCCTATC CAGAAATGGT TGCGGACTTA AAATTAACTG AACGGGTACA TTTTTTAGGT 
TATCGCCGTG ATATGCCGCA AATTCAACAG GCATCAGATT TATTTGTTTT TCCTTCCCGT 
TATGAACCTT TTGGGTTAGT AGTAATTGAA GCGATGGCTT CAGGTTTACC TGTGATTACT 
GCTAAAACCA CTGGTGCAGC TGATTTAGTA ACACCAGCTT GTGGAATTGT TTTACCCGAT 
TGTGATGATA TTGATACTTT AGCCAATGCT TTGAAATTAT TAAGTAGCGA TCGCACACTA 
CGTCAACAAA TGGGTAAAGT CGCTCGTACT ATTGCTGAAC AACATAGCTG GGTAACTATG 
GCACAAACCT ATTTAGATTT ATTTGAAGAG TTAATGAAAC ATGAGGAATA CAGTTCTTAT 
CCCCACCTAT CGCCGTCCTC AAGACTTGTT ACACTGCCTT TCCGCACTGC AAGCCCAAAC 
TAA

Protein sequence

MRICIVTHKI RKGDGQGRVN YEVAMEALRR GHNLTLLSSE IAPELEHNTA VNWVSISVDG 
YPSEFVRNFV FAKKSGDWLR KHRGEVDLIK ANGAITMGAT DVNAVHFVHS SWWKSPVHIA 
RQRRDLYGLY QWLYTAINAY WEKEAFRQTK VVIAISTKVA EELVNIGVPR ANIRVIVNGV 
DLQEFSPGAS SRQKLGIREN VTLALFAGDI RISRKNLDTV LHALVKVPSL HLAVVGETKD 
SPYPEMVADL KLTERVHFLG YRRDMPQIQQ ASDLFVFPSR YEPFGLVVIE AMASGLPVIT 
AKTTGAADLV TPACGIVLPD CDDIDTLANA LKLLSSDRTL RQQMGKVART IAEQHSWVTM 
AQTYLDLFEE LMKHEEYSSY PHLSPSSRLV TLPFRTASPN