Gene Ava_0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0022
Symbol
ID	3678867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	19248
End bp	20486
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	43%
IMG OID	637715349
Product	glycosyl transferase family protein
Protein accession	YP_320543
Protein GI	75906247
COG category	[M] Cell wall/membrane/envelope biogenesis [S] Function unknown
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis [COG2246] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.882894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATCA ATAAAACTCA GTCATTGTTG CCAGTACCCG CAGGTAATTT ACAAGTTCCT 
GAGTTTCCAC CTAGTGATTC GGGTGTGACT GGTCAACCCA TCCAATTTTC TCTCATCATT 
CCTACTTATA AAGAGAGCGG GAACATTAGG AATGTTGTGG AGAGATTAAG TCAGATACTG 
GATGAGTTTA TACCAGGAGA TTATGAACTG ATTGTAGTAG ATGATGATAG CCCAGATGGC 
ACTTGGGAAG TAGCCCTATC TTTGATGGCA GAATATCCAC AGTTACGAGT AATGCGACGG 
CAGGAAGAAA GAGGACTATC TACAGCTGTA ATTCGTGGAT GGCAGGTAGC TAGAGGTAGT 
ATTTTGGGAG TAATCGATGG AGATTTACAG CATCCCCCCC ATGTATTGCT GGAACTTTTG 
CGGAAAATCC ATAAGGGTGC AGATTTAGCT GTAGCCAGTC GTCACGTAGA TGGGGGTGGT 
GTAAGTAGCT GGAGTTTTAT CAGACGCTTT TTGTCTCGTG GGGCGCAATT ATTAGGACTA 
GTGATTCTAC CTAGTGTATT GGGTAGGGTT TCCGACCCCA TGAGTGGTTA TTTTATGGTG 
CGGCGTAACT GTATTACTAA TGCCACCTTC AATCCGGTAG GATACAAAAT TTTATTAGAA 
GTGATTGGGC GGGGTCAAGT AGACGAAATT GCCGAAGTGG GTTATGTATT TTGTGAACGC 
CAAGAAGGTG AGAGCAAAGT TACTTGGAAG CAGTATGTAG ATTACATCCA CCATTTAATT 
CGCTTGCGAC TTTCCACCGG CAGGCTGCAA AGAATTCATC AAAGCTTTCC CTTTGATAAA 
TTCATCCGTT TTGGTTTGGT AGGGTTGAGT GGTGTGTTTG TGGATATGGT GATACTGTAC 
CTATTAAGTG ACCCATCAAC ACTAGCCTGG CCACTGACCC GCAGTAAAAT TATTGCCTCA 
GAAATAGCAA TTTTCAACAA TTTTCTCTGG AATGATGCCT GGACTTTTGC AGATGTATCC 
ATGCAGCAAC AGCATTGGCA TCAACGGTTG AAGCGATTTT TAAAATTTAA TATTGTTTGT 
CTGGCCGGGG TAGTGCTGAA TGTACTGATA TTGAATATTA TCTTTAATTA TCTCATTCCT 
AACCGCTATA TTGCCAACCT GATTGCGATC GCCATAGCCA CTGTTTGGAA CTTTTGGGTA 
AACTTGCGAC TCAGTTGGCG CGTGACTCAA GTCAAATAA

Protein sequence

MSINKTQSLL PVPAGNLQVP EFPPSDSGVT GQPIQFSLII PTYKESGNIR NVVERLSQIL 
DEFIPGDYEL IVVDDDSPDG TWEVALSLMA EYPQLRVMRR QEERGLSTAV IRGWQVARGS 
ILGVIDGDLQ HPPHVLLELL RKIHKGADLA VASRHVDGGG VSSWSFIRRF LSRGAQLLGL 
VILPSVLGRV SDPMSGYFMV RRNCITNATF NPVGYKILLE VIGRGQVDEI AEVGYVFCER 
QEGESKVTWK QYVDYIHHLI RLRLSTGRLQ RIHQSFPFDK FIRFGLVGLS GVFVDMVILY 
LLSDPSTLAW PLTRSKIIAS EIAIFNNFLW NDAWTFADVS MQQQHWHQRL KRFLKFNIVC 
LAGVVLNVLI LNIIFNYLIP NRYIANLIAI AIATVWNFWV NLRLSWRVTQ VK