Gene Ava_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_2100
Symbol
ID	3680496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	2593832
End bp	2594977
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	43%
IMG OID	637717445
Product	glycosyl transferase, group 1
Protein accession	YP_322617
Protein GI	75908321
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00100338
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCCATTGA AATATGCTCT TGTTCATGAG TGGCTGACAC CAAAAGCCAC CGGCGGTTCA 
GAACTCGTTG TCAAAGAAAT TCTGCATCAT ATCGATGCCG ATTTATACGC TCTCATCGAC 
TTTGAGTCTA ACAATCCTGA AAGTTATTTG TACCAACGTC AGATTGGCAA GACCTTCCTC 
CAGCACTTTC CCTCGGCCCG TAATGGTATC CAAAAGTATC TACCATTTTT ACCCCTGGCA 
ATCGAACAAT TGGACTTGCG CCAGTATGAC GTAATCTTGT CCTCATCTCA TGCTGTTGCC 
AAAGGCGTAT TAACCACTGC TGACCAGTTA CATATTTGCT ATTGCCATAG TCCCATGCGC 
TACGCCTGGG ACTTAACCTT TGATTATTTG CGTTCCAGCC CAATGGGCAG TGGTGTTGCG 
GGATGGGTGA CTCGATACTT ATTACATCGT TTACGCCAAT GGGATGTGTT AAGCGCCAAT 
CGAGTAGATT ACTTCATTGC CAATTCCCAT TACACAGCTA GGCGTATATG GCGCTGCTAT 
CGGCGAGAAG CCAAAGTTAT TTATCCGCCG GTGAATGTCG CAGAATTTCC ATTTTTACCT 
CACAAAGAGG ATTTTTATCT CACAGTTTGC CGATTGGTGA GTTATAAACA GGTATCCCTA 
ATTGTGAAAG CGTTTAACCA ATTGCAACGG CCATTAGTCA TCATTGGTAC AGGTTCAGAA 
ATGAAACAGA TTCGCCAGCT AGCTAATTCT AATATCCAAA TATTAGGTTG GCAACCTGAT 
GATGTAGTCA AAAAGTATAT GGCCAAAGCC AAGGCTTTTG TCTATGCTGC CTGTGAAGAT 
TTTGGTATAG CTTTAGTAGA AGCACAAGCT TGTGGTACTC CGGTAATTGC CTATGGTATC 
GGAGGTGCCA CGGAAACAGT TAGGGATGTA CGATCTTATA AAGATACAGG AACAGGTATA 
TTTTTTAAAA TGCAAACTCA AGCAGCTTTG GTGGAGGCAG TAGAAAAATT TGAAATGTAT 
CAAGATGCTC TTGACCCTGA GTATATGCGA TCGCACGCTG CTGAGTTTTC CCCGCAAAAC 
TTTGCCAAGC GCTATCTAGA TTTTTTAGAC CAGTGCCATC AACAAAAGCC TAATTTAGCA 
GGTTAG

Protein sequence

MPLKYALVHE WLTPKATGGS ELVVKEILHH IDADLYALID FESNNPESYL YQRQIGKTFL 
QHFPSARNGI QKYLPFLPLA IEQLDLRQYD VILSSSHAVA KGVLTTADQL HICYCHSPMR 
YAWDLTFDYL RSSPMGSGVA GWVTRYLLHR LRQWDVLSAN RVDYFIANSH YTARRIWRCY 
RREAKVIYPP VNVAEFPFLP HKEDFYLTVC RLVSYKQVSL IVKAFNQLQR PLVIIGTGSE 
MKQIRQLANS NIQILGWQPD DVVKKYMAKA KAFVYAACED FGIALVEAQA CGTPVIAYGI 
GGATETVRDV RSYKDTGTGI FFKMQTQAAL VEAVEKFEMY QDALDPEYMR SHAAEFSPQN 
FAKRYLDFLD QCHQQKPNLA G