Gene Ava_3572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3572
Symbol
ID	3679518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	4450065
End bp	4451234
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	37%
IMG OID	637718923
Product	glycosyl transferase, group 1
Protein accession	YP_324073
Protein GI	75909777
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.483254
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0128829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAATATA AAAAAGAAAA CTTCAATTTA CTACCTGCTT CTATTCTGAC CTTAGGTTCT 
GGTTGGTTTC CTACAAATCC TGGGGGTTTG GAAAGATATA TTTATGAGTT GACTTATCAA 
TTAGCAGCTA ATCAAGATAG AGTAGAGTTA TGTGGAGTTG GCTTACCAAC TAATGAATTT 
CATTTGCCAA TTAAATTAAC TAATTTAGCA TCTCCAGATA GTAAAATTTG GCAAAGATTT 
TGGTCTATTC GGACTAATTT CCAGAAAACA AGAATAAGCA AACCGGACGC AATCAATTTA 
CATTTTGCTT TATATAGTTT TCCTATTTTA GATATTTTGC CTCAGGGTGT ACCCATTACT 
TTTAATTTTC ATGGGCCTTG GGCATCAGAA AGTAAACAGG AATTAGTAAA GAATAAAATC 
AGTATTTTTT TAAAGCGTCG GCTGATAGAA CAAACCACAT ATAATCGTTG CGATCGCTTT 
ATTGTTCTGA GTAAAGCATT CGGCAATATA TTACACCAAC AATATCAAAT TCCTTGGCAA 
AAAATACATA TTATTCCTGG TGGTGTGAAC ATTGATAAAT TTCAGCCAAA TTTATCGCGT 
CAACAAGCTC GCCAGCAGCT AAATTGGCCT GAAAGTCGTC CTATTTTATT TACATCCAGA 
CGTTTAGTTC ACCGTGTGGG AGTAGACAAA CTATTACAAG CATTAGCCAT CATTAAACCA 
AGAGTACCCG ATATTTGGCT AGCGATCGCC GGTCGGGGAC ATCTGCAAGG GACATTGGCA 
AAACAAGCTC AAGAGTTGGG TTTAGAGAAC AACGTAAAGT TTTTAGGTTT TCTCCCAGAT 
GAGCAGTTAC CTATCGCTTA CCAAGCTGCT AATTTAACTG TTATGCCCAG TCAATCTTTT 
GAAGGTTTTG GGTTAGCAAT TACTGAATCT TTGGCTTGTG GTACTCCTGT TTTATGCACT 
CCTATTGGAG GTATGCCAGA AATTTTAACT CCATTTTCAC CAGAATTAAT TACTACATCT 
GCGGAAGCTA CTGCTATTGC GGAGAAAATA GTACATATAT TGCTAGAACA AATACCAACA 
CCTTCACGAG AAGAATGTCG CCAATATGCT GTAACTAACT TTGATTGGCA GAAAATTGCT 
CAACAAGTAC GGCGAGTTAT TTTAGCTTAA

Protein sequence

MEYKKENFNL LPASILTLGS GWFPTNPGGL ERYIYELTYQ LAANQDRVEL CGVGLPTNEF 
HLPIKLTNLA SPDSKIWQRF WSIRTNFQKT RISKPDAINL HFALYSFPIL DILPQGVPIT 
FNFHGPWASE SKQELVKNKI SIFLKRRLIE QTTYNRCDRF IVLSKAFGNI LHQQYQIPWQ 
KIHIIPGGVN IDKFQPNLSR QQARQQLNWP ESRPILFTSR RLVHRVGVDK LLQALAIIKP 
RVPDIWLAIA GRGHLQGTLA KQAQELGLEN NVKFLGFLPD EQLPIAYQAA NLTVMPSQSF 
EGFGLAITES LACGTPVLCT PIGGMPEILT PFSPELITTS AEATAIAEKI VHILLEQIPT 
PSREECRQYA VTNFDWQKIA QQVRRVILA