Gene Ava_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1041
Symbol
ID	3678593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	1265694
End bp	1266956
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	35%
IMG OID	637716377
Product	glycosyl transferase, group 1
Protein accession	YP_321560
Protein GI	75907264
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000238759
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0144782
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGATTT TACATCTTAG CACTTACGAT AATCGCGGTG GAGCAGCAAT AGCTACCTAT 
CGATTACACG ATGGGCTACA AAATATTGGC ATAACTTCCC AGATGCTTGT ACAAATTAAA 
TTTAGTGACG ATAAATCTGT TATTGCAACA GGCAACAAAA TAGTTCATAA ATATCCCAAA 
CTTAAACCCC ATTTAGATTC GTTACCGAAA CTATTTTTTA GACATATCGA TAAGAGTCGA 
AGAACTTCAT ACTCTTTGCA ATGGCTTCCA GATTCTATAG CGACTAGCAT TATAAAAATA 
GATACTGATA TCATTCATCT TCATTGGATA TCAGGAGGAC TTATAAATAT AGAAACAATA 
GCTAAATTAA ATAAACCGCT TGTTTGGACT CTACATGATA TGTGGGCTTT TACTGGTGGA 
TGTCATTATA ATCAAGAGTG TCAGCTTTAC AAAGAAAACT GTGGCAACTG CCCACAAATG 
CCAAAAAGAT TCAATATAGA TTTATCTAGT TGGGTATGGG AACGCAAAGC TAAGGCTTGG 
GCTGATTTAA ACTGTACAGT TGTAACTCCA AGTCATTGGT TAGCTAAATG CGCTGCATCC 
AGTTCTCTAT TTAAAGATTG CAATATCAAA GTAATACCCT ATGGTTTAGA TACAGAAGTT 
TACAAGCCTT ATCAAAAAAA CTTGGTAAGA GATAAATTCA ATCTACCTCA AGACAAACTC 
TTAATCCTCT TTGGTGCTGA AAATGCTGCT AGTAATACAC GTAAAGGGTT TCACTTTTTA 
AGATGTGCAC TAGAAATATT AAAACATACT TACTGGCATG ATAAGTGTGA GCTTGTTATA 
TTCGGTGCAA GTAAGTCAGA TTCTATAAGT AACTTGGGTT TTAATACTCA CTATCTTGGC 
CGCTTAAATA ATGAATCTAC AGTAGCGCAA GTTTATTCAG CAGCAGATGT TTTTGTTGCT 
CCTTCGATAC AAGATAACTT GCCTAATACG GTTATGGAGT CACTTGCTTG TGGTACGCCC 
TGTGTTGCTT TTGATATTGG GGGAATGCCT GACATGATTA ATCATAAACA GAACGGCTAT 
TTAAGCCAGC CTTACAATAT TGATGACTTG GCAAATGGAA TTATTTGGGT AATAGAAGAT 
AAAGAGCGAC ATCAAAAGCT TTGTGCTAGT TCTTGTGCAA CAGTCAAGGA AAAATTTACA 
CTAGAATTAC AAGCGAAAAA TTACTTGTCT TTATATCAAA ATATATTAAA AATAAATAAT 
TAA

Protein sequence

MKILHLSTYD NRGGAAIATY RLHDGLQNIG ITSQMLVQIK FSDDKSVIAT GNKIVHKYPK 
LKPHLDSLPK LFFRHIDKSR RTSYSLQWLP DSIATSIIKI DTDIIHLHWI SGGLINIETI 
AKLNKPLVWT LHDMWAFTGG CHYNQECQLY KENCGNCPQM PKRFNIDLSS WVWERKAKAW 
ADLNCTVVTP SHWLAKCAAS SSLFKDCNIK VIPYGLDTEV YKPYQKNLVR DKFNLPQDKL 
LILFGAENAA SNTRKGFHFL RCALEILKHT YWHDKCELVI FGASKSDSIS NLGFNTHYLG 
RLNNESTVAQ VYSAADVFVA PSIQDNLPNT VMESLACGTP CVAFDIGGMP DMINHKQNGY 
LSQPYNIDDL ANGIIWVIED KERHQKLCAS SCATVKEKFT LELQAKNYLS LYQNILKINN