Gene Ava_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1038
Symbol
ID	3678706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	1262463
End bp	1263530
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	35%
IMG OID	637716374
Product	glycosyl transferase family protein
Protein accession	YP_321557
Protein GI	75907261
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.378242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.03094
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATTG CAAATATAGA ATATCCAAGC TTAAGTTTAG CAATTCCAGC TTATAACGAA 
GCTGGGAATA TAGAACATTT GATTAGGGGA TTTTTGACAA CTGAATATCC AAACTTAATA 
GAAGTAATTG TGGCTGATGG TGGTAGCACT GATGGGACAC AGGATATTGT CAAAAAATTG 
TCATTAGAAG ATTCTAGAGT CAAGCTGTTA TACAATTCGT TGAAAATTCA ATCGGCTGGT 
CTAAATCTTA TATTGCAAGA ATGCACTGGT GATATATTTC TTAGGGCTGA TGCTCACTCT 
GATTATGCAC CAGATTATAT AGAAAGATGT GTGGAAGCAT TATTAGAATC TCAAGCCTTT 
AACGTGGGGG GCGCACAAAG ATTTGTGGCT AAAACTCCCT TTCAGGCTGG GGTAGCACTG 
GCTTCTAAAA GCTTTTTAGG TAGTGGTGGA GCTAAATATA GAAACCCTAA CTATAATGGA 
TATGCTGATA CAGTTTATTT AGGATGTTTT TGGACGAAAG AATTGCGTGG CGCTTCTGGT 
TTTGATATTT CACAAATTAC TAACCAAGAT GCTGAATTAA ATCAAAAATT ACTGAATAAA 
AACCCAAAAG CTATATATAT AAGTTCAGAT ATTTGTGTAT GGTACTATCC CAGAAAAACC 
TGGAAATCTA TTTGTATTCA ATACTTCAAA TACGGAAGAG GACGTTACTT AACTAGTATT 
AAACACACAA AGCAACTGCA ACTGAGAGGA AGGCTACCAT TTTTATTTAT ATCAGCTACA 
TTGTTTTTAT CGCTAATTGA TTTCATCATT CCTCAGTTAT CTCTACATAC AGAAGTATTA 
ATTCTGAGTT GCTTACTTTT TCCATTTGGG GAAAGTTTAC GCACAATTTT CAAATTCCGT 
AACGAATTTA CTAAAGAACT CTGGCGCGGT AGCGAAGATG AAATTCCTTC CTGTATAAGT 
CTGTGGTTTT TCTGTGGAGT TACATTACTA ACTATGCCAA TTGCTCACTT TTCTGGCTAT 
GGATATCAGC TATTTAGGCG TAGATTTCTA AAAGTTACAG GTTGGTAA

Protein sequence

MSIANIEYPS LSLAIPAYNE AGNIEHLIRG FLTTEYPNLI EVIVADGGST DGTQDIVKKL 
SLEDSRVKLL YNSLKIQSAG LNLILQECTG DIFLRADAHS DYAPDYIERC VEALLESQAF 
NVGGAQRFVA KTPFQAGVAL ASKSFLGSGG AKYRNPNYNG YADTVYLGCF WTKELRGASG 
FDISQITNQD AELNQKLLNK NPKAIYISSD ICVWYYPRKT WKSICIQYFK YGRGRYLTSI 
KHTKQLQLRG RLPFLFISAT LFLSLIDFII PQLSLHTEVL ILSCLLFPFG ESLRTIFKFR 
NEFTKELWRG SEDEIPSCIS LWFFCGVTLL TMPIAHFSGY GYQLFRRRFL KVTGW