Gene Ava_4847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4847
Symbol
ID	3679345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	6102994
End bp	6104079
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	44%
IMG OID	637720204
Product	glycoside hydrolase family protein
Protein accession	YP_325339
Protein GI	75911043
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.139059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0302245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCAT TGCAGAGACT AGAACGCTTT GGAAATCACT TAATTCTGGG TATTTCTGGT 
ACTAGTTTGA GTGATGAAGA TAAACGCGCT CTGGGTGAAT TGAAACCAAT AGGGGTAATA 
TTTTTTGCTA AAAACTTTGT AGATGGTGTA CCTTACGAGG TTTGGCTGGA GACTTTTCAG 
GAGTTACATA GCCAAATACA AGAATATGCA GAACGCGATT CGATGTTTTT TACCTTAGAC 
CATGAGGGAG GACGCGTTGT GAGGACACCT TTACCGATTA CCAGATTTCC TCAGGCGTTG 
TTGTTGCGAT CGCACGCCCG TGAAGTAGCA AAAGCCACGG CAATTGAATT AAAATCTTTA 
GGCATCAACT TATCTTGGTC ACCTGTAGCT GATATTTATT CCCATCCGCA AAATCCGATT 
ATCGGTTCTC GCGCCTTTGG AAATACTCCT GAAACTGCGG CTACTGGTGC GCGGGAATAT 
TATTTGGGAC TGACAGAAGC CGGAATTGTG GGATGCGCCA AACATTTCCC CGGACATGGT 
GATACTAGCA AAGACTCCCA TGTGGAATTA CCAATCCTCA ACCTGACTCC AGAGGAATTA 
CGAAGGCGAG AACTTATCCC CTTCAAAGCT TTGATTGAAG AAGGGATTCC CCTCATCATG 
ACCGCCCATA TTTTATTTCC CAAAATCGAC CCAGATTTAC CAGCTACCCT ATCCCGCCCC 
ATCCTCAAAA CTATACTGCG GGAAGAACTT GGTTTTCAGG GTGTCGTTGT GTCTGACGAC 
TTAGATATGA AAGCAGTTTC CGATATGTTT ATGGAACGTG GTACGGTCGC GCGGGCTTTT 
AATGCTGGCT GTGATTTATT TATTGTTTCT CGCAATATCC ACGCGTCTTC TATCGAGCGT 
ACCTATAAAA TTGCCGAAAA TTTTGCTGAT GCTTTAACTG ATGGTAGTCT GGCTGAGTCA 
GTAGTAGATT CCGCTAAGGA GAGAATCGAA AGACTATTGG CGGTAACTCC AGAATATTCT 
GTACAGATGT TAGATAAAGA TACTTTAGTA CATCATGGCG AATTGGCGAT CGCTTGTTGT 
TTTTAA

Protein sequence

MPALQRLERF GNHLILGISG TSLSDEDKRA LGELKPIGVI FFAKNFVDGV PYEVWLETFQ 
ELHSQIQEYA ERDSMFFTLD HEGGRVVRTP LPITRFPQAL LLRSHAREVA KATAIELKSL 
GINLSWSPVA DIYSHPQNPI IGSRAFGNTP ETAATGAREY YLGLTEAGIV GCAKHFPGHG 
DTSKDSHVEL PILNLTPEEL RRRELIPFKA LIEEGIPLIM TAHILFPKID PDLPATLSRP 
ILKTILREEL GFQGVVVSDD LDMKAVSDMF MERGTVARAF NAGCDLFIVS RNIHASSIER 
TYKIAENFAD ALTDGSLAES VVDSAKERIE RLLAVTPEYS VQMLDKDTLV HHGELAIACC 
F