Gene Ava_1683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1683
Symbol
ID	3682239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	2111262
End bp	2112638
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	47%
IMG OID	637717022
Product	OpcA
Protein accession	YP_322200
Protein GI	75907904
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3429] Glucose-6-P dehydrogenase subunit
TIGRFAM ID	[TIGR00534] opcA protein

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCCC AAGCTCCTAC CATTTTCTCA CTCCAAGCCC CGAAGGACAT TTCGCTGAAC 
GAAATCGAAG CGGAACTTAA TCAAATTTGG CAAAGCTACG GCATCACCGG CGAAGATGGC 
GCATTACCTG CGGCTACTCG TGCTACTACA TTTACTCTAG TAGTATATGA ACCAGAAGAA 
ACCCAATATC TGTTGGCTTC TTTAGGATTC TACAACGGGC CAATTGATGG CATCTTAGGC 
CCACAGACAG AAACCGCACT ACGACAAGTA CAAATCAAGT ACGCACTCCC AGAAACCGGC 
ACAGCTACAC CGGAAACTCT GGCTAAACTG CGAGAAGAAT TTGTCAAACG CCAAGGCAAT 
TCTGCTAATG GTGAGACTAA TGGCAGTACT TCCTATAGTT ACAGCAGCAC CAGCCCCAGA 
ATTGCTGATG AAATCGCCCT CCGTAATCCT TGCCGGATTA TTGCCCTGTT TCCCATTGTT 
GGCGAAGATG AAGGGGTAAA GGCTCAAGTT TCTGCCTACT GCCCAATTCA AAAACAATCT 
TCCAGTACAC TCATCTGCTG TGAGTACATT ACTCTCAGTG GTACACCAGC AGCATTGGAA 
AGAATTGGCG GGATGATTCC CGCATTGTTG ATTGGTGGGT TGCCAAAATT CCTCTGGTGG 
AAGGCTACAC CAGACCCCAA CAACATTTTA TTTAAACGCT TGGCCGCAGT TTGCAACAAT 
GTGATTGTTG ATTCTTGCAA CTTCAACGAG CCAGAAAGCG ATTTACTCAG CCTGCAAAAG 
TTAGTAGAAA CAGGCGTACC TCTAGCTGAT TTAAACTGGC GTAGGCTGGC TGCATGGCAA 
GAGTTGACAG CTGAAGCTTA CGATTCTCCC GACCGTCGCG CCGCTTTGGG AGACATTGAC 
CGGGTGACAA TTGATTACGA AAAAGGTAAC CCAGCCCAAG CATTGTTATT TTTGGGATGG 
TTAGCGAGTC GTTTGGAATG GCAACCCATT TCCTATCAAA AGGATAGCGG AGACTATGAT 
ATTACTCGCA TTCACTTTGT TAACCAAGAC CAAAAGCGAG TAGAAGCTGA ATTGGCAGGG 
GTTCCAGTTG CGGATGTGGG TGATATTGTG GGCGATTTAA TTGCCTTGCG CCTCAGTTCA 
ACCAATCCCC AAGCCAATTG CGGTACAGTC ATCTGCTCAG AAACTGGCGG TTGTATGCGG 
ATGGAAACCC ACGGTGGCGC TCAAGCCGCA GGTCTATTTC AACAAGTGAG TTCCTTATCG 
GAACAAAAGG CAGAAGCTTT ACTCAGTCAA CAGGTACAAC GCTGGGGACG TGAGTCACTG 
TTTGAAGAAA GTTTGGCTTT AATTGGGCAA GTATTTCAGT TAGGCATTAA GAATTAA

Protein sequence

MTSQAPTIFS LQAPKDISLN EIEAELNQIW QSYGITGEDG ALPAATRATT FTLVVYEPEE 
TQYLLASLGF YNGPIDGILG PQTETALRQV QIKYALPETG TATPETLAKL REEFVKRQGN 
SANGETNGST SYSYSSTSPR IADEIALRNP CRIIALFPIV GEDEGVKAQV SAYCPIQKQS 
SSTLICCEYI TLSGTPAALE RIGGMIPALL IGGLPKFLWW KATPDPNNIL FKRLAAVCNN 
VIVDSCNFNE PESDLLSLQK LVETGVPLAD LNWRRLAAWQ ELTAEAYDSP DRRAALGDID 
RVTIDYEKGN PAQALLFLGW LASRLEWQPI SYQKDSGDYD ITRIHFVNQD QKRVEAELAG 
VPVADVGDIV GDLIALRLSS TNPQANCGTV ICSETGGCMR METHGGAQAA GLFQQVSSLS 
EQKAEALLSQ QVQRWGRESL FEESLALIGQ VFQLGIKN