Gene Ava_3989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3989
Symbol
ID	3680460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	4961091
End bp	4962323
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	37%
IMG OID	637719341
Product	major facilitator transporter
Protein accession	YP_324489
Protein GI	75910193
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTCAA ACCACGTAAT TTATCAATTA TCCCCCGGTT TTATGACAGA ATTTACTTCA 
ACGAAATCAA ATTCCCCTTT TTCTACTGGA TTACCAGCTT TGTATAGCAT AGCTTTTTTG 
TCTGGTATTT CTATAGGGCT ATTTAATCCC TTTATCTCAA CATTAATGGC GCAACATCAA 
GTTGATGATT TATGGATAGG AGCAAATTCT ACGGTGTATT TTCTAGTCAT AGCGTTGGGA 
ACACCGTTAG TAGTAAAAGT ATTACCCAAG TTAGGGCTTC GTAAAACGAT GATGCTTGGC 
TTGACAATGA TGGGTATTAG CGCTCCTTTG TTTACCATGA CTACATCAAT GCCTTTGTGG 
TTCATTATAC GTGCTGTTAT GGGCATTGCT TGTTGTTTAT ATTTAGTCAG TGGAAACACT 
GCATTGAATC ATTTTTGTCA TGAAGGTAAT CGAGCGATAG TTAACGGTTT GAATGCTCTA 
GCTTTTACTT TTGGATTTGG TATTGGCCCT GTAATTGGTT CTGCTTTTTA TAATGTTTCA 
CCAAAACTTT CATTTTTGTT GGGTAGTGCT TTAATTTTTA GCGGTGTAAT TGTAGTTTGG 
ATAGCTTTAC CAGATAAGGC AGTTGTTTTT CAACAATCTT CACGTTCCAG AATTTTTAAC 
AAACTCAAAC TTCCCCTTCA GGGCGCATTT GCCTATGGTT TTGCCGAATC AACGCTAGTT 
TCTTTATATC CGGTTTATCT GCTACGACAA AATTACAATA TAGAGCAGAT CGGCTATACC 
TTCGCTGTAT TTGTAGTTGG CGGCTTGCTC TCTACTGTTC CCGTTACTCA CATAGCAGAC 
AAATTCGGCA GACTCAAAGT TCTGTTTATG AGTGTGTTTA TCGTCATATT GTCGTTTTTA 
TCTCTTTCAT TGATTCAAAA CTCTACGGCT ACCCAGATAT TTGCATTTAT TGCTGGAGCT 
AGTATTAGTC CAATTTTTCC CTTAGCAATG GCATTGATTG GTGCAAAACT CTCTAGAAAT 
GAACTATCTT CTGGCAGTGC TTTGTTCACG GCTATATATA GTTTCGGATG TACTGCTGGG 
CCGATCGCTT CATCTTTAGC TATCAAAGTT TTTGGGGATA GTTATATATT TAGTTTGACA 
ATAATTATCT TTGCCATATT TTTGGTTTAC CTGAGTATAC CAAATAAAAA TTTTCGTACC 
TATTTACTTA ATGTGGCACG GAAAATACAT TGA

Protein sequence

MHSNHVIYQL SPGFMTEFTS TKSNSPFSTG LPALYSIAFL SGISIGLFNP FISTLMAQHQ 
VDDLWIGANS TVYFLVIALG TPLVVKVLPK LGLRKTMMLG LTMMGISAPL FTMTTSMPLW 
FIIRAVMGIA CCLYLVSGNT ALNHFCHEGN RAIVNGLNAL AFTFGFGIGP VIGSAFYNVS 
PKLSFLLGSA LIFSGVIVVW IALPDKAVVF QQSSRSRIFN KLKLPLQGAF AYGFAESTLV 
SLYPVYLLRQ NYNIEQIGYT FAVFVVGGLL STVPVTHIAD KFGRLKVLFM SVFIVILSFL 
SLSLIQNSTA TQIFAFIAGA SISPIFPLAM ALIGAKLSRN ELSSGSALFT AIYSFGCTAG 
PIASSLAIKV FGDSYIFSLT IIIFAIFLVY LSIPNKNFRT YLLNVARKIH