Gene Ava_4102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4102
Symbol
ID	3681567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5104259
End bp	5105575
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	45%
IMG OID	637719450
Product	major facilitator transporter
Protein accession	YP_324598
Protein GI	75910302
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.277859
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.56542
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAAC ATCCAAAAAA TACAGGAATG CAAACTTTTA CCATCATCTG GTTTGGACAG 
ATGATTTCCC TCATCGGCTC GCAGCTAACT AATTTTGCCT TGGGTGTATG GGTATACCAG 
CGAACTGGCT CAGTCACACA GTTCGCCTTG ATTTCCCTCT TTACCAGCTT GCCCATGATT 
CTGATTTCTC CCGTAGCTGG CACGCTGGTA GACCAATTCC CCCGTCGTTG GATGATGTTA 
TTTAGTGACT TAGGAGCAGG TATTTCTACG GGGGTAATTG CAATTTTGTT AGCTACAGGC 
GATTTGGCTA CTTGGCATAT ATACGTGGGT GCTGCTATTA GTTCCTGCTT TGGTGCTTTT 
CAATGGCCAG CTTATACAGC AGCTACTACC TTGCTTGTCC CACCAGAAAA ACTGGCACGA 
GCTAACGGTA TGTTGCAAGT GGGGGAAGCC GCAGGTCGGT TAGTTGCACC AATGTTAGGA 
GGTATACTGC TGCTGTTTCT GGAAATTGAT GGCATTATCT TTATTGACTT TGCGACATTT 
CTGTTTGCTT TGAGTACTCT GTTACTAGCT CCGTTTCCCA AGCAGTACAT TGATAGACAT 
CGCGCGGAAA AAACTCCTTG GTTGAAGGAA GCATCTTCCG GTTTGGTCTA TCTAGTTAAC 
AGAAGAGGAC TGTTTGCACT ACTACTGTTC TTTGCTGTGA ACAATTTCCT AGTGGGAATT 
GTGCAGATGC TAATTACGCC GCTAGTATTG TCCTTTGGTT CGGCTACAGA CTTGGGGACA 
ATTATGACTA CTGGCGGTAT CGGAATGCTA GTAAGCAGCA TCCTTGTCAG TACCGTGAGA 
ATGCCACAGT ATTTAGCTCT CAGTATCTTT ACTTTTATGC TGCTAGGTGG GATCTGTATT 
ACCTGTGCAG GGTTTTACCA ATCGATTTTA GCCTTAGCGC TGATAGCTTT CCTGTTTTTC 
TTTGGTCTAC CAATTATTAA CAGTTCAGCC CAAGTTATTT TTCAAAAGAA AGTACCATCT 
AGTCTGCAAG GTCGAGTTTT TGCGACAATA GGAGCGATCG CTAACGCATC ACAGCCTTTG 
GCTTACACTG TCGCTGGGCC ATTAGCGGAT AAAATCTTCG AGCCGTTAAT GGCTCAGAAT 
GGGCTGTTAG CAGAAAGTAT GGGAAAAATT ATTGGTGTTG GTCAAGGACG TGGTATCGGT 
CTGATGTTTA TCGTGATGGG AATACTCACC GTATTGGCGA CGATTATCGC CTATCAGTAT 
AAACCATTGA GACTTGTGGA AAGGCAACTG CCCGATGCCA TGAATCCCAG TTGCTAG

Protein sequence

MTQHPKNTGM QTFTIIWFGQ MISLIGSQLT NFALGVWVYQ RTGSVTQFAL ISLFTSLPMI 
LISPVAGTLV DQFPRRWMML FSDLGAGIST GVIAILLATG DLATWHIYVG AAISSCFGAF 
QWPAYTAATT LLVPPEKLAR ANGMLQVGEA AGRLVAPMLG GILLLFLEID GIIFIDFATF 
LFALSTLLLA PFPKQYIDRH RAEKTPWLKE ASSGLVYLVN RRGLFALLLF FAVNNFLVGI 
VQMLITPLVL SFGSATDLGT IMTTGGIGML VSSILVSTVR MPQYLALSIF TFMLLGGICI 
TCAGFYQSIL ALALIAFLFF FGLPIINSSA QVIFQKKVPS SLQGRVFATI GAIANASQPL 
AYTVAGPLAD KIFEPLMAQN GLLAESMGKI IGVGQGRGIG LMFIVMGILT VLATIIAYQY 
KPLRLVERQL PDAMNPSC