Gene Ava_3398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3398
Symbol
ID	3680059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	4226008
End bp	4227243
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	43%
IMG OID	637718748
Product	general substrate transporter
Protein accession	YP_323900
Protein GI	75909604
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0177815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAGCTT TTAATACATT TGACGCAAGC TTGCGGCTTA ACCTGCTGAT TCTATTTACG 
GCAGGTTTAT TGTTCTGGTC GAGTACTGCT ACTTTCTTGC CCACTCTGCC CTTATATATT 
GAGGATGTGG GAGGAAGCAA GCAAGAAATT GGCATTGTGA TGGGTGGTTT TGCTATTGGG 
TTGTTAGTAT TTCGCCCAAT GCTGGGACGA ATGGCGGATC AAAACGGTCG GAAGTTACTG 
TTATTAATTG GGACAATAGT GGCAACAATT GCCCCCTTTG GCTATTTGGC ATTTAAATCA 
ATTCCTTTAT TGATGCTGGT GCGCGTCTTT CATGGCATTA GCATTGCTGC TTTTACCACT 
GGTTACAGTG CTTTAATAGC AGATTTAGCC CCTATAGCCA TTCGTGGTGA AATCATCAGT 
TACATGAGTC TCACTGCTCC CATTGGCTTG GCAATTGGCC CGGCTTTAGG GGGTTATCTA 
CAAGCTTCAA TTGGTTATCC AATTTTATTT TTAATAGCAT CCGAATTGGC TTTTGTGGGG 
TTATTGGGAA CGATTCAAGT TTCTAATCCA CCTGTACCAC AAGGTCGCCA AGCAACAGAA 
AAGGATAGTA ATTTCTGGCA ACTTTTAAGT AGCCCACGGG TGAGAGTGCC AACTTTGGTG 
ATGTTGCTCA TTGGTATAGC TATCGGTGCT GTGCATATTT TTTTACCACT GTTTATTAAA 
TCAACAGGGG TGGAATTTAA CGCCGGACTA TTTTTTACGA TCGCGGCCAT TGGTAGTTTC 
AGTTTACGGG TATTTGCAGG GAAAGCTAGC GATCGCTTCG GTCGGGGTTT GTTTATTACT 
TTCGGTATCA TGGCTTATAT GTTGTCATCT TTCTTGTTAT GGCAAGCCAA CAGTGCCATT 
AGTTTCGCTA TTGCAGCGAT CGCTGAAGGT TGTGGCGGCG GAACAATGAT TTCGATGATT 
ACGACGATGA TGGCAGACCG CTCGCTACCA CAAGAGCGAG GACGAATTTT CTCTATTTGT 
ATCGCTGGAT TGGATTTAGG AATTGCGATC GCTGCCCCTA TTTTAGGTTT TATTGCTGAA 
GCGACTGGCT ATCGCAGTAT GTTTGCCTAT ACAACTGCTT TAACTTTCCT AGCCTTACTA 
ATTTTCCTGA CCAGATCGAG TAAAAATTTG AGCAATTCCC TGCGGTTTGC TCTGGGTCGC 
GGTCAAGATG TCTATTCTCT GCATAATAGT AACTAG

Protein sequence

MKAFNTFDAS LRLNLLILFT AGLLFWSSTA TFLPTLPLYI EDVGGSKQEI GIVMGGFAIG 
LLVFRPMLGR MADQNGRKLL LLIGTIVATI APFGYLAFKS IPLLMLVRVF HGISIAAFTT 
GYSALIADLA PIAIRGEIIS YMSLTAPIGL AIGPALGGYL QASIGYPILF LIASELAFVG 
LLGTIQVSNP PVPQGRQATE KDSNFWQLLS SPRVRVPTLV MLLIGIAIGA VHIFLPLFIK 
STGVEFNAGL FFTIAAIGSF SLRVFAGKAS DRFGRGLFIT FGIMAYMLSS FLLWQANSAI 
SFAIAAIAEG CGGGTMISMI TTMMADRSLP QERGRIFSIC IAGLDLGIAI AAPILGFIAE 
ATGYRSMFAY TTALTFLALL IFLTRSSKNL SNSLRFALGR GQDVYSLHNS N