Gene Avin_16310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_16310
Symbol
ID	7760566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	1613701
End bp	1614909
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	70%
IMG OID	643804531
Product	major facilitator superfamily transporter
Protein accession	YP_002798821
Protein GI	226943748
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTCGA CGATGTGGCG CACCAGTGGC TGGGTCCTGC TGGGTGCCTC GCTGATCCTG 
GCCCTGTCGC TGGGCGTGCG CCATGGCTTC GGCCTATTCC TGGCGCCGAT GAGCGGCGAG 
TTCGGCTGGG GGCGGGAGGT GTTCGCCTTC GCCATCGCCC TGCAGAACCT GATCTGGGGA 
CTGACGCAGC CCTTCACCGG GGCGCTGGCC GACCGCTACG GCGCGGCGCG GGCGGTGGTC 
GTCGGCGGGC TGCTCTATGC GCTGGGGCTG GTGCTGATGG CGCTGGCCGA TTCGCTCTGG 
ACGCTATCGC TGAGCGCGGG ACTGCTGATC GGCGTCGGCC TGTCCGGCAC CTCCTTCTCG 
GTGATCCTCG GCGTGGTCGG GCGTGCCGCG CCGGCGGAGA AACGCAGCAT GGCGATGGGC 
ATCGCCGCGG CCGCCGGTTC CTTCGGCCAG TTCGCCATGC TGCCCGGCAC CCTCGGCCTG 
ATCGGCTGGC TCGGCTGGTC GTCGGCGCTG CTGGCGCTGG GGCTGCTGGT CGCCCTGATC 
GTGCCGCTGG TGGGATTGCT GAAGGATCGC CCGCAGCCGC CGCAGGCTCA CGAGCAAAGC 
CTGGGCGAGG CATTGCGCGA GGCGGCCGGT CACGGCGGAT TCTGGCTGCT GGCGCTGGGT 
TTCTTCGTCT GTGGCTTCCA GGTGGTGTTC ATCGGTGTGC ACCTGCCGGC CTATCTGGTG 
GACCGGCACC TGCCGGCCCA GGTCGGCACC ACGGTGCTGG CGCTGGTGGG GCTGTTCAAC 
GTGTTCGGCA CCTATCTCGC CGGTTGGCTC GGCGGGCGCC ATGCCAAGCC GCCGCTGCTG 
AGCGTGCTCT ATCTGCTGCG CGCCGTGGTG ATCGTCGCCT TCGTCTACCT GCCGCTCAGC 
GAGTGGAGCG CCTATGCCTT CGGCATGGCC ATGGGCCTGT TGTGGCTGTC CACGGTGCCC 
TTGACCAACG GCACCGTGGC GACCCTGTTC GGCGTGCGCA ACCTGTCGAT GCTCGGCGGC 
ATCGTGTTCC TCTTCCATCA GCTCGGCGCC TTTCTCGGCG GCTGGCTGGG CGGCTGGCTC 
TACGACCGTA CGGGCAGCTA CGAGCTGGTC TGGCAGATCT CCATCGCCCT CAGCCTGGTG 
GCCGCGCTGC TCAACTGGCC GGTGCGCGAA CAGCCGGTGG CGCGCCTGCG CGCGGCCGAG 
GCGGGATGA

Protein sequence

MTSTMWRTSG WVLLGASLIL ALSLGVRHGF GLFLAPMSGE FGWGREVFAF AIALQNLIWG 
LTQPFTGALA DRYGAARAVV VGGLLYALGL VLMALADSLW TLSLSAGLLI GVGLSGTSFS 
VILGVVGRAA PAEKRSMAMG IAAAAGSFGQ FAMLPGTLGL IGWLGWSSAL LALGLLVALI 
VPLVGLLKDR PQPPQAHEQS LGEALREAAG HGGFWLLALG FFVCGFQVVF IGVHLPAYLV 
DRHLPAQVGT TVLALVGLFN VFGTYLAGWL GGRHAKPPLL SVLYLLRAVV IVAFVYLPLS 
EWSAYAFGMA MGLLWLSTVP LTNGTVATLF GVRNLSMLGG IVFLFHQLGA FLGGWLGGWL 
YDRTGSYELV WQISIALSLV AALLNWPVRE QPVARLRAAE AG