Gene Avin_20840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_20840
Symbol
ID	7761009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	2077223
End bp	2078434
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	70%
IMG OID	643804979
Product	multidrug/chloramphenicol efflux transporter, major facilitator superfamily MFS_1
Protein accession	YP_002799260
Protein GI	226944187
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.290056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGC GCAACGTTGT CCATCGCGGT GTCTGGGCGC TGGCGGTCAC GGCGTTCGCC 
ATCGGCGTGG CCGAGTTCAT CGTGGTCGGC GTGCTGCCGG CCATCGCCGA GGACCTCGGC 
GTACCGCTGG CACGCGCCGG CGGACTGGTG GGGTTGTACG CGCTGGCATT GGCCATCGGT 
ACGCCGCTGG TGGTACTGGG ATTGGCCCGG CTGCCGCGCA AGCCTGTGCT GCTGACCTTG 
GTGGCTGTGT TTCTCGCCGG CAACCTGCTG TCGGCGCTCT CGACCAGCTA TGCGGTGCTG 
CTGGCCGGGC GCATCTTGAC GGCGGTGGCT CACGGCAGCT TCTTCGCCAT CGGCGCGACA 
CTGGCAGCCC GGCTGGCCCC CGAGGGGCAG GCCAGCCGGG CGATCGCATT GATGTTCGCG 
GGCCTCACGC TGGCGATGGT GATCGGCGTG CCGCTGGGTA GCCTGATCGG CAACGGCCTG 
GGCTGGCGGC TGCCATTCTT CGCCGTCGTG CTGCTGGCCG CGCTGGGCTG GCTGGCGACC 
GCACTGTGGG TGCCGGCCCT GCCGGCGCAG GCGGCGGGGC GCGCCGGTAG CCAACTGGCG 
GCGCTGGCGC GACCCGAGAT CCTGACGATG ATGAGCATCA CCATCCTCGG CTTCGGTGCC 
AGCTTCGCGG CCTTCACTTT CATCACGCCG ATCCTGACCG CCATCACCGG CTTCTCGGCC 
CGGATCTCCA GCCTGCTGCT GGTGGTGTTC GGCGCGGCGA CGCTGGTGGG CAATCTCATG 
GGCGGGCGCT GGGCCGCCAG CCTGGGCTGG CCGGTAGCGC TGCGGCGCAT GCTGGTGGGC 
CTGCTGGTCG TACTCGTGGC GATCGCATTG CTGATGCCCT ACCGGACACC GATGGTGGCG 
CTGCTGTTCG TCTGGGGCCT GCTGGCCTTC GGTATGTCGC CGGGCTTTCA GGCCGGCATG 
CTGGCTACCG CCGAACGCTG GACGCCGCGT GCGGTGGACT TCGCTTCGGC GTTGAACATC 
TCGGCATTCA ACCTGGGTAT CACGCTGGGG GAGACGTTGG GTAGCGTACT GGTGGTGCGA 
GACGACATGG CGCTGACGCC TTGGGCGGGT GTCGGGCTGG CGTTGATCGC GCAGTTGCCG 
CTGGCGTGGC TGGCACAGCG GTCGTCCGGC GCCGGAACGG TACCGGCCGC TGGTGGATGG 
GAGGGGCGAT GA

Protein sequence

MSQRNVVHRG VWALAVTAFA IGVAEFIVVG VLPAIAEDLG VPLARAGGLV GLYALALAIG 
TPLVVLGLAR LPRKPVLLTL VAVFLAGNLL SALSTSYAVL LAGRILTAVA HGSFFAIGAT 
LAARLAPEGQ ASRAIALMFA GLTLAMVIGV PLGSLIGNGL GWRLPFFAVV LLAALGWLAT 
ALWVPALPAQ AAGRAGSQLA ALARPEILTM MSITILGFGA SFAAFTFITP ILTAITGFSA 
RISSLLLVVF GAATLVGNLM GGRWAASLGW PVALRRMLVG LLVVLVAIAL LMPYRTPMVA 
LLFVWGLLAF GMSPGFQAGM LATAERWTPR AVDFASALNI SAFNLGITLG ETLGSVLVVR 
DDMALTPWAG VGLALIAQLP LAWLAQRSSG AGTVPAAGGW EGR