Gene Avin_20360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_20360
Symbol
ID	7760963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	2026483
End bp	2027781
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	68%
IMG OID	643804932
Product	major facilitator superfamily (MFS) permease
Protein accession	YP_002799215
Protein GI	226944142
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00895] benzoate transport

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGCGA CAAGAACAAT GGATGTGCGT GAGCTGATCA ACGGCCGTCC CTTCGGCGGC 
TTCCAGAAAC TGGTGGTGTT CTTCTGCTTC GTCATCATCG CCCTGGACGG CTTCGACGTG 
GCGGTGATGG GGCTGATCGC GCCCCAGTTG CGCGAGGACT GGGGGGTGAC CCCGCAGGAG 
CTCGGGCCGG TGCTGAGCGC CGCGCTGGTC GGCCTGGCCA TCGGCGCGCT GGTCGCCGGT 
CCGCTGGCCG ACCGCTACGG GCGCAAGATA GTGCTGGTGT CGAGCGTGCT GTTCTTCGGC 
TTCTGGACGC TGGTCACGGC TTTCTCCGGC GATGTCGGCC AATTGGTGAT CTTCCGTTTT 
CTCACCGGTC TGGGCCTCGG TGCCGCCATG CCCAATGCCG CCACCCTGAC CGCGGAATTC 
GCCCCGGAGC GCAAGCGCGC CTTTCTGGTC ACCGTGGCTT TCTGCGGCTT TTCCTTCGGC 
GCGGCGGGCG GTGGTTTCCT GTCCGCCTGG ATGATTCCCA ACCTCGGCTG GCAGAGCGTG 
CTGGTCATGG GCGGGGTGTT GCCGCTTCTG GTGGTGCCGC TGATGCTGTG GAAGATGCCG 
GAATCGCTGA GCTTTCTGGT GAGCCGGCGG GCCCCGCGGG AGCGCATCCG GCGCATCGTC 
GAGCGGATCG CGCCGGGCGT CGCCGACGGC TGCGGGGAGT TCACGATGCC GAGCGCCCCG 
CAGCAGTTGG GGGGCGTGCG GCTGGTACTG TCCAGCCACT ACCGCTTCGG CACCCTGATG 
TTGTGGGTGG GCTATTTCAC CGTGCTGTTC CTCGTCTACC TGTTCAGCAG TTGGTTGCCG 
ACCCTGGTCA GGTCGGGCGG TTACAGCGTT ACCGACGCGG CCATCGTCAC CTCGATGTTC 
CAGGTCGGCG GGCCGATCGG CGCGCTCTGC GTCGGTTGGG CGATGGATCG TTTCCGGCCG 
CACGGGGTGC TGCTGCTGAC CATGCTGGTG GCCGCGCTGG CCATCGGTGC CATCGCCTGG 
GCGGTGGGCT TCTGCCTGAA CGGCGGCAGC GTCGGCATGA ATGCCATGGC TACCTGCTTC 
TATCCCACCG AGGCGCGCGC CACCGGTGCC TGCTGGATGA GCGGAGTCGG CCGCTTCGGC 
GCCATCCTCA GCGCCTTCGC CGGCGGCCAG ATGATCGCCA TGGGACTGCC GCTCGGCCAG 
ATGTTCGTCC TGCTGGCGGT GCCGGCCGTG GTCTTCGGGC TGGCCCTGGC CGCCAAGGGG 
CTGAGCCGGC GCGCCATGCC GCACCTGCGG ACCGCCTGA

Protein sequence

MNATRTMDVR ELINGRPFGG FQKLVVFFCF VIIALDGFDV AVMGLIAPQL REDWGVTPQE 
LGPVLSAALV GLAIGALVAG PLADRYGRKI VLVSSVLFFG FWTLVTAFSG DVGQLVIFRF 
LTGLGLGAAM PNAATLTAEF APERKRAFLV TVAFCGFSFG AAGGGFLSAW MIPNLGWQSV 
LVMGGVLPLL VVPLMLWKMP ESLSFLVSRR APRERIRRIV ERIAPGVADG CGEFTMPSAP 
QQLGGVRLVL SSHYRFGTLM LWVGYFTVLF LVYLFSSWLP TLVRSGGYSV TDAAIVTSMF 
QVGGPIGALC VGWAMDRFRP HGVLLLTMLV AALAIGAIAW AVGFCLNGGS VGMNAMATCF 
YPTEARATGA CWMSGVGRFG AILSAFAGGQ MIAMGLPLGQ MFVLLAVPAV VFGLALAAKG 
LSRRAMPHLR TA