Gene Avin_18040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_18040
Symbol
ID	7760739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	1794188
End bp	1795558
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	66%
IMG OID	643804703
Product	dicarboxylate or citrate transporter (MFS superfamily)
Protein accession	YP_002798992
Protein GI	226943919
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0280762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATCC CCAGCAGTCC CGACCTGTGC GCCACTGCGG ACCTTGCCGC CGACCGTTCC 
GACGCAACCC CGTCCGGAGC CGCCGAAAAG ACCGAATACA CGGCCGCCGA ACGCCGCCAG 
CGGATCTTCG CCATCGTCGG CGCCTCCTCC GGCAACCTGG TGGAATGGTT CGACTTCTAC 
GTCTACGCCT TCTGCGCCAT CTACTTCGCC CCGGCCTTCT TCCCCACGGC CGACCCCACC 
GTCCAGTTGC TCAACACCGC CGGGGTGTTC GCCGCCGGCT TCCTGATGCG CCCGATCGGC 
GGCTGGCTGT TCGGCCGGAT CGCCGACAAG CACGGCCGCA AGACCTCGAT GCTGATCTCG 
GTGCTGATGA TGTGCGCCGG CTCGCTGGTG ATCGCCTTCC TGCCGACCTA CGAGAGCATC 
GGCGTGGCCG CGCCGGCCCT GCTGCTGTTC TGCCGCCTGT TCCAGGGGCT TTCGGTCGGC 
GGCGAGTACG GTACCACCGC GACCTACATG AGCGAGGTGG CGCTCAAGGG CAAGCGCGGC 
TTCTACTCCT CGTTCCAGTA CGTCACCCTG ATCGGCGGCC AGTTGCTGGC GGTGCTGGTG 
GTAGTGATCC TGCAGCAACT GCTCAGCACC GATGAACTGA AGGCCTGGGG CTGGCGCATT 
CCGTTCGTGA TCGGCGCCAT CGCGGCGGTG ATCGCCCTGT TGCTGCGCCG TTCCCTGGAG 
GAAACCACCA CGGCGGAAAG CCGCGCCAGC AAGGAGGCGG GCAGCATGGC CGGCCTGTTC 
AAGCACCACA AGGCCGCCTT CATCACCGTG CTCGGCTACA CCGCTGGCGG CTCGCTGATG 
TTCTACACCT TCACCACCTA CATGCAGAAG TACCTGGTCA ACACGGCGGG CATGGACGCC 
AAGACCGCCA GCGGCATCAT GACCTTCGCG CTGTTCTGCT ACATGCTGAT GCAGCCGCTG 
TTCGGCGCCC TGTCCGACCG CATCGGCCGG CGTACCTCGA TGCTCTGCTT CGCCGCCCTG 
GGCGCGCTGT GCACCCTGCC GATCCTGGCG ACCCTGAAGG GCATCGGCAG TCCCGCCCTG 
GCCGGCGCGC TGATCATCCT GGGGATGGCC ATCGTCAGCT TCTACACCTC GATCGGCGGC 
ATCGTGAAGG CCGAGATGTT CCCGCCGGAG GTGCGCGCGC TGGGCGTCGG CCTGTCCTAC 
GCCATCGCCA ACGCCCTGTT CGGCGGCACC GCCGAATACG TGGCGCTCGG CCTGAAGTCG 
ATCGGCCATG AAGAGGTCTT CTACTGGTAC GTGACGGGCA TGCTGGTGAT CGCCTTCCTG 
TTCAGCCTGC GCCTGCCGAA GCAGGCCGCC TACCTGCACC ACGACCGCTG A

Protein sequence

MTIPSSPDLC ATADLAADRS DATPSGAAEK TEYTAAERRQ RIFAIVGASS GNLVEWFDFY 
VYAFCAIYFA PAFFPTADPT VQLLNTAGVF AAGFLMRPIG GWLFGRIADK HGRKTSMLIS 
VLMMCAGSLV IAFLPTYESI GVAAPALLLF CRLFQGLSVG GEYGTTATYM SEVALKGKRG 
FYSSFQYVTL IGGQLLAVLV VVILQQLLST DELKAWGWRI PFVIGAIAAV IALLLRRSLE 
ETTTAESRAS KEAGSMAGLF KHHKAAFITV LGYTAGGSLM FYTFTTYMQK YLVNTAGMDA 
KTASGIMTFA LFCYMLMQPL FGALSDRIGR RTSMLCFAAL GALCTLPILA TLKGIGSPAL 
AGALIILGMA IVSFYTSIGG IVKAEMFPPE VRALGVGLSY AIANALFGGT AEYVALGLKS 
IGHEEVFYWY VTGMLVIAFL FSLRLPKQAA YLHHDR